Цитата(Dr_Arut @ 4.06.2016 - 09:29)

Здравствуйте. Суть исследования - создание копий оригинала и оценка различий с оригиналом. Изготавливаю 2-3 копии для каждого метода изготовления. Оригинал измеряю 5 раз, считаю среднюю, копии также измеряю 5 раз и считаю среднюю (из-за погрешности измерения - мкм и т.д.). Для оценки достоверности применяю t-тест Стьюдента. Беру 5 измерений оригинала и среднюю для каждой копии, например 10, 10.01, 10.02, 10.0 ,10.01 и 9.94, 9.88, 9.91
t-тест вроде считает достоверность между средними, в моём случае только один оригинал и несколько (2-3) копий полученных для каждого метода. Использую для подсчёта excel.
Собственно вопрос - правильно использовать т-тест? Если нет то какой метод правильнее использовать?
Если правильно использовать т-тест, то в случае подсчёта какие параметры нужно вбивать в формулу? У меня следующее =СТЬЮДЕНТ.ТЕСТ(F30:F34;F17:F19;2;3), где F30:F34 - 10, 10.01, 10.02, 10.0 ,10.01, F17:F19 9.94, 9.88, 9.91, цифра 2 - хвосты распределения, 3 - тип.
Если у вас 2 выборки - t-критерий корректен (при выполнении упоминавшихся выше участниками прочих условий). Если больше 2 групп - некорректен. Точка. Т.е. в вашем случае анализ проведён некорректно, статистическим выводам веры нет.
Грамотный анализ ваших данных можно провести двумя техниками: 1) общими линейными моделями, включая сложные варианты дисперсионного анализа; 2) моделями смешанных эффектов (mixed effect models). Знаю как сделать первым способом. Алгоритм примерно такой.
1) Забыть про статистический анализ встроенными средствами Еxcel:
для выводов это и неточно, и непрофессионально (
для освоения статистики практика работы с формулами Еxcel очень полезна). Нужно установить и освоить что-либо из доступного специализированного софта. Я спокойно отношусь к пиратству, потому что убеждён, что оно делает хорошую рекламу и когда складываются условия люди покупают именно знакомое по пиратским версиям. Кроме пиратских коммерческих пакетов есть и такие бесплатные, до которых коммерческим далеко. Поэтому выбрать можно.
2) Провести дисперсионный анализ с факторами "Метод" и "Копия внутри Метода". Пусть "Метод 0" будет оригинал с одной Копией. Для остальных методов копий будет несколько. Внутри Копий будут повторные измерения, но их не нужно специально кодировать, программы поймут, что это 5-кратные измерения одной копии. По результатам такого анализа в ходе множественных апостериорных сравнений можно ответить почти на все интересующие вопросы: отличаются ли копии от оригинала, какие - больше, а какие меньше, и т.д.
Выявится лидер по критерию близости к Оригиналу.
3) Я бы провёл ещё один анализ - иерархический дисперсионный анализ. Из данных исключить Оригинал. Получится строгая иерархия: Измерения внутри Копий, Копии внутри Методов. По результатам такого анализа рассчитать компоненты дисперсии. Последние укажут на то, сколько изменчивости признака в % приходится на различия между методами, сколько % - на различия копий внутри методов, а сколько % - на ошибку измерения. С дисперсиями можно поработать и тоньше - отдельно по методам: станет понятно какой метод позволяет производить более стабильные в плане изготовления копии.
Выявится лидер по критерию технологической воспроизводимости необходимых параметров Оригинала.
Хорошо будет если лидеры пунктов 2 и 3 совпадут. Если же не совпадут - станет понятно в какую сторону и какой Метод совершенствовать. Т.е. или работать над более точной подгонкой к Оригиналу наиболее технологически стабильного метода, или повышать точность воспроизведения для более близкого к Оригиналу Метода.