Какой метод подсчёта достоверности правильнее выбрать? |
Здравствуйте, гость ( Вход | Регистрация )
Какой метод подсчёта достоверности правильнее выбрать? |
4.06.2016 - 07:29
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 4.06.2016 Пользователь №: 28331 |
Здравствуйте. Суть исследования - создание копий оригинала и оценка различий с оригиналом. Изготавливаю 2-3 копии для каждого метода изготовления. Оригинал измеряю 5 раз, считаю среднюю, копии также измеряю 5 раз и считаю среднюю (из-за погрешности измерения - мкм и т.д.). Для оценки достоверности применяю t-тест Стьюдента. Беру 5 измерений оригинала и среднюю для каждой копии, например 10, 10.01, 10.02, 10.0 ,10.01 и 9.94, 9.88, 9.91
t-тест вроде считает достоверность между средними, в моём случае только один оригинал и несколько (2-3) копий полученных для каждого метода. Использую для подсчёта excel. Собственно вопрос - правильно использовать т-тест? Если нет то какой метод правильнее использовать? Если правильно использовать т-тест, то в случае подсчёта какие параметры нужно вбивать в формулу? У меня следующее =СТЬЮДЕНТ.ТЕСТ(F30:F34;F17:F19;2;3), где F30:F34 - 10, 10.01, 10.02, 10.0 ,10.01, F17:F19 9.94, 9.88, 9.91, цифра 2 - хвосты распределения, 3 - тип. |
|
4.06.2016 - 10:59
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Здравствуйте. Суть исследования - создание копий оригинала и оценка различий с оригиналом. Изготавливаю 2-3 копии для каждого метода изготовления. Оригинал измеряю 5 раз, считаю среднюю, копии также измеряю 5 раз и считаю среднюю (из-за погрешности измерения - мкм и т.д.). Для оценки достоверности применяю t-тест Стьюдента. Беру 5 измерений оригинала и среднюю для каждой копии, например 10, 10.01, 10.02, 10.0 ,10.01 и 9.94, 9.88, 9.91 t-тест вроде считает достоверность между средними, в моём случае только один оригинал и несколько (2-3) копий полученных для каждого метода. Использую для подсчёта excel. Собственно вопрос - правильно использовать т-тест? Если нет то какой метод правильнее использовать? Если правильно использовать т-тест, то в случае подсчёта какие параметры нужно вбивать в формулу? У меня следующее =СТЬЮДЕНТ.ТЕСТ(F30:F34;F17:F19;2;3), где F30:F34 - 10, 10.01, 10.02, 10.0 ,10.01, F17:F19 9.94, 9.88, 9.91, цифра 2 - хвосты распределения, 3 - тип. Судя по формулировке задачи это обычный "контроль качества", там масса готовых ритуалов измерений и целей для которых это всё делается сформулировано. Если это не так, то скажите просто что Вы там "копируете" и в чем состоит "измерение"? |
|
4.06.2016 - 22:54
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Открываем любой учебник по применению статистики и читаем:
1. t-критерий Стьюдента используется для определения статистической значимости различий средних величин. 2. Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства (гомоскедастичности) дисперсий. Из первого пункта следует, что по t-критерию Стьюдента корректно сравнивать Ваш оригинал (среднее по оригиналу) и ОДНУ копию (среднюю по копии) . Да и то, при условии, что выполняется п.2 указанный выше. А вообще-то для ответа на вопрос "Какой метод подсчёта достоверности правильнее выбрать?" неплохо бы ответить сперва на вопрос - достоверность ЧЕГО вы собираетесь считать? |
|
5.06.2016 - 14:42
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 4.06.2016 Пользователь №: 28331 |
Судя по формулировке задачи это обычный "контроль качества", там масса готовых ритуалов измерений и целей для которых это всё делается сформулировано. Если это не так, то скажите просто что Вы там "копируете" и в чем состоит "измерение"? Дело в том, что кроме сравнения копий с оригиналом, думаю, нужно сравнить копии (полученные различными методами) между собой. Вот поэтому и остановился на Стьюденте. Но возникает вопрос, оригинал один, а вот копий для каждого метода несколько... Открываем любой учебник по применению статистики и читаем: 1. t-критерий Стьюдента используется для определения статистической значимости различий средних величин. 2. Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства (гомоскедастичности) дисперсий. Из первого пункта следует, что по t-критерию Стьюдента корректно сравнивать Ваш оригинал (среднее по оригиналу) и ОДНУ копию (среднюю по копии) . Да и то, при условии, что выполняется п.2 указанный выше. А вообще-то для ответа на вопрос "Какой метод подсчёта достоверности правильнее выбрать?" неплохо бы ответить сперва на вопрос - достоверность ЧЕГО вы собираетесь считать? Достоверность различия. Мне нужно подсчитать насколько достоверно различие модели челюстей от полости рта, т.е. эксперимент делается in vitro, таким образом используется другая модель, которая и служит полостью рта. Т.е. если я правильно понял мне достаточно сделать только одну копию? Но здесь возникает вопрос, насколько достоверно, что одна копия это средняя, если изготовить несколько копий? И теоретически и практически такого не может быть. Сообщение отредактировал Dr_Arut - 5.06.2016 - 15:12 |
|
5.06.2016 - 23:29
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Цитата(Dr_Arut) одна копия это средняя, если изготовить несколько копий? И теоретически и практически такого не может быть. Внимательно читаем, что написали: ОДНА копия не может быть СРЕДНЕЙ. Средняя - это некая абстракция, которая получается усреднением значений целого ряда замеров. Критерий Стюдента указывает, можно ли считать СРЕДНЕЕ по ряду замеров (в Вашем случае, сделанных на полости рта) и СРЕДНЕЕ по другому ряду замеров (в Вашем случае - сделанных по модели) статистически неразличимыми. Не более того. (И кстати - еще раз повторю, все это корректно при условии уверенности в нормальности распределения результатов замеров). Сообщение отредактировал passant - 5.06.2016 - 23:34 |
|
6.06.2016 - 09:55
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Дело в том, что кроме сравнения копий с оригиналом, думаю, нужно сравнить копии (полученные различными методами) между собой. Вот поэтому и остановился на Стьюденте. Но возникает вопрос, оригинал один, а вот копий для каждого метода несколько... Достоверность различия. Мне нужно подсчитать насколько достоверно различие модели челюстей от полости рта, т.е. эксперимент делается in vitro, таким образом используется другая модель, которая и служит полостью рта. Т.е. если я правильно понял мне достаточно сделать только одну копию? Но здесь возникает вопрос, насколько достоверно, что одна копия это средняя, если изготовить несколько копий? И теоретически и практически такого не может быть. Но при этом "измерение" одно (Например только "длина челюсти", но не "ширина челюсти")? Или "измерение" это какое то "смыкание" плохо обусловленное? PS Это я намекаю что возможно нужно смотреть в сторону морфологического анализа изделия. Сообщение отредактировал p2004r - 6.06.2016 - 16:31 |
|
6.06.2016 - 15:44
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Здравствуйте. Суть исследования - создание копий оригинала и оценка различий с оригиналом. Изготавливаю 2-3 копии для каждого метода изготовления. Оригинал измеряю 5 раз, считаю среднюю, копии также измеряю 5 раз и считаю среднюю (из-за погрешности измерения - мкм и т.д.). Для оценки достоверности применяю t-тест Стьюдента. Беру 5 измерений оригинала и среднюю для каждой копии, например 10, 10.01, 10.02, 10.0 ,10.01 и 9.94, 9.88, 9.91 t-тест вроде считает достоверность между средними, в моём случае только один оригинал и несколько (2-3) копий полученных для каждого метода. Использую для подсчёта excel. Собственно вопрос - правильно использовать т-тест? Если нет то какой метод правильнее использовать? Если правильно использовать т-тест, то в случае подсчёта какие параметры нужно вбивать в формулу? У меня следующее =СТЬЮДЕНТ.ТЕСТ(F30:F34;F17:F19;2;3), где F30:F34 - 10, 10.01, 10.02, 10.0 ,10.01, F17:F19 9.94, 9.88, 9.91, цифра 2 - хвосты распределения, 3 - тип. Если у вас 2 выборки - t-критерий корректен (при выполнении упоминавшихся выше участниками прочих условий). Если больше 2 групп - некорректен. Точка. Т.е. в вашем случае анализ проведён некорректно, статистическим выводам веры нет. Грамотный анализ ваших данных можно провести двумя техниками: 1) общими линейными моделями, включая сложные варианты дисперсионного анализа; 2) моделями смешанных эффектов (mixed effect models). Знаю как сделать первым способом. Алгоритм примерно такой. 1) Забыть про статистический анализ встроенными средствами Еxcel: для выводов это и неточно, и непрофессионально ( для освоения статистики практика работы с формулами Еxcel очень полезна). Нужно установить и освоить что-либо из доступного специализированного софта. Я спокойно отношусь к пиратству, потому что убеждён, что оно делает хорошую рекламу и когда складываются условия люди покупают именно знакомое по пиратским версиям. Кроме пиратских коммерческих пакетов есть и такие бесплатные, до которых коммерческим далеко. Поэтому выбрать можно. 2) Провести дисперсионный анализ с факторами "Метод" и "Копия внутри Метода". Пусть "Метод 0" будет оригинал с одной Копией. Для остальных методов копий будет несколько. Внутри Копий будут повторные измерения, но их не нужно специально кодировать, программы поймут, что это 5-кратные измерения одной копии. По результатам такого анализа в ходе множественных апостериорных сравнений можно ответить почти на все интересующие вопросы: отличаются ли копии от оригинала, какие - больше, а какие меньше, и т.д. Выявится лидер по критерию близости к Оригиналу. 3) Я бы провёл ещё один анализ - иерархический дисперсионный анализ. Из данных исключить Оригинал. Получится строгая иерархия: Измерения внутри Копий, Копии внутри Методов. По результатам такого анализа рассчитать компоненты дисперсии. Последние укажут на то, сколько изменчивости признака в % приходится на различия между методами, сколько % - на различия копий внутри методов, а сколько % - на ошибку измерения. С дисперсиями можно поработать и тоньше - отдельно по методам: станет понятно какой метод позволяет производить более стабильные в плане изготовления копии. Выявится лидер по критерию технологической воспроизводимости необходимых параметров Оригинала. Хорошо будет если лидеры пунктов 2 и 3 совпадут. Если же не совпадут - станет понятно в какую сторону и какой Метод совершенствовать. Т.е. или работать над более точной подгонкой к Оригиналу наиболее технологически стабильного метода, или повышать точность воспроизведения для более близкого к Оригиналу Метода. |
|
7.06.2016 - 23:13
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 4.06.2016 Пользователь №: 28331 |
Но при этом "измерение" одно (Например только "длина челюсти", но не "ширина челюсти")? Или "измерение" это какое то "смыкание" плохо обусловленное? PS Это я намекаю что возможно нужно смотреть в сторону морфологического анализа изделия. Да, на одной модели измеряются четыре размера Нужно установить и освоить что-либо из доступного специализированного софта. Какой софт порекомендуете? Можно даже под линукс. |
|
7.06.2016 - 23:25
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Да, на одной модели измеряются четыре размера Тогда надо почитать Julien Claude "Morphometrics with R", там есть способы выяснить чем отличаются "методы копирования". |
|
8.06.2016 - 13:18
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 4.06.2016 Пользователь №: 28331 |
|
|
13.06.2016 - 20:35
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Какой софт порекомендуете? Можно даже под линукс. Прошу прощения за паузу - времени вообще нет! Я считал подобные комплекса в Statistica 8 и 10 (версия 6 и ранее многие комплексы считать отказывалась). Из свободного софта можно порекомендовать только R - она есть и под Windows, и под Linux. Там непривычный лично для меня способ задания таких дисперсионных комплексов + один из учебника Монтгомери я вообще не смог задать, чтобы решение было в одной таблице. Но скорее это - сугубо мои предпочтения и проблемы. Пробуйте R, читайте про сложные варианты анализа повторных измерений, split-plot дизайны и прочие комплексы со вложенными эффектами и как эту вложенность задать + иерархические комплексы (nested ANOVA). |
|
14.06.2016 - 14:05
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
|
|