Форум врачей-аспирантов > Какой метод подсчёта достоверности правильнее выбрать?

Dr_Arut

4.06.2016 - 07:29

Здравствуйте. Суть исследования - создание копий оригинала и оценка различий с оригиналом. Изготавливаю 2-3 копии для каждого метода изготовления. Оригинал измеряю 5 раз, считаю среднюю, копии также измеряю 5 раз и считаю среднюю (из-за погрешности измерения - мкм и т.д.). Для оценки достоверности применяю t-тест Стьюдента. Беру 5 измерений оригинала и среднюю для каждой копии, например 10, 10.01, 10.02, 10.0 ,10.01 и 9.94, 9.88, 9.91
t-тест вроде считает достоверность между средними, в моём случае только один оригинал и несколько (2-3) копий полученных для каждого метода. Использую для подсчёта excel.
Собственно вопрос - правильно использовать т-тест? Если нет то какой метод правильнее использовать?
Если правильно использовать т-тест, то в случае подсчёта какие параметры нужно вбивать в формулу? У меня следующее =СТЬЮДЕНТ.ТЕСТ(F30:F34;F17:F19;2;3), где F30:F34 - 10, 10.01, 10.02, 10.0 ,10.01, F17:F19 9.94, 9.88, 9.91, цифра 2 - хвосты распределения, 3 - тип.

p2004r

4.06.2016 - 10:59

Цитата(Dr_Arut @ 4.06.2016 - 07:29)

Здравствуйте. Суть исследования - создание копий оригинала и оценка различий с оригиналом. Изготавливаю 2-3 копии для каждого метода изготовления. Оригинал измеряю 5 раз, считаю среднюю, копии также измеряю 5 раз и считаю среднюю (из-за погрешности измерения - мкм и т.д.). Для оценки достоверности применяю t-тест Стьюдента. Беру 5 измерений оригинала и среднюю для каждой копии, например 10, 10.01, 10.02, 10.0 ,10.01 и 9.94, 9.88, 9.91
t-тест вроде считает достоверность между средними, в моём случае только один оригинал и несколько (2-3) копий полученных для каждого метода. Использую для подсчёта excel.
Собственно вопрос - правильно использовать т-тест? Если нет то какой метод правильнее использовать?
Если правильно использовать т-тест, то в случае подсчёта какие параметры нужно вбивать в формулу? У меня следующее =СТЬЮДЕНТ.ТЕСТ(F30:F34;F17:F19;2;3), где F30:F34 - 10, 10.01, 10.02, 10.0 ,10.01, F17:F19 9.94, 9.88, 9.91, цифра 2 - хвосты распределения, 3 - тип.

Судя по формулировке задачи это обычный "контроль качества", там масса готовых ритуалов измерений и целей для которых это всё делается сформулировано. Если это не так, то скажите просто что Вы там "копируете" и в чем состоит "измерение"?

passant

4.06.2016 - 22:54

Открываем любой учебник по применению статистики и читаем:

1. t-критерий Стьюдента используется для определения статистической значимости различий средних величин.
2. Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства (гомоскедастичности) дисперсий.

Из первого пункта следует, что по t-критерию Стьюдента корректно сравнивать Ваш оригинал (среднее по оригиналу) и ОДНУ копию (среднюю по копии) . Да и то, при условии, что выполняется п.2 указанный выше.

А вообще-то для ответа на вопрос "Какой метод подсчёта достоверности правильнее выбрать?" неплохо бы ответить сперва на вопрос - достоверность ЧЕГО вы собираетесь считать?

Dr_Arut

5.06.2016 - 14:42

Цитата(p2004r @ 4.06.2016 - 10:59)

Судя по формулировке задачи это обычный "контроль качества", там масса готовых ритуалов измерений и целей для которых это всё делается сформулировано. Если это не так, то скажите просто что Вы там "копируете" и в чем состоит "измерение"?

Дело в том, что кроме сравнения копий с оригиналом, думаю, нужно сравнить копии (полученные различными методами) между собой. Вот поэтому и остановился на Стьюденте. Но возникает вопрос, оригинал один, а вот копий для каждого метода несколько...

Цитата(passant @ 4.06.2016 - 22:54)

Открываем любой учебник по применению статистики и читаем:

1. t-критерий Стьюдента используется для определения статистической значимости различий средних величин.
2. Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства (гомоскедастичности) дисперсий.

Из первого пункта следует, что по t-критерию Стьюдента корректно сравнивать Ваш оригинал (среднее по оригиналу) и ОДНУ копию (среднюю по копии) . Да и то, при условии, что выполняется п.2 указанный выше.

А вообще-то для ответа на вопрос "Какой метод подсчёта достоверности правильнее выбрать?" неплохо бы ответить сперва на вопрос - достоверность ЧЕГО вы собираетесь считать?

Достоверность различия.
Мне нужно подсчитать насколько достоверно различие модели челюстей от полости рта, т.е. эксперимент делается in vitro, таким образом используется другая модель, которая и служит полостью рта.
Т.е. если я правильно понял мне достаточно сделать только одну копию? Но здесь возникает вопрос, насколько достоверно, что одна копия это средняя, если изготовить несколько копий? И теоретически и практически такого не может быть.

passant

5.06.2016 - 23:29

Цитата(Dr_Arut)

одна копия это средняя, если изготовить несколько копий? И теоретически и практически такого не может быть.

Внимательно читаем, что написали: ОДНА копия не может быть СРЕДНЕЙ.
Средняя - это некая абстракция, которая получается усреднением значений целого ряда замеров.
Критерий Стюдента указывает, можно ли считать СРЕДНЕЕ по ряду замеров (в Вашем случае, сделанных на полости рта) и СРЕДНЕЕ по другому ряду замеров (в Вашем случае - сделанных по модели) статистически неразличимыми. Не более того.
(И кстати - еще раз повторю, все это корректно при условии уверенности в нормальности распределения результатов замеров).

p2004r

6.06.2016 - 09:55

Цитата(Dr_Arut @ 5.06.2016 - 14:42)

Дело в том, что кроме сравнения копий с оригиналом, думаю, нужно сравнить копии (полученные различными методами) между собой. Вот поэтому и остановился на Стьюденте. Но возникает вопрос, оригинал один, а вот копий для каждого метода несколько...

Достоверность различия.
Мне нужно подсчитать насколько достоверно различие модели челюстей от полости рта, т.е. эксперимент делается in vitro, таким образом используется другая модель, которая и служит полостью рта.
Т.е. если я правильно понял мне достаточно сделать только одну копию? Но здесь возникает вопрос, насколько достоверно, что одна копия это средняя, если изготовить несколько копий? И теоретически и практически такого не может быть.

Но при этом "измерение" одно (Например только "длина челюсти", но не "ширина челюсти")? Или "измерение" это какое то "смыкание" плохо обусловленное?

PS Это я намекаю что возможно нужно смотреть в сторону морфологического анализа изделия.

nokh

6.06.2016 - 15:44

Цитата(Dr_Arut @ 4.06.2016 - 09:29)

Здравствуйте. Суть исследования - создание копий оригинала и оценка различий с оригиналом. Изготавливаю 2-3 копии для каждого метода изготовления. Оригинал измеряю 5 раз, считаю среднюю, копии также измеряю 5 раз и считаю среднюю (из-за погрешности измерения - мкм и т.д.). Для оценки достоверности применяю t-тест Стьюдента. Беру 5 измерений оригинала и среднюю для каждой копии, например 10, 10.01, 10.02, 10.0 ,10.01 и 9.94, 9.88, 9.91
t-тест вроде считает достоверность между средними, в моём случае только один оригинал и несколько (2-3) копий полученных для каждого метода. Использую для подсчёта excel.
Собственно вопрос - правильно использовать т-тест? Если нет то какой метод правильнее использовать?
Если правильно использовать т-тест, то в случае подсчёта какие параметры нужно вбивать в формулу? У меня следующее =СТЬЮДЕНТ.ТЕСТ(F30:F34;F17:F19;2;3), где F30:F34 - 10, 10.01, 10.02, 10.0 ,10.01, F17:F19 9.94, 9.88, 9.91, цифра 2 - хвосты распределения, 3 - тип.

Если у вас 2 выборки - t-критерий корректен (при выполнении упоминавшихся выше участниками прочих условий). Если больше 2 групп - некорректен. Точка. Т.е. в вашем случае анализ проведён некорректно, статистическим выводам веры нет.

Грамотный анализ ваших данных можно провести двумя техниками: 1) общими линейными моделями, включая сложные варианты дисперсионного анализа; 2) моделями смешанных эффектов (mixed effect models). Знаю как сделать первым способом. Алгоритм примерно такой.
1) Забыть про статистический анализ встроенными средствами Еxcel: для выводов это и неточно, и непрофессионально ( для освоения статистики практика работы с формулами Еxcel очень полезна). Нужно установить и освоить что-либо из доступного специализированного софта. Я спокойно отношусь к пиратству, потому что убеждён, что оно делает хорошую рекламу и когда складываются условия люди покупают именно знакомое по пиратским версиям. Кроме пиратских коммерческих пакетов есть и такие бесплатные, до которых коммерческим далеко. Поэтому выбрать можно.
2) Провести дисперсионный анализ с факторами "Метод" и "Копия внутри Метода". Пусть "Метод 0" будет оригинал с одной Копией. Для остальных методов копий будет несколько. Внутри Копий будут повторные измерения, но их не нужно специально кодировать, программы поймут, что это 5-кратные измерения одной копии. По результатам такого анализа в ходе множественных апостериорных сравнений можно ответить почти на все интересующие вопросы: отличаются ли копии от оригинала, какие - больше, а какие меньше, и т.д. Выявится лидер по критерию близости к Оригиналу.
3) Я бы провёл ещё один анализ - иерархический дисперсионный анализ. Из данных исключить Оригинал. Получится строгая иерархия: Измерения внутри Копий, Копии внутри Методов. По результатам такого анализа рассчитать компоненты дисперсии. Последние укажут на то, сколько изменчивости признака в % приходится на различия между методами, сколько % - на различия копий внутри методов, а сколько % - на ошибку измерения. С дисперсиями можно поработать и тоньше - отдельно по методам: станет понятно какой метод позволяет производить более стабильные в плане изготовления копии. Выявится лидер по критерию технологической воспроизводимости необходимых параметров Оригинала.

Хорошо будет если лидеры пунктов 2 и 3 совпадут. Если же не совпадут - станет понятно в какую сторону и какой Метод совершенствовать. Т.е. или работать над более точной подгонкой к Оригиналу наиболее технологически стабильного метода, или повышать точность воспроизведения для более близкого к Оригиналу Метода.

Dr_Arut

7.06.2016 - 23:13

Цитата(p2004r @ 6.06.2016 - 09:55)

Но при этом "измерение" одно (Например только "длина челюсти", но не "ширина челюсти")? Или "измерение" это какое то "смыкание" плохо обусловленное?

PS Это я намекаю что возможно нужно смотреть в сторону морфологического анализа изделия.

Да, на одной модели измеряются четыре размера

Цитата(nokh @ 6.06.2016 - 15:44)

Нужно установить и освоить что-либо из доступного специализированного софта.

Какой софт порекомендуете? Можно даже под линукс.

p2004r

7.06.2016 - 23:25

Цитата(Dr_Arut @ 7.06.2016 - 23:13)

Да, на одной модели измеряются четыре размера

Тогда надо почитать Julien Claude "Morphometrics with R", там есть способы выяснить чем отличаются "методы копирования".

Dr_Arut

8.06.2016 - 13:18

Цитата(p2004r @ 7.06.2016 - 23:25)

Тогда надо почитать Julien Claude "Morphometrics with R", там есть способы выяснить чем отличаются "методы копирования".

Спасибо

А эта книга есть с русским переводом?

nokh

13.06.2016 - 20:35

Цитата(Dr_Arut @ 8.06.2016 - 01:13)

Какой софт порекомендуете? Можно даже под линукс.

Прошу прощения за паузу - времени вообще нет! Я считал подобные комплекса в Statistica 8 и 10 (версия 6 и ранее многие комплексы считать отказывалась). Из свободного софта можно порекомендовать только R - она есть и под Windows, и под Linux. Там непривычный лично для меня способ задания таких дисперсионных комплексов + один из учебника Монтгомери я вообще не смог задать, чтобы решение было в одной таблице. Но скорее это - сугубо мои предпочтения и проблемы. Пробуйте R, читайте про сложные варианты анализа повторных измерений, split-plot дизайны и прочие комплексы со вложенными эффектами и как эту вложенность задать + иерархические комплексы (nested ANOVA).

p2004r

14.06.2016 - 14:05

Цитата(Dr_Arut @ 8.06.2016 - 13:18)

Спасибо

А эта книга есть с русским переводом?

Нет.