Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Дисперсионный анализ для отслеживания ошибок в результатах PGD
Алексей Лк
сообщение 26.06.2018 - 09:33
Сообщение #1





Группа: Пользователи
Сообщений: 14
Регистрация: 25.06.2018
Пользователь №: 31577



Всем доброго утра! Я клинический эмбриолог, и в нашей клинике мы так же работаем с генетическим анализом эмбрионов. Сущность этого анализа заключается в том что мы отщепляем часть клеток эмбриона, кладем биоптат в буфер и отправляем на генетический анализ в сотрудничающую с нами генетическую фирму. Большая часть биоптата успешно проходит анализ, но некоторая часть всегда нечитабельна (ошибки при транспортировке). Биоптат который не прошел анализ идем за индексом FA (потеря сигнала).

У меня вопрос - недавно мы сменили курьера, который использует другие условия доставки материала, и у меня ощущение что число эмбрионов с FA резко выросло. Я имею точные данные о числе отправленых эмбрионов по месяцам и точные данные о числе FA. Дата смены курьера у меня так же имеется так что группы можно разделить по времени.

Как вы считаете, уважаемые участники форума, мог бы я использовать дисперсионный анализ (с неравномерной численностью групп) в качестве способа выявить различия между тем, сколько FA было у одной транспортной компании, и сколько у другой?

Условия
1) Нулевая гипотеза - раличия по FA между разными курьерами не существенны
2) анализируется только один фактор - число FA
3) анализ двух групп (старый курьер и новый курьер) за равный интервал времени но с разным числом пациентов (неравномерная численность групп)

Для применения дисперсионного анализа необходимо 4 условия
1) совокупность нормально распределена (скорее всего это так, но надо проверить по среднему, медиане и 25 и 75 процентилям)
2) каждая выборка случайно извлечена из исследуемой совокупности (выполнено)
3) каждая выборка независима от остальных выборок (выполнена)
4) дисперсии всех выборок равны или отличаются не сильно (надо рассчитать) - вопрос насколько допустимы различия между дисперсиями?

Какие подводные камни, можно или нет применять дисперсионный анализ - в общем жду мнений, спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Алексей Лк
сообщение 26.06.2018 - 10:46
Сообщение #2





Группа: Пользователи
Сообщений: 14
Регистрация: 25.06.2018
Пользователь №: 31577



Верно, задача для первоклассника - только я эмбриолог а не профессиональный математик-статистик, поэтому я могу и не видеть некоторых подводных камней, поэтому я здесь и написал. Сейчас начну собирать данные, это не быстрая задача, мне нужно убедиться что распределение нормальное, и высчитать дисперсии для двух выборок, и понять насколько сильно эти дисперсии отличаются между собой. Если данные которые указывали бы - при каком различии в дисперсиях дисперсионный анализ не применим? Потому что сейчас все строится только на предположении что дисперсии различаются не сильно и распределение нормальное.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 26.06.2018 - 10:57
Сообщение #3





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Алексей Лк @ 26.06.2018 - 10:46) *
Верно, задача для первоклассника - только я эмбриолог а не профессиональный математик-статистик, поэтому я могу и не видеть некоторых подводных камней, поэтому я здесь и написал. Сейчас начну собирать данные, это не быстрая задача, мне нужно убедиться что распределение нормальное, и высчитать дисперсии для двух выборок, и понять насколько сильно эти дисперсии отличаются между собой. Если данные которые указывали бы - при каком различии в дисперсиях дисперсионный анализ не применим? Потому что сейчас все строится только на предположении что дисперсии различаются не сильно и распределение нормальное.


Нет-нет-нет, ни в коем случае. Здесь вообще не нужны никакие нормальности, дисперсии и прочие атрибуты тяжкой работы мысли. Просто рассчитайте величину
z=|p1-p2|/корень{p1*(1-p1)/n1 +p2*(1-p2)/n2} и сравните этот модуль с 97,5%-ной квантилью стандартного нормального распределения (1,96).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Алексей Лк
сообщение 26.06.2018 - 13:48
Сообщение #4





Группа: Пользователи
Сообщений: 14
Регистрация: 25.06.2018
Пользователь №: 31577



Цитата(100$ @ 26.06.2018 - 10:57) *
Нет-нет-нет, ни в коем случае. Здесь вообще не нужны никакие нормальности, дисперсии и прочие атрибуты тяжкой работы мысли. Просто рассчитайте величину
z=|p1-p2|/корень{p1*(1-p1)/n1 +p2*(1-p2)/n2} и сравните этот модуль с 97,5%-ной квантилью стандартного нормального распределения (1,96).


Я бы не сказал что дисперсию сложно рассчитать, это ведь программа делает, мне только цифры вбить по сути, а высчитать F критерий имея значения средних, стандартные отклонения и число членов в выборке вообще не проблема. Скажем так просто дисперсионный анализ при соблюдении всех условий помогает достоверно выявить различия между выборками, и я немного в нем разбираюсь. Мне бы не хотелось пользоваться статистическими методами в которых я не разбираюсь. К тому же дисперсионный анализ для меня в этом случае еще и необходим по той причине что бы выявить различия по месяцам в пределах одной выборки, вдруг там то же есть отклонения которых я еще не вижу.


Данных пока не будет, там большой объем и мне вычленять их придется пару недель точно. А что это за формула которая приведена выше? Это из какого разлела статистики? Это не t-критерий ли случаем? Если да то это то же подходит, просто t-критерий если не ошибаюсь является частным случаем дисперсионного анализа

Сообщение отредактировал Алексей Лк - 26.06.2018 - 13:58
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 26.06.2018 - 14:56
Сообщение #5





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
Я бы не сказал что дисперсию сложно рассчитать, это ведь программа делает, мне только цифры вбить по сути, а высчитать F критерий имея значения средних, стандартные отклонения и число членов в выборке вообще не проблема.

Это из серии "Капитан Очевидность разъясняет".

Цитата
Скажем так просто дисперсионный анализ при соблюдении всех условий помогает достоверно выявить различия между выборками

То же самое можно сказать про любой состоятельный критерий в статистике. И ДА в этом случае - всего лишь один из.

Цитата
...и я немного в нем разбираюсь.

Пока незаметно.

Цитата
Мне бы не хотелось пользоваться статистическими методами в которых я не разбираюсь

В статистике принято пользоваться методами, которые обусловлены вероятностно-статистической моделью порождения данных. Мало ли, в чем вы не разбираетесь. Иначе получается как у того анекдотического студента, выучившего тему про блох, и все вопросы экзаменатора сводившего к блохам.

Цитата
К тому же дисперсионный анализ для меня в этом случае еще и необходим по той причине что бы выявить различия по месяцам в пределах одной выборки, вдруг там то же есть отклонения которых я еще не вижу.

Для этого вам потребуются масса пост-хок сравнений, которые затем надо будет "доводить до ума" процедурами FDR, что само по себе - задача не для новичка.


Цитата
А что это за формула которая приведена выше?

Проверка однородности двух биномиальных выборок.

Я исхожу из следующей вероятностно- статистической модели: ваши данные представляют собой результат прямого подсчета (столько-то образцов отправлено, из них столько-то загублено), т.е. данные измерены в абсолютной шкале. Здесь не надо изобретать новое слово в бухгалтерии и расписывать всю эту красоту по месяцам, по декадам, по дням недели и по времени суток в пределах одного дня: достаточно рассмотреть данные нарастающим итогом, благо они допускают суммирование по времени. Далее предполагаем, что один перевозчик/курьер возит образцы с вероятностью сохранности р1 (и, соответственно, с вероятностью брака q1=1-p1), второй - с вероятностью р2 (q2). Дальнейшее вы видели.

Сообщение отредактировал 100$ - 26.06.2018 - 15:01
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Алексей Лк
сообщение 26.06.2018 - 15:26
Сообщение #6





Группа: Пользователи
Сообщений: 14
Регистрация: 25.06.2018
Пользователь №: 31577



Цитата(100$ @ 26.06.2018 - 14:56) *
Это из серии "Капитан Очевидность разъясняет".


Вы не могли бы ответить на простой вопрос как правильно рассчитать FA - на пациента или на выбранную статичную когорту из эмбрионов? Я разбираюсть только в том что написано в учебнике Гланца - больше мне не надо. Там ясно и понятно написано про дисперсионный анализ - глубже не надо, пусть дебрями занимаются математики-статисты. Вы можете сказать почему в моем случае не стоит использовать ДА - по пунктам. Если нет - то я буду делать только то в чем я разбираюсь гарантированно (в рамках книги Гланца) - потому что мне за это отвечать. Какие вам нужны данные?

Сообщение отредактировал Алексей Лк - 26.06.2018 - 15:27
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Алексей Лк   Дисперсионный анализ для отслеживания ошибок в результатах PGD   26.06.2018 - 09:33
- - passant   Цитата(Алексей Лк @ 26.06.2018 - 09...   26.06.2018 - 10:20
- - Алексей Лк   Ясно спасибо! Я то же думаю что условия подход...   26.06.2018 - 10:29
- - 100$   Но это же задача для первоклассника: первый курьер...   26.06.2018 - 10:40
- - Алексей Лк   Верно, задача для первоклассника - только я эмбрио...   26.06.2018 - 10:46
|- - 100$   Цитата(Алексей Лк @ 26.06.2018 - 10...   26.06.2018 - 10:57
|- - Алексей Лк   Цитата(100$ @ 26.06.2018 - 10:5...   26.06.2018 - 13:48
|- - 100$   ЦитатаЯ бы не сказал что дисперсию сложно рассчита...   26.06.2018 - 14:56
|- - Алексей Лк   Цитата(100$ @ 26.06.2018 - 14:5...   26.06.2018 - 15:26
- - p2004r   Это временной ряд, про стационарность которого мы ...   26.06.2018 - 12:05
|- - passant   Цитата(p2004r @ 26.06.2018 - 12:05) ...   26.06.2018 - 12:31
||- - p2004r   Цитата(passant @ 26.06.2018 - 12:31)...   26.06.2018 - 19:08
||- - passant   Цитата(p2004r @ 26.06.2018 - 19:08) ...   26.06.2018 - 19:48
||- - Алексей Лк   Цитата(passant @ 26.06.2018 - 19:48)...   26.06.2018 - 19:55
||- - p2004r   Цитата(passant @ 26.06.2018 - 19:48)...   26.06.2018 - 22:51
|- - Алексей Лк   Цитата(p2004r @ 26.06.2018 - 12:05) ...   26.06.2018 - 13:52
|- - passant   Цитата(Алексей Лк @ 26.06.2018 - 13...   26.06.2018 - 14:44
||- - Алексей Лк   Цитата(passant @ 26.06.2018 - 14:44)...   26.06.2018 - 15:19
||- - passant   Цитата(Алексей Лк @ 26.06.2018 - 15...   26.06.2018 - 15:35
|- - p2004r   Цитата(Алексей Лк @ 26.06.2018 - 13...   26.06.2018 - 19:13
|- - Алексей Лк   Цитата(p2004r @ 26.06.2018 - 19:13) ...   26.06.2018 - 19:18
|- - p2004r   Цитата(Алексей Лк @ 26.06.2018 - 19...   26.06.2018 - 22:45
- - Алексей Лк   Вот еще тонкий момент - у меня в двух группах выхо...   26.06.2018 - 14:42
- - Алексей Лк   В общем полагаю что FA надо все таки считать на ко...   26.06.2018 - 15:35
|- - passant   Цитата(Алексей Лк @ 26.06.2018 - 15...   26.06.2018 - 15:51
|- - Алексей Лк   Цитата(passant @ 26.06.2018 - 15:51)...   26.06.2018 - 16:08
- - DrgLena   Цитата(Алексей Лк @ 26.06.2018 - 09...   26.06.2018 - 19:42
|- - Алексей Лк   Цитата(DrgLena @ 26.06.2018 - 19:42)...   26.06.2018 - 19:53
|- - 100$   Цитата(Алексей Лк @ 26.06.2018 - 19...   26.06.2018 - 21:10
|- - Алексей Лк   Цитата(100$ @ 26.06.2018 - 21:1...   26.06.2018 - 21:24
- - 100$   А что, господа, чай, устали глаза? А вон, налево, ...   26.06.2018 - 21:52


Добавить ответ в эту темуОткрыть тему