Здравствуйте, гость ( Вход | Регистрация )
26.06.2018 - 09:33
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 25.06.2018 Пользователь №: 31577 |
Всем доброго утра! Я клинический эмбриолог, и в нашей клинике мы так же работаем с генетическим анализом эмбрионов. Сущность этого анализа заключается в том что мы отщепляем часть клеток эмбриона, кладем биоптат в буфер и отправляем на генетический анализ в сотрудничающую с нами генетическую фирму. Большая часть биоптата успешно проходит анализ, но некоторая часть всегда нечитабельна (ошибки при транспортировке). Биоптат который не прошел анализ идем за индексом FA (потеря сигнала).
У меня вопрос - недавно мы сменили курьера, который использует другие условия доставки материала, и у меня ощущение что число эмбрионов с FA резко выросло. Я имею точные данные о числе отправленых эмбрионов по месяцам и точные данные о числе FA. Дата смены курьера у меня так же имеется так что группы можно разделить по времени. Как вы считаете, уважаемые участники форума, мог бы я использовать дисперсионный анализ (с неравномерной численностью групп) в качестве способа выявить различия между тем, сколько FA было у одной транспортной компании, и сколько у другой? Условия 1) Нулевая гипотеза - раличия по FA между разными курьерами не существенны 2) анализируется только один фактор - число FA 3) анализ двух групп (старый курьер и новый курьер) за равный интервал времени но с разным числом пациентов (неравномерная численность групп) Для применения дисперсионного анализа необходимо 4 условия 1) совокупность нормально распределена (скорее всего это так, но надо проверить по среднему, медиане и 25 и 75 процентилям) 2) каждая выборка случайно извлечена из исследуемой совокупности (выполнено) 3) каждая выборка независима от остальных выборок (выполнена) 4) дисперсии всех выборок равны или отличаются не сильно (надо рассчитать) - вопрос насколько допустимы различия между дисперсиями? Какие подводные камни, можно или нет применять дисперсионный анализ - в общем жду мнений, спасибо! |
|
|
![]() |
![]() |
![]() |
26.06.2018 - 10:46
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 25.06.2018 Пользователь №: 31577 |
Верно, задача для первоклассника - только я эмбриолог а не профессиональный математик-статистик, поэтому я могу и не видеть некоторых подводных камней, поэтому я здесь и написал. Сейчас начну собирать данные, это не быстрая задача, мне нужно убедиться что распределение нормальное, и высчитать дисперсии для двух выборок, и понять насколько сильно эти дисперсии отличаются между собой. Если данные которые указывали бы - при каком различии в дисперсиях дисперсионный анализ не применим? Потому что сейчас все строится только на предположении что дисперсии различаются не сильно и распределение нормальное.
|
|
|
![]() |
![]() |
26.06.2018 - 10:57
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Верно, задача для первоклассника - только я эмбриолог а не профессиональный математик-статистик, поэтому я могу и не видеть некоторых подводных камней, поэтому я здесь и написал. Сейчас начну собирать данные, это не быстрая задача, мне нужно убедиться что распределение нормальное, и высчитать дисперсии для двух выборок, и понять насколько сильно эти дисперсии отличаются между собой. Если данные которые указывали бы - при каком различии в дисперсиях дисперсионный анализ не применим? Потому что сейчас все строится только на предположении что дисперсии различаются не сильно и распределение нормальное. Нет-нет-нет, ни в коем случае. Здесь вообще не нужны никакие нормальности, дисперсии и прочие атрибуты тяжкой работы мысли. Просто рассчитайте величину z=|p1-p2|/корень{p1*(1-p1)/n1 +p2*(1-p2)/n2} и сравните этот модуль с 97,5%-ной квантилью стандартного нормального распределения (1,96). |
|
|
![]() |
![]() |
26.06.2018 - 13:48
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 25.06.2018 Пользователь №: 31577 |
Нет-нет-нет, ни в коем случае. Здесь вообще не нужны никакие нормальности, дисперсии и прочие атрибуты тяжкой работы мысли. Просто рассчитайте величину z=|p1-p2|/корень{p1*(1-p1)/n1 +p2*(1-p2)/n2} и сравните этот модуль с 97,5%-ной квантилью стандартного нормального распределения (1,96). Я бы не сказал что дисперсию сложно рассчитать, это ведь программа делает, мне только цифры вбить по сути, а высчитать F критерий имея значения средних, стандартные отклонения и число членов в выборке вообще не проблема. Скажем так просто дисперсионный анализ при соблюдении всех условий помогает достоверно выявить различия между выборками, и я немного в нем разбираюсь. Мне бы не хотелось пользоваться статистическими методами в которых я не разбираюсь. К тому же дисперсионный анализ для меня в этом случае еще и необходим по той причине что бы выявить различия по месяцам в пределах одной выборки, вдруг там то же есть отклонения которых я еще не вижу. Данных пока не будет, там большой объем и мне вычленять их придется пару недель точно. А что это за формула которая приведена выше? Это из какого разлела статистики? Это не t-критерий ли случаем? Если да то это то же подходит, просто t-критерий если не ошибаюсь является частным случаем дисперсионного анализа Сообщение отредактировал Алексей Лк - 26.06.2018 - 13:58 |
|
|
![]() |
![]() |
26.06.2018 - 14:56
Сообщение
#5
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата Я бы не сказал что дисперсию сложно рассчитать, это ведь программа делает, мне только цифры вбить по сути, а высчитать F критерий имея значения средних, стандартные отклонения и число членов в выборке вообще не проблема. Это из серии "Капитан Очевидность разъясняет". Цитата Скажем так просто дисперсионный анализ при соблюдении всех условий помогает достоверно выявить различия между выборками То же самое можно сказать про любой состоятельный критерий в статистике. И ДА в этом случае - всего лишь один из. Цитата ...и я немного в нем разбираюсь. Пока незаметно. Цитата Мне бы не хотелось пользоваться статистическими методами в которых я не разбираюсь В статистике принято пользоваться методами, которые обусловлены вероятностно-статистической моделью порождения данных. Мало ли, в чем вы не разбираетесь. Иначе получается как у того анекдотического студента, выучившего тему про блох, и все вопросы экзаменатора сводившего к блохам. Цитата К тому же дисперсионный анализ для меня в этом случае еще и необходим по той причине что бы выявить различия по месяцам в пределах одной выборки, вдруг там то же есть отклонения которых я еще не вижу. Для этого вам потребуются масса пост-хок сравнений, которые затем надо будет "доводить до ума" процедурами FDR, что само по себе - задача не для новичка. Цитата А что это за формула которая приведена выше? Проверка однородности двух биномиальных выборок. Я исхожу из следующей вероятностно- статистической модели: ваши данные представляют собой результат прямого подсчета (столько-то образцов отправлено, из них столько-то загублено), т.е. данные измерены в абсолютной шкале. Здесь не надо изобретать новое слово в бухгалтерии и расписывать всю эту красоту по месяцам, по декадам, по дням недели и по времени суток в пределах одного дня: достаточно рассмотреть данные нарастающим итогом, благо они допускают суммирование по времени. Далее предполагаем, что один перевозчик/курьер возит образцы с вероятностью сохранности р1 (и, соответственно, с вероятностью брака q1=1-p1), второй - с вероятностью р2 (q2). Дальнейшее вы видели. Сообщение отредактировал 100$ - 26.06.2018 - 15:01 |
|
|
![]() |
![]() |
Алексей Лк Дисперсионный анализ для отслеживания ошибок в результатах PGD 26.06.2018 - 09:33
passant Цитата(Алексей Лк @ 26.06.2018 - 09... 26.06.2018 - 10:20
Алексей Лк Ясно спасибо! Я то же думаю что условия подход... 26.06.2018 - 10:29
100$ Но это же задача для первоклассника: первый курьер... 26.06.2018 - 10:40
Алексей Лк Цитата(100$ @ 26.06.2018 - 14:5... 26.06.2018 - 15:26
p2004r Это временной ряд, про стационарность которого мы ... 26.06.2018 - 12:05
passant Цитата(p2004r @ 26.06.2018 - 12:05) ... 26.06.2018 - 12:31

p2004r Цитата(passant @ 26.06.2018 - 12:31)... 26.06.2018 - 19:08

passant Цитата(p2004r @ 26.06.2018 - 19:08) ... 26.06.2018 - 19:48

Алексей Лк Цитата(passant @ 26.06.2018 - 19:48)... 26.06.2018 - 19:55

p2004r Цитата(passant @ 26.06.2018 - 19:48)... 26.06.2018 - 22:51
Алексей Лк Цитата(p2004r @ 26.06.2018 - 12:05) ... 26.06.2018 - 13:52
passant Цитата(Алексей Лк @ 26.06.2018 - 13... 26.06.2018 - 14:44

Алексей Лк Цитата(passant @ 26.06.2018 - 14:44)... 26.06.2018 - 15:19

passant Цитата(Алексей Лк @ 26.06.2018 - 15... 26.06.2018 - 15:35
p2004r Цитата(Алексей Лк @ 26.06.2018 - 13... 26.06.2018 - 19:13
Алексей Лк Цитата(p2004r @ 26.06.2018 - 19:13) ... 26.06.2018 - 19:18
p2004r Цитата(Алексей Лк @ 26.06.2018 - 19... 26.06.2018 - 22:45
Алексей Лк Вот еще тонкий момент - у меня в двух группах выхо... 26.06.2018 - 14:42
Алексей Лк В общем полагаю что FA надо все таки считать на ко... 26.06.2018 - 15:35
passant Цитата(Алексей Лк @ 26.06.2018 - 15... 26.06.2018 - 15:51
Алексей Лк Цитата(passant @ 26.06.2018 - 15:51)... 26.06.2018 - 16:08
DrgLena Цитата(Алексей Лк @ 26.06.2018 - 09... 26.06.2018 - 19:42
Алексей Лк Цитата(DrgLena @ 26.06.2018 - 19:42)... 26.06.2018 - 19:53
100$ Цитата(Алексей Лк @ 26.06.2018 - 19... 26.06.2018 - 21:10
Алексей Лк Цитата(100$ @ 26.06.2018 - 21:1... 26.06.2018 - 21:24
100$ А что, господа, чай, устали глаза?
А вон, налево, ... 26.06.2018 - 21:52![]() ![]() |