![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() ![]() |
![]() |
![]()
Сообщение
#1
|
|
![]() Группа: Пользователи Сообщений: 147 Регистрация: 4.09.2012 Из: г.Дивногорск Пользователь №: 24146 ![]() |
Есть 6 групп пациентов соответственно годам. За 1, 2, 3, 4 и 6 года количество примерно одинаковое: 2-4. А за 5-й год - количество 17. Нужно доказать, что данное различие (между 5-м годом и остальными годами) статистически значимое.
|
|
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Есть 6 групп пациентов соответственно годам. За 1, 2, 3, 4 и 6 года количество примерно одинаковое: 2-4. А за 5-й год - количество 17. Нужно доказать, что данное различие (между 5-м годом и остальными годами) статистически значимое. 1) Если каждый год пациенты разные (выборки независимые) можно свести данные в таблицу сопряжённости 2х6 со входами: Пациенты (с интересующим признаком и без этого признака) и Годы. 2) Таблицу проверить на однородность с помощью критерия хи-квадрата Пирсона, если это допустимо (слишком много ячеек с малыми частотами). Допустимость проверяется отдельно с помощью критерия Симонова - Цай (программы Игоря такое считают). Можно рассчитать р-значение без опоры на распределение хи-квадрат - процедурой Монте-Карло, здесь другая философия (ресэмплинга) и нет ограничений по минимальному ожидаемому. Если гипотеза однородности отвергается, ну или почти отвергается (скажем р≤0,10), можно разбираться за счёт чего. 3) Для этого проверить ячейки на неслучайность вклада в неоднородность. Для каждой ячейки рассчитываются отклонения Фримана - Тьюки (Freeman-Tukey deviation) или согласованные стандартизованные остатки (остатки Хабермана, Adjusted residuals) с соответствующими р-значениями. Т.к. р-значений много, 12 штук, можно ввести поправку на множественность сравнений. Всё удобно сделать в PAST ( https://www.nhm.uio.no/english/research/resources/past/ ), описание схожей задачи - в примере на стр. 134 Лабораторного практикума ( https://yadi.sk/d/g50i73pt3J6pAa ). Только сейчас уже значимость отклонений рассчитывать отдельно не нужно (там показано как в Excel рассчитать), т.к. текущая версия программы рассчитывает и р-значения и р-значения с поправкой Бонферрони. Если заморочиться, можно выписать все 12 р-значений без поправок и пересчитать р-значения менее консервативным по сравнению с Бонферронии и другим по философии тестом Беньямини - Хохберга, удобно онлайн ( https://tools.carbocation.com/FDR , сортировать не надо, программа отсортирует сама). При таком подходе для ячейки, где число 17 будет большое положительное значение Adjusted residual с маленьким р-значением. В качестве описательной статистики можно рассчитать долю пациентов с интересущим признаком с 95%-ным доверительным интервалом. Если она выражается в %, то ДИ считать биномиальный (забыть навсегда про метод Вальда, лучше считать методом Джеффриса, можно онлайн: https://epitools.ausvet.com.au/ciproportion ), если в промилле или ещё меньше - ДИ считать пуассоновский. В материалах к Практикуму (ссылка была выше) есть расчётный файл Excel "Доверительный интервал для долей.xls, который давно делал форумчанин плав, а я раскрасил и добавил метод Джеффриса, но на такое нельзя сослаться, а на онлайновые калькуляторы - можно. Априорный байесовский интервал Джеффриса всегда находится внутри классического точного интервала Клоппера - Пирсона, т.е. он менее консервативный. Сообщение отредактировал nokh - 17.09.2024 - 22:57 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 262 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 ![]() |
Позвольте, но о каком "интересующем признаке" или его отсутствии речь? У ТС об этом ни слова. Есть просто кол-во пациентов, привязанное к определенном году и все. Надо доказать что то, что в 5-й год их было больше, чем в любой другой, не случайно.
Если абстрагироваться о том, что последовательные годы - временной ряд, и рассматривать их как независимые категории, то путь решения задачи прост. Суммируем кол-во пациентов за 1-4-й и 6-й года, 5-й не трогаем. Получаем ожидаемую пропорцию 5:1. Сравниваем наблюдаемые значения (сумму за прочие годы и отдельное число за 5-й год) с оной пропорцией при помощи точного биномиального критерия. Если не абстрагироваться от того, что перед нами временной ряд, то, очевидно, надо решать задачу иначе, но я такими методами не владею. Но, если чего не путаю, называется это поиск аномалий во временных рядах. Сообщение отредактировал ИНО - 18.09.2024 - 08:44 |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Позвольте, но о каком "интересующем признаке" или его отсутствии речь? У ТС об этом ни слова. Не позволю. Общайтесь с нуждающимся в ответе, а не со мной. Я предложил своё решение из того как понял и как обычно бывает, потому что знаю, что никакого "просто количества пациентов" не бывает, это всегда количество из числа родившихся, поступивших, продиагностированных, проживающих в ... в таком-то году и т.п. Если такая информация не собирается, всё печально, т.к. 2 это может быть 50%, а 17 - 0,00005 %. Сообщение отредактировал nokh - 18.09.2024 - 16:38 |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 262 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 ![]() |
Возможно и так, я в этих ваших пациентах не силен. Но озвученная в стартовом посте задача никаких других данных, помимо числа пациентов в год не содержит - что имеем, то имеем, и на вопрос "значимо ли больше поступило пациентов в 5-м году, чем если бы распределение по годам было случайным", даже по этим скудным данным ответить можем
![]() А уж от чего их было больше: из-за эпидемии заболевания али из-за того, что больше родилось или меньше застрелилось - не наше дело. Вообще, думается, далеко не всегда врач бывает в курсе, какую долю пришедшие на прием люди составляют от всех людей, которые могли бы попасть на прием. Помимо рождаемости и смертности, вклад может вносить целая куча скрытых факторов, от сезонной миграции, до пропускной способности системы (вполне возможно, что на 17 попавших в кабинет приходится 20 оставшихся в коридоре и 50, взглянувших на очередь, испугавшихся и ушедших домой заниматься самолечением ![]() Даже в случае госпитализации по скорой помощи может быть зависимость от времени приезда бригады, например, если в каком-то году будут ехать в N раз дольше обычного (как за мной прошлым летом), то одним успеет полегчать и они от госпитализации откажутся, а других повезут сразу в морг ![]() Так что не все так просто с дизайном исследования, если только это не принудительный поголовный осмотр. Сообщение отредактировал ИНО - 18.09.2024 - 17:31 |
|
![]() |
![]() |
![]() ![]() |