Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Какой выбрать статистический критерий, если нужно проанализировать частоту пациентов с данным заболеванием за 6 лет?
Диагностик
сообщение 17.09.2024 - 02:20
Сообщение #1





Группа: Пользователи
Сообщений: 147
Регистрация: 4.09.2012
Из: г.Дивногорск
Пользователь №: 24146



Есть 6 групп пациентов соответственно годам. За 1, 2, 3, 4 и 6 года количество примерно одинаковое: 2-4. А за 5-й год - количество 17. Нужно доказать, что данное различие (между 5-м годом и остальными годами) статистически значимое.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 17.09.2024 - 22:17
Сообщение #2





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Диагностик @ 17.09.2024 - 04:20) *
Есть 6 групп пациентов соответственно годам. За 1, 2, 3, 4 и 6 года количество примерно одинаковое: 2-4. А за 5-й год - количество 17. Нужно доказать, что данное различие (между 5-м годом и остальными годами) статистически значимое.

1) Если каждый год пациенты разные (выборки независимые) можно свести данные в таблицу сопряжённости 2х6 со входами: Пациенты (с интересующим признаком и без этого признака) и Годы.

2) Таблицу проверить на однородность с помощью критерия хи-квадрата Пирсона, если это допустимо (слишком много ячеек с малыми частотами). Допустимость проверяется отдельно с помощью критерия Симонова - Цай (программы Игоря такое считают). Можно рассчитать р-значение без опоры на распределение хи-квадрат - процедурой Монте-Карло, здесь другая философия (ресэмплинга) и нет ограничений по минимальному ожидаемому. Если гипотеза однородности отвергается, ну или почти отвергается (скажем р≤0,10), можно разбираться за счёт чего.

3) Для этого проверить ячейки на неслучайность вклада в неоднородность. Для каждой ячейки рассчитываются отклонения Фримана - Тьюки (Freeman-Tukey deviation) или согласованные стандартизованные остатки (остатки Хабермана, Adjusted residuals) с соответствующими р-значениями. Т.к. р-значений много, 12 штук, можно ввести поправку на множественность сравнений. Всё удобно сделать в PAST ( https://www.nhm.uio.no/english/research/resources/past/ ), описание схожей задачи - в примере на стр. 134 Лабораторного практикума ( https://yadi.sk/d/g50i73pt3J6pAa ). Только сейчас уже значимость отклонений рассчитывать отдельно не нужно (там показано как в Excel рассчитать), т.к. текущая версия программы рассчитывает и р-значения и р-значения с поправкой Бонферрони. Если заморочиться, можно выписать все 12 р-значений без поправок и пересчитать р-значения менее консервативным по сравнению с Бонферронии и другим по философии тестом Беньямини - Хохберга, удобно онлайн ( https://tools.carbocation.com/FDR , сортировать не надо, программа отсортирует сама).

При таком подходе для ячейки, где число 17 будет большое положительное значение Adjusted residual с маленьким р-значением.

В качестве описательной статистики можно рассчитать долю пациентов с интересущим признаком с 95%-ным доверительным интервалом. Если она выражается в %, то ДИ считать биномиальный (забыть навсегда про метод Вальда, лучше считать методом Джеффриса, можно онлайн: https://epitools.ausvet.com.au/ciproportion ), если в промилле или ещё меньше - ДИ считать пуассоновский. В материалах к Практикуму (ссылка была выше) есть расчётный файл Excel "Доверительный интервал для долей.xls, который давно делал форумчанин плав, а я раскрасил и добавил метод Джеффриса, но на такое нельзя сослаться, а на онлайновые калькуляторы - можно. Априорный байесовский интервал Джеффриса всегда находится внутри классического точного интервала Клоппера - Пирсона, т.е. он менее консервативный.

Сообщение отредактировал nokh - 17.09.2024 - 22:57
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 18.09.2024 - 08:42
Сообщение #3





Группа: Пользователи
Сообщений: 262
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Позвольте, но о каком "интересующем признаке" или его отсутствии речь? У ТС об этом ни слова. Есть просто кол-во пациентов, привязанное к определенном году и все. Надо доказать что то, что в 5-й год их было больше, чем в любой другой, не случайно.

Если абстрагироваться о том, что последовательные годы - временной ряд, и рассматривать их как независимые категории, то путь решения задачи прост. Суммируем кол-во пациентов за 1-4-й и 6-й года, 5-й не трогаем. Получаем ожидаемую пропорцию 5:1. Сравниваем наблюдаемые значения (сумму за прочие годы и отдельное число за 5-й год) с оной пропорцией при помощи точного биномиального критерия.

Если не абстрагироваться от того, что перед нами временной ряд, то, очевидно, надо решать задачу иначе, но я такими методами не владею. Но, если чего не путаю, называется это поиск аномалий во временных рядах.

Сообщение отредактировал ИНО - 18.09.2024 - 08:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 18.09.2024 - 16:06
Сообщение #4





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(ИНО @ 18.09.2024 - 10:42) *
Позвольте, но о каком "интересующем признаке" или его отсутствии речь? У ТС об этом ни слова.

Не позволю. Общайтесь с нуждающимся в ответе, а не со мной. Я предложил своё решение из того как понял и как обычно бывает, потому что знаю, что никакого "просто количества пациентов" не бывает, это всегда количество из числа родившихся, поступивших, продиагностированных, проживающих в ... в таком-то году и т.п. Если такая информация не собирается, всё печально, т.к. 2 это может быть 50%, а 17 - 0,00005 %.

Сообщение отредактировал nokh - 18.09.2024 - 16:38
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 18.09.2024 - 17:28
Сообщение #5





Группа: Пользователи
Сообщений: 262
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Возможно и так, я в этих ваших пациентах не силен. Но озвученная в стартовом посте задача никаких других данных, помимо числа пациентов в год не содержит - что имеем, то имеем, и на вопрос "значимо ли больше поступило пациентов в 5-м году, чем если бы распределение по годам было случайным", даже по этим скудным данным ответить можем smile.gif
А уж от чего их было больше: из-за эпидемии заболевания али из-за того, что больше родилось или меньше застрелилось - не наше дело. Вообще, думается, далеко не всегда врач бывает в курсе, какую долю пришедшие на прием люди составляют от всех людей, которые могли бы попасть на прием. Помимо рождаемости и смертности, вклад может вносить целая куча скрытых факторов, от сезонной миграции, до пропускной способности системы (вполне возможно, что на 17 попавших в кабинет приходится 20 оставшихся в коридоре и 50, взглянувших на очередь, испугавшихся и ушедших домой заниматься самолечением smile.gif
Даже в случае госпитализации по скорой помощи может быть зависимость от времени приезда бригады, например, если в каком-то году будут ехать в N раз дольше обычного (как за мной прошлым летом), то одним успеет полегчать и они от госпитализации откажутся, а других повезут сразу в морг smile.gif
Так что не все так просто с дизайном исследования, если только это не принудительный поголовный осмотр.

Сообщение отредактировал ИНО - 18.09.2024 - 17:31
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему