Форум врачей-аспирантов > Какой выбрать статистический критерий, если нужно проанализировать частоту пациентов с данным заболеванием за 6 лет?

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: Какой выбрать статистический критерий, если нужно проанализировать частоту пациентов с данным заболеванием за 6 лет?

Форум врачей-аспирантов > Разделы форума > Медицинская статистика

Диагностик

17.09.2024 - 02:20

Есть 6 групп пациентов соответственно годам. За 1, 2, 3, 4 и 6 года количество примерно одинаковое: 2-4. А за 5-й год - количество 17. Нужно доказать, что данное различие (между 5-м годом и остальными годами) статистически значимое.

nokh

17.09.2024 - 22:17

Цитата(Диагностик @ 17.09.2024 - 04:20)

1) Если каждый год пациенты разные (выборки независимые) можно свести данные в таблицу сопряжённости 2х6 со входами: Пациенты (с интересующим признаком и без этого признака) и Годы.

2) Таблицу проверить на однородность с помощью критерия хи-квадрата Пирсона, если это допустимо (слишком много ячеек с малыми частотами). Допустимость проверяется отдельно с помощью критерия Симонова - Цай (программы Игоря такое считают). Можно рассчитать р-значение без опоры на распределение хи-квадрат - процедурой Монте-Карло, здесь другая философия (ресэмплинга) и нет ограничений по минимальному ожидаемому. Если гипотеза однородности отвергается, ну или почти отвергается (скажем р≤0,10), можно разбираться за счёт чего.

3) Для этого проверить ячейки на неслучайность вклада в неоднородность. Для каждой ячейки рассчитываются отклонения Фримана - Тьюки (Freeman-Tukey deviation) или согласованные стандартизованные остатки (остатки Хабермана, Adjusted residuals) с соответствующими р-значениями. Т.к. р-значений много, 12 штук, можно ввести поправку на множественность сравнений. Всё удобно сделать в PAST ( https://www.nhm.uio.no/english/research/resources/past/ ), описание схожей задачи - в примере на стр. 134 Лабораторного практикума ( https://yadi.sk/d/g50i73pt3J6pAa ). Только сейчас уже значимость отклонений рассчитывать отдельно не нужно (там показано как в Excel рассчитать), т.к. текущая версия программы рассчитывает и р-значения и р-значения с поправкой Бонферрони. Если заморочиться, можно выписать все 12 р-значений без поправок и пересчитать р-значения менее консервативным по сравнению с Бонферронии и другим по философии тестом Беньямини - Хохберга, удобно онлайн ( https://tools.carbocation.com/FDR , сортировать не надо, программа отсортирует сама).

При таком подходе для ячейки, где число 17 будет большое положительное значение Adjusted residual с маленьким р-значением.

В качестве описательной статистики можно рассчитать долю пациентов с интересущим признаком с 95%-ным доверительным интервалом. Если она выражается в %, то ДИ считать биномиальный (забыть навсегда про метод Вальда, лучше считать методом Джеффриса, можно онлайн: https://epitools.ausvet.com.au/ciproportion ), если в промилле или ещё меньше - ДИ считать пуассоновский. В материалах к Практикуму (ссылка была выше) есть расчётный файл Excel "Доверительный интервал для долей.xls, который давно делал форумчанин плав, а я раскрасил и добавил метод Джеффриса, но на такое нельзя сослаться, а на онлайновые калькуляторы - можно. Априорный байесовский интервал Джеффриса всегда находится внутри классического точного интервала Клоппера - Пирсона, т.е. он менее консервативный.

ИНО

18.09.2024 - 08:42

Позвольте, но о каком "интересующем признаке" или его отсутствии речь? У ТС об этом ни слова. Есть просто кол-во пациентов, привязанное к определенном году и все. Надо доказать что то, что в 5-й год их было больше, чем в любой другой, не случайно.

Если абстрагироваться о том, что последовательные годы - временной ряд, и рассматривать их как независимые категории, то путь решения задачи прост. Суммируем кол-во пациентов за 1-4-й и 6-й года, 5-й не трогаем. Получаем ожидаемую пропорцию 5:1. Сравниваем наблюдаемые значения (сумму за прочие годы и отдельное число за 5-й год) с оной пропорцией при помощи точного биномиального критерия.

Если не абстрагироваться от того, что перед нами временной ряд, то, очевидно, надо решать задачу иначе, но я такими методами не владею. Но, если чего не путаю, называется это поиск аномалий во временных рядах.

nokh

18.09.2024 - 16:06

Цитата(ИНО @ 18.09.2024 - 10:42)

Позвольте, но о каком "интересующем признаке" или его отсутствии речь? У ТС об этом ни слова.

Не позволю. Общайтесь с нуждающимся в ответе, а не со мной. Я предложил своё решение из того как понял и как обычно бывает, потому что знаю, что никакого "просто количества пациентов" не бывает, это всегда количество из числа родившихся, поступивших, продиагностированных, проживающих в ... в таком-то году и т.п. Если такая информация не собирается, всё печально, т.к. 2 это может быть 50%, а 17 - 0,00005 %.

ИНО

18.09.2024 - 17:28

Возможно и так, я в этих ваших пациентах не силен. Но озвученная в стартовом посте задача никаких других данных, помимо числа пациентов в год не содержит - что имеем, то имеем, и на вопрос "значимо ли больше поступило пациентов в 5-м году, чем если бы распределение по годам было случайным", даже по этим скудным данным ответить можем

А уж от чего их было больше: из-за эпидемии заболевания али из-за того, что больше родилось или меньше застрелилось - не наше дело. Вообще, думается, далеко не всегда врач бывает в курсе, какую долю пришедшие на прием люди составляют от всех людей, которые могли бы попасть на прием. Помимо рождаемости и смертности, вклад может вносить целая куча скрытых факторов, от сезонной миграции, до пропускной способности системы (вполне возможно, что на 17 попавших в кабинет приходится 20 оставшихся в коридоре и 50, взглянувших на очередь, испугавшихся и ушедших домой заниматься самолечением

Даже в случае госпитализации по скорой помощи может быть зависимость от времени приезда бригады, например, если в каком-то году будут ехать в N раз дольше обычного (как за мной прошлым летом), то одним успеет полегчать и они от госпитализации откажутся, а других повезут сразу в морг

Так что не все так просто с дизайном исследования, если только это не принудительный поголовный осмотр.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.