Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Разработка прогностических критериев риска развития сочетанной патологии
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
sergivani
Добрый день!
Прошу помощи в выборе метода.
В исследовании - 300 человек после воздействия НФ, 100 человек ГК. Цель: разработать критерии для прогноза развития заболеваний у лиц, которые имели воздействие НФ в анамнезе.
Независимы переменные - бинарные, связанные с интенсивностью и временем воздействия НФ, другие НФ в анамнезе.
Зависимая переменная - наличие/отсутствие заболевания. Анализ необходим по 18 нозологиям.
ДА позволил бы (?) выделить те переменные, которые могут прогнозировать развитие конкретного заболевания (каждого из 18-ти) в группе экспонирования. А как можно было бы прогнозировать развитие сочетанной патологии? Как можно было бы объединить результаты ДА по каждой нозологии, чтобы прогнозировать коморбидность?
Спасибо!
ogurtsov
Это чистой воды задача машинного обучения. Концептуально все просто - multilabel (не путать с multiclass) классификация. Но на такой мизерной выборке не разгонишься, надо пробовать всякое и смотреть качество на кросс-валидации (leave-one-out подойдет лучше всего).
nokh
Из классических способов можно таблицы сопряжённости. Сводить в таблицы 2х2: НФ vs ГК, заболевание есть vs нет. По таблицам считать относительный риск (или отношения шансов если потом нужно сравнивать с результатами логистической регрессии). Конечно, по 18 нозологиям качественно не получится, но может парочка хорошо "выстрелит". Для нозологий с установленными значимыми различиями между НФ и ГК копаться дальше, а там уже как покатит. Для оценок эффекта интенсивности и времени НФ остаётся уже меньше материала (только 300). Здесь просится множественная логистическая регрессия, дисперсионный анализ (если ДА это он) в таком дизайне сейчас архаичен.
sergivani
Спасибо! Да, простите, это был действительно дисперсионный анализ.
В результате мультиноминальной логистической регрессии получается уравнение, но для работы врачей ЛПУ по нему считать неудобно.
Актуальна ли еще байесовская модель прогноза с последовательным анализом Вальда с расчетом прогностических коэффициентов по выявленным НФ?
nokh
Цитата(sergivani @ 8.12.2020 - 18:41) *
Спасибо! Да, простите, это был действительно дисперсионный анализ.
В результате мультиноминальной логистической регрессии получается уравнение, но для работы врачей ЛПУ по нему считать неудобно.
Актуальна ли еще байесовская модель прогноза с последовательным анализом Вальда с расчетом прогностических коэффициентов по выявленным НФ?

Про актуальность такой не знаю, нужно вбивать на английском в поиск и смотреть современные западные журналы. Про "удобно-неудобно" не согласен, есть слово "нужно", ну или "хочу". Как-то делали работу с зав. Отделения гнойной хирургии Областной больницы. Это то место в больнице, где пациенты умирают. Тогда смертность достигала около 20-30%, несмотря на хорошее реанимационное отделение и ежесуточный и чаще контроль состояния по куче показателей. Так там успевали обсчитать эти показатели в чём-то типа экселя и отслеживать в динамике 3 шкалы тяжести. Потом, когда перешли на Протокол, стало меньше дерготни и выживаемость увеличилась, но тем не менее... Любую логистическую регрессию очень просто закодировать в экселе, чтобы считать риски. Другое дело, что как показывает практика, эти шкалы работают не оптимальным образом. Диагностическая эффективность выше у методов, работающих не с функциями от данных (типа логитов, пробитов и др.), а с данными непосредственно. В одномерном случае это деление на основе ROC-анализа, в многомерном - деревья решений и алгоритмы последовательного покрытия из машинного обучения, режущие массивы реальных цифр с выработкой древовидных классификаторов и решающих правил типа "if-then". Про рекомендованную ogurtsov'ым технику не читал, но скорее всего это из этой же серии. Кстати все эти штуки очень удобны для практики.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.