Автор: Zamira 19.06.2018 - 11:28
Добрый день! Суть исследования в оценке влияния биомаркеров в ранней диагностике диаб. болезни почек. При проведении РОК-анализа некоторые биомаркеры показали хорошие результаты чувст-ти и спец-ти, площади под криво по сравнению со стандартным методом диагностики патологии (альбуминурией). Сейчас есть мысль оценить вклад комбинации этих биомаркеров в развитие нефропатии. Пациентов из группы здорового контроля закодировала "0", больных с уже установленной нефропатией "1". пр проведении логист. регрессии получены след. результаты. Буду благодарна за помощь в интерпретации данных!
Автор: p2004r 19.06.2018 - 12:52
"Кочережек"(С)"Наблюденные"(С)
А данные где?
Автор: 100$ 19.06.2018 - 13:03
Цитата
Суть исследования в оценке влияния биомаркеров в ранней диагностике диаб. болезни почек.
Да, это - бродячий сюжет в нефрологии. Складывается ощущение, что все нефрологи поголовно беременны идеей что-то там "ранне диагностировать", таращась до рези в глазах на все эти цитокины, интерлейкины и пр. Вот только убедительных результатов как не было, так и нет. Глядя на их публикации устанешь хохотать.
У вас - все то же самое, только еще смешнее: простая регрессия на константу прекрасно распознает всех ваших больных (скриншот 1).
Безо всяких там маркеров.
А добавление маркеров (скриншот 2) сделало незначимой даже константу.
Позвольте дальше не продолжать.
Автор: leo_biostat 19.06.2018 - 13:29
Цитата(Zamira @ 19.06.2018 - 11:28)
....
Буду благодарна за помощь в интерпретации данных!
Zamira,
!
Во-первых, то что Вы предлагаете интерпретировать, это не "данные". А результаты анализа
данных. Т.е. анализа БД.
Во-вторых, эти результаты весьма примитивны для интепретации. Тем более что этот результат получен
в SPSS, который не продуктивен для логистической регрессии. Более того, для достижения цели исследования
при анализе БД методом логистической регрессии, следует получать не единственное уравнение, а целый набор таких
уравнений. Причем с разными наборами предикторов в этих уравнениях. Например, использую этот метод для разных заказчиков,
как медиков и биологов, так и технических исследователей, я получаю обычно 5-15 уравнений по каждой задаче.
А нередко и до 25 уравнений. И каждое из таких уравнений имеет хороший набор показателей, что позволяет из всех
уравнений самому заказчику выбирать 2-3 лучших уравнения. В приложении "Logit_ 1.png" показаны признаки, вошедшие
предикторами в уравнение. Важным показателем для этих предикторов являются стандартизованные коэффициенты.
Также в результатах приводится и процент конкордации. Так для приведённого примера уравнения он равен 80%.
А самое оптимальное сделать ещё и таблицу сопряжённости, отражающую фактическую и предсказанную по уравнению
принадлежность наблюдений к сравниваемым группам. Пример такой таблицы привожу в приложении "Logit_ 2.png".
Zamira!
Рекомендую Вам почитать серию 10 статей по
http://www.biometrica.tomsk.ru/logit_0.htm.
Успеха!
Автор: Zamira 20.06.2018 - 18:28
Цитата(100$ @ 19.06.2018 - 13:03)
У вас - все то же самое, только еще смешнее:
Рада, что доставила Вам повод посмеяться.
Цитата(leo_biostat @ 19.06.2018 - 13:29)
Рекомендую Вам почитать серию 10 статей по http://www.biometrica.tomsk.ru/logit_0.htm.
Спасибо!
[Overquoting deleted]
Автор: ogurtsov 1.07.2018 - 21:06
Цитата(leo_biostat @ 19.06.2018 - 13:29)
И каждое из таких уравнений имеет хороший набор показателей, что позволяет из всех
уравнений самому заказчику выбирать 2-3 лучших уравнения.
Показатели хорошие, и уравнения восхитительные, но какова их прогностическая ценность? Интересуют метрики на отложенной выборке, а еще лучше - "в продакшене".