Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> ОШ и Лог регрессия
Nerbi
сообщение 18.01.2018 - 17:47
Сообщение #1


Дух форума
*

Группа: Пользователи
Сообщений: 7
Регистрация: 10.05.2017
Пользователь №: 29790



Здравствуйте! По результатам расчета ОШ фактор оказывает влияние на прогноз (ОШ 3,03 95% ДИ 1,37-6,67, p=0,005). Однако при построении логистической регрессии (когда анализируется много других факторов, потенциально оказывающих влияние на прогноз и по ОШ, в том числе), он не входит в формулу, а если входит, то ее качество резко ухудшается. Может ли быть такое и с чем это может быть связано? Отмечу, что в исследование включены пожилые пациенты с большим количеством факторов риска и сопутствующей патологией, вероятно они оказывают большее влияние, чем данный фактор...однако он является общеизвестным и доказанным. Верно ли мое предположение или тут ошибка именно в статистической обработке?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 18.01.2018 - 19:06
Сообщение #2


Дух форума
*

Группа: Пользователи
Сообщений: 85
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(Nerbi @ 18.01.2018 - 17:47) *
Здравствуйте! По результатам расчета ОШ фактор оказывает влияние на прогноз (ОШ 3,03 95% ДИ 1,37-6,67, p=0,005). Однако при построении логистической регрессии (когда анализируется много других факторов, потенциально оказывающих влияние на прогноз и по ОШ, в том числе), он не входит в формулу, а если входит, то ее качество резко ухудшается. Может ли быть такое и с чем это может быть связано? Отмечу, что в исследование включены пожилые пациенты с большим количеством факторов риска и сопутствующей патологией, вероятно они оказывают большее влияние, чем данный фактор...однако он является общеизвестным и доказанным. Верно ли мое предположение или тут ошибка именно в статистической обработке?



Коллега, hi.gif!

Описываемые Вами уровни результатов, полученных с помощью метода логистической регрессии, весьма существенно зависит и от алгоритма оценки уравнения, а также от объёма БД, количества пропусков в потенциальных предикторах, критического значения уровня стат. значимости для вводимых предикторов, и т.д. Используя метод логистической регрессии уже более 25 лет, отмечу, что в реальных исследованиях продуктивно получать для одного и того же зависимого признака Y, как минимум, 5-10 уравнений. Причём если Y является бинарным, то следует обязательно получать и ROC-кривые для каждого уравнения (см. статью по адресу http://www.biometrica.tomsk.ru/logit_4.htm ). А также получать таблицу сопряжённости 2х2 (или 3х3, 4х4, и т.д.) по фактической и предсказанной принадлежности всех использованных в анализе наблюдений (строк БД). В этом случае Вы увидите, по каким градациям Y уравнение продуктивно, а по каким - не очень. Другим аспектом специфики логистической регрессии является использование качественных (группирующих) потенциальных предикторов, число уровней которых более 2. В этих случаях следует разными методами оценивать, какие группировки следует использовать как отдельный признак с двумя градациям ("Да" и "Нет"). Относительно отрицательного влияния вводимого ОШ. Считаю это действительно непродуктивным подходом. Т.к. продуктивнее использовать не ОШ, а сами признаки, по которым и вычисляется ОШ.

Успеха!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 25.01.2018 - 09:06
Сообщение #3


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Nerbi @ 18.01.2018 - 19:47) *
Здравствуйте! По результатам расчета ОШ фактор оказывает влияние на прогноз (ОШ 3,03 95% ДИ 1,37-6,67, p=0,005). Однако при построении логистической регрессии (когда анализируется много других факторов, потенциально оказывающих влияние на прогноз и по ОШ, в том числе), он не входит в формулу, а если входит, то ее качество резко ухудшается. Может ли быть такое и с чем это может быть связано? Отмечу, что в исследование включены пожилые пациенты с большим количеством факторов риска и сопутствующей патологией, вероятно они оказывают большее влияние, чем данный фактор...однако он является общеизвестным и доказанным. Верно ли мое предположение или тут ошибка именно в статистической обработке?

Помню мы занимались исследованием рисков мочекаменной болезни на Урале. Соискатель докторской для обзора нудно выписал из литературных источников порядка 70 факторов с разной величиной эффекта, но статистически значимо влияющих на риск МКБ. Из них честно выбрал 20 самых сильных и на его взгляд логичных - с ними и работали. Причём для оксалатного уролитиза дерево решений выдало по-сути только 2 фактора риска: (1) жёсткую как приговор генетику и (2) генетическую предрасположенность через метаболизм. Это всё я к тому, что мало ли какие факторы риска являются общеизвестными и доказанными. Люди что захотят найти, то и находят, почти всегда, вопрос только в ресурсах (объёмах выборок).
Ваша ситуация - нормальная, такое быть может и бывает. Если объём выборки хороший (сотни человек), то наблюдаемая картина может быть связана с тем, что при получении согласованных (adjusted) оценок ОШ в ходе логистического регрессионного анализа слабые факторы сходят на нет в окружении более сильных. На меньших выборках велика доля случайности, не люблю множественную логистическую регрессию для объёмов до 100-150 чел.
Если вы выделили фактор, который по-вашему сильно вмешивается в результаты регресии (возраст), можно разбить материал на группы (например, средневозрастных и пожилых) и провести выделение факторов риска в них отдельно, т.е. построить 2 модели. Это увеличит качество прогноза. Говорят (если не ошибаюсь 100$ писал), что есть методы, которые сами предлагают подобные деления, но мне они не известны и наверняка там куча тонкостей для грамотной настройки.

Сообщение отредактировал nokh - 25.01.2018 - 10:02
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему