Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Проблема множественных сравнений при регрессионном анализе
Антон Т.
сообщение 6.05.2018 - 12:56
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 6.05.2018
Пользователь №: 31340



Здравствуйте, уважаемые коллеги! Возможно, вопрос не совсем корректно сформулирован, однако для меня важен, прошу помощи. В доступных источниках однозначного ответа не нашел.

Суть вопроса - как влияет ( и влияет ли) проблема множественных сравнений на результаты регрессионного анализа? Если нет, то могут ли результаты регрессионного анализа быть способом ?проверки? значимости результатов других статистических методов?
Пример: есть несколько (27) локусов одного гена, задача - оценить их влияние на развитие заболевания. При использовании таблицы сопряженности 2*2 получен ряд ассоциаций. По канонам, данные результаты нужно откорректировать с учетом множественности сравнений (поправка Бонферрони, FDR и тд). При проведении регрессионного анализа в окончательном уравнении оказались те же аллели (предикторы), что и по результатам, полученным первоначально. Можно ли говорить, что мы проверили таким образом наши результаты на состоятельность с учетом множественности сравнений?

Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Антон Т.
сообщение 6.05.2018 - 17:27
Сообщение #2





Группа: Пользователи
Сообщений: 3
Регистрация: 6.05.2018
Пользователь №: 31340



Попробую сформулировать иначе. Есть результаты исследования влияния достаточно большого количества признаков (12 аллелей, 29 генотипов) на небольшой выборке (130-150 человек), разделенных на подгруппы. Получен ряд ассоциаций. После коррекции на множественность сравнения общепринятыми методами (Бенжамини-Хохберга и тем более Бонферрони) результаты оказались статистически незначимы. Однако при проведении регрессионного анализа с теми же генотипами в качестве предикторов ("наличие-отсутствие"), в окончательное уравнение регрессии вошли именно те генотипы, которые были ассоциированы с заболеванием после расчета по 2*2. Получается противоречие. И неясно, что делать дальше - можно ли публиковать результаты, сославшись на результаты лог. регрессии, или воздержаться, принимая во внимание коррекцию на множественность?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 6.05.2018 - 17:34
Сообщение #3





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Цитата(Антон Т. @ 6.05.2018 - 17:27) *
Попробую сформулировать иначе. Есть результаты исследования влияния достаточно большого количества признаков (12 аллелей, 29 генотипов) на небольшой выборке (130-150 человек), разделенных на подгруппы. Получен ряд ассоциаций. После коррекции на множественность сравнения общепринятыми методами (Бенжамини-Хохберга и тем более Бонферрони) результаты оказались статистически незначимы. Однако при проведении регрессионного анализа с теми же генотипами в качестве предикторов ("наличие-отсутствие"), в окончательное уравнение регрессии вошли именно те генотипы, которые были ассоциированы с заболеванием после расчета по 2*2. Получается противоречие. И неясно, что делать дальше - можно ли публиковать результаты, сославшись на результаты лог. регрессии, или воздержаться, принимая во внимание коррекцию на множественность?

Никакого противоречия нет. Для коэффициентов регрессии тоже есть своя групповая вероятность ошибки первого рода, то есть каждый по отдельности может быть "значим на уровне значимости 0.05", но это не гарантирует, что на том же уровне значимости значима вся совокупность. Опять же: как отбирали предикторы, которые вошли / не вошли? И более глобально: как оценивается качество модели и как принимается решение, что она хорошая? Какое у нее дальнейшее практическое применение?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему