![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 6.05.2018 Пользователь №: 31340 ![]() |
Здравствуйте, уважаемые коллеги! Возможно, вопрос не совсем корректно сформулирован, однако для меня важен, прошу помощи. В доступных источниках однозначного ответа не нашел.
Суть вопроса - как влияет ( и влияет ли) проблема множественных сравнений на результаты регрессионного анализа? Если нет, то могут ли результаты регрессионного анализа быть способом ?проверки? значимости результатов других статистических методов? Пример: есть несколько (27) локусов одного гена, задача - оценить их влияние на развитие заболевания. При использовании таблицы сопряженности 2*2 получен ряд ассоциаций. По канонам, данные результаты нужно откорректировать с учетом множественности сравнений (поправка Бонферрони, FDR и тд). При проведении регрессионного анализа в окончательном уравнении оказались те же аллели (предикторы), что и по результатам, полученным первоначально. Можно ли говорить, что мы проверили таким образом наши результаты на состоятельность с учетом множественности сравнений? Спасибо! |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 6.05.2018 Пользователь №: 31340 ![]() |
Попробую сформулировать иначе. Есть результаты исследования влияния достаточно большого количества признаков (12 аллелей, 29 генотипов) на небольшой выборке (130-150 человек), разделенных на подгруппы. Получен ряд ассоциаций. После коррекции на множественность сравнения общепринятыми методами (Бенжамини-Хохберга и тем более Бонферрони) результаты оказались статистически незначимы. Однако при проведении регрессионного анализа с теми же генотипами в качестве предикторов ("наличие-отсутствие"), в окончательное уравнение регрессии вошли именно те генотипы, которые были ассоциированы с заболеванием после расчета по 2*2. Получается противоречие. И неясно, что делать дальше - можно ли публиковать результаты, сославшись на результаты лог. регрессии, или воздержаться, принимая во внимание коррекцию на множественность?
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 ![]() |
Попробую сформулировать иначе. Есть результаты исследования влияния достаточно большого количества признаков (12 аллелей, 29 генотипов) на небольшой выборке (130-150 человек), разделенных на подгруппы. Получен ряд ассоциаций. После коррекции на множественность сравнения общепринятыми методами (Бенжамини-Хохберга и тем более Бонферрони) результаты оказались статистически незначимы. Однако при проведении регрессионного анализа с теми же генотипами в качестве предикторов ("наличие-отсутствие"), в окончательное уравнение регрессии вошли именно те генотипы, которые были ассоциированы с заболеванием после расчета по 2*2. Получается противоречие. И неясно, что делать дальше - можно ли публиковать результаты, сославшись на результаты лог. регрессии, или воздержаться, принимая во внимание коррекцию на множественность? Никакого противоречия нет. Для коэффициентов регрессии тоже есть своя групповая вероятность ошибки первого рода, то есть каждый по отдельности может быть "значим на уровне значимости 0.05", но это не гарантирует, что на том же уровне значимости значима вся совокупность. Опять же: как отбирали предикторы, которые вошли / не вошли? И более глобально: как оценивается качество модели и как принимается решение, что она хорошая? Какое у нее дальнейшее практическое применение? ![]() |
|
![]() |
![]() |
![]() ![]() |