![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 15.08.2007 Пользователь №: 4262 ![]() |
Здравствуйте!
Есть такая задача. Имеются 40 некоторых факторов, выраженных в пятибалльной шкале (степень выраженности). Есть наличие/отсутствие заболевания. Как из 40 выделить факторы, наиболее влияющие на диагноз? Логистическая регрессия дает неубедительные результаты из-за большого количества независимых переменных. Как уменьшить размерность по факторам? Ведь факторный анализ и метод главных компонент применим только к непрерывным величинам имеющим нормальное распределение. заранее благодарю |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Ну вообще-то, нормальные клинические испытания делаются на достаточно большом количестве пациентов и их число определяется на основании формулировки гипотезы ПЕРЕД началом исследования - для этого, кстати аспиранты и соискатели пишут аннотацию - формулируют цели и задачи исследования и описывают протокол. Если люди задумываются на этапе планирования у них потом меньше проблем - но это так, о наболевшем, поскольку мы пытаемся втолковать эти очевидные вещи аспирантам первого года уже лет семь, а воз и ныне там - 100 переменных, 10 больных и "сделайте мне красиво".
Теперь по существу. Можно поступить так: у Вас 40 переменных. Вероятность случайно признать одну из них значимой (по определению) 0,05. Чтобы не сделать ошибку во всех 40 случаях, надо уменьшить порог значимости (в Вашем случае до 0,0013) - это называется метод Бонферрони. Соответственно, делаете попарный анализ всех 40 факторов (логистическая регрессия). Отбираете только те из них, которые имеют значимость (в парном анализе) менее 0,0013 и их включаете в многомерную модель. В принципе, можно при отборе переменных считать, что пограничным значением общей экспериментальной ошибки является не 0,05, а 0,1. Тогда отбирать нужно только те переменные, которые имели значимость 0,003. Если так ничего не получается, я бы рекомендовал вначале сформулировать гипотезу о том, какие переменные могут оказывать влияние на исход (на основании анализа литературы) и затем работать только с ними. |
|
![]() |
![]() |
![]() ![]() |