Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Проблема уменьшения размерности
Tatiana
сообщение 11.11.2007 - 16:34
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 15.08.2007
Пользователь №: 4262



Здравствуйте!
Есть такая задача.
Имеются 40 некоторых факторов, выраженных в пятибалльной шкале (степень выраженности). Есть наличие/отсутствие заболевания. Как из 40 выделить факторы, наиболее влияющие на диагноз? Логистическая регрессия дает неубедительные результаты из-за большого количества независимых переменных.
Как уменьшить размерность по факторам? Ведь факторный анализ и метод главных компонент применим только к непрерывным величинам имеющим нормальное распределение.
заранее благодарю
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 15.11.2007 - 13:27
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Ну вообще-то, нормальные клинические испытания делаются на достаточно большом количестве пациентов и их число определяется на основании формулировки гипотезы ПЕРЕД началом исследования - для этого, кстати аспиранты и соискатели пишут аннотацию - формулируют цели и задачи исследования и описывают протокол. Если люди задумываются на этапе планирования у них потом меньше проблем - но это так, о наболевшем, поскольку мы пытаемся втолковать эти очевидные вещи аспирантам первого года уже лет семь, а воз и ныне там - 100 переменных, 10 больных и "сделайте мне красиво".
Теперь по существу. Можно поступить так: у Вас 40 переменных. Вероятность случайно признать одну из них значимой (по определению) 0,05. Чтобы не сделать ошибку во всех 40 случаях, надо уменьшить порог значимости (в Вашем случае до 0,0013) - это называется метод Бонферрони. Соответственно, делаете попарный анализ всех 40 факторов (логистическая регрессия). Отбираете только те из них, которые имеют значимость (в парном анализе) менее 0,0013 и их включаете в многомерную модель. В принципе, можно при отборе переменных считать, что пограничным значением общей экспериментальной ошибки является не 0,05, а 0,1. Тогда отбирать нужно только те переменные, которые имели значимость 0,003.
Если так ничего не получается, я бы рекомендовал вначале сформулировать гипотезу о том, какие переменные могут оказывать влияние на исход (на основании анализа литературы) и затем работать только с ними.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему