Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Шаговая регрессия
Pinus
сообщение 8.01.2011 - 14:59
Сообщение #1





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Тут вот сомнения берут...
Допустим, есть выборка объемом 70 ед. Если опираться на придержку - 10 наблюдений на один параметр модели (для получения надежного результата), то можем включить в модель 7 параметров (6 параметров при регрессорах плюс свободный член). Значит ли это, что если мы используем шаговый метод включения переменных (stepwise), то мы можем испытать в анализе только 6 различных регрессоров? Мне думается, что это не так, потому что метод работает последовательным включением переменных (с возможностью исключения), а значит выполнение ограничения по числу параметров модели для конкретного объема выборки следует проверять только на каждом шаге. Стало быть, в первичный набор можно включать, например, и 100 регрессоров, но если на каждом шаге и в конечной модели (на последнем шаге) их будет не более шести, то все OK.
Так ли это, кто как думает?

Сообщение отредактировал Pinus - 8.01.2011 - 14:59
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 10.01.2011 - 10:49
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Pinus @ 8.01.2011 - 14:59) *
Тут вот сомнения берут...
Допустим, есть выборка объемом 70 ед. Если опираться на придержку - 10 наблюдений на один параметр модели (для получения надежного результата), то можем включить в модель 7 параметров (6 параметров при регрессорах плюс свободный член). Значит ли это, что если мы используем шаговый метод включения переменных (stepwise), то мы можем испытать в анализе только 6 различных регрессоров? Мне думается, что это не так, потому что метод работает последовательным включением переменных (с возможностью исключения), а значит выполнение ограничения по числу параметров модели для конкретного объема выборки следует проверять только на каждом шаге. Стало быть, в первичный набор можно включать, например, и 100 регрессоров, но если на каждом шаге и в конечной модели (на последнем шаге) их будет не более шести, то все OK.
Так ли это, кто как думает?

нет, не так, потому что на каждом шаге проверяются все регрессоры и отбирается наиболее сильно связанный с остаточными значениями от предыдущего шага. Кроме того, не забывайте о проблеме множественного тестирования. И еще, правило звучит 10 наблюдений на один параметр или 100, что больше. Соответственно для 7 параметров надо 100 наблюдений.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему