![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() ![]() |
![]() |
![]()
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 ![]() |
|
|
![]() |
![]() |
![]()
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 ![]() |
Если параметров очень много можно действовать обратным способом включая переменные в модель. Начать с ряда моделей в каждой из которых одна переменная. Потом отобрав те параметры которые лучше всего объясняют данные объединить их в одну модель. К ней добавить по одной оставшиеся невключенными показатели. Ну и все время следить за AIC как только он перестанет падать значит оптимальная модель построена. параметров много. тоесть мне брать к примеру первый из интересующих меня параметр, скажем влияние поступления (первично/повторно) на исход (выжил умер) и смотреть значение р при лог регрессии, дискриминантном анализе при корреляции??? или о каких моделях идет речь? если так то мне тогда так сделать по всем переменным по одному а потом в конце что наиболее подойдет запихнуть в лог регрессию и пусть она из того еще исключит часть переменных? |
|
![]() |
![]() |
![]()
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 ![]() |
а про АIC я все равно не поняла((( даже почитав... в книгах читала что важным является или р или хи-квадрат
![]() |
|
![]() |
![]() |
![]()
Сообщение
#19
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
файлик Вы построили пространство из 2х шкал по расстояниям между 99 переменным. фактически оно в таблице на 39й странице. Что бы посмотреть нет ли связи с целевыми переменными, лучше построить пространство по расстояниям между наблюдениями. И посмотреть куда попадают те 10 случаев исхода. Если они образуют компактную группу (даже в перемешк с другими случаями), то можно надеяться что может быть построена модель для вероятности исходов. Если анализировать все таки в пространстве переменных то надо туда же добавить и ishod. Те кто рядом с ней окажутся ведут себя так же. Конечно 10 случаев откровенно маловато. Может сами данные присоедините виде таблицы или csv? можно было бы посмотреть их подробнее. А то из ворда выковыривать результаты трудновато. ![]() |
|
![]() |
![]() |
![]()
Сообщение
#20
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
параметров много. тоесть мне брать к примеру первый из интересующих меня параметр, скажем влияние поступления (первично/повторно) на исход (выжил умер) и смотреть значение р при лог регрессии, дискриминантном анализе при корреляции??? или о каких моделях идет речь? если так то мне тогда так сделать по всем переменным по одному а потом в конце что наиболее подойдет запихнуть в лог регрессию и пусть она из того еще исключит часть переменных? Да 99 это многовато ![]() Ну значит на первом шаге строите 99 моделей (каждая по одной переменной) лог регрессии с целевой переменной исход. Отбираете те из них у которых меньший AIC. Объединяете их пошагово (сначала те переменные которые дали модели с наименьшим AIC) в одну модель, при каждом добавлении смотрите на получившийся AIC. Как только AIC перестал уменьшаться модель получена. ![]() |
|
![]() |
![]() |
![]()
Сообщение
#21
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
а про АIC я все равно не поняла((( даже почитав... в книгах читала что важным является или р или хи-квадрат ![]() мало того что бы модель идеально подходила к данным, важно чтобы она что то могла предсказать. если у Вас 10 точек и полином высокой степени который проходит через все 10 точек то прогностическая сила равно 0 с вероятность 99,9%. критерий Акаике учитывает и точность подгонки модели и ее сложность. В случае полинома он смог бы помочь выбрать оптимальную степень полинома для этих 10 экспериментальных точек. чтобы для 11й точки предсказание было наилучшим. ![]() |
|
![]() |
![]() |
![]()
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 ![]() |
Ну значит на первом шаге строите 99 моделей (каждая по одной переменной) лог регрессии с целевой переменной исход. тоесть если я правильно вас поняла - запускаю лог регресию и по одной переменной перебираю все подряд методом принудительного включения??? а как непосредственно в логрегрессии мне определять AIC? его нужно вручную считать или потом в двухэтапном кластерном анализе??? Отбираете те из них у которых меньший AIC. Объединяете их пошагово (сначала те переменные которые дали модели с наименьшим AIC) в одну модель, при каждом добавлении смотрите на получившийся AIC. имеется в виду уже например методом исключения загнать все оставшиеся и посмотреть или снова по несколько подбирать??? |
|
![]() |
![]() |
![]()
Сообщение
#23
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
а как непосредственно в логрегрессии мне определять AIC? его нужно вручную считать или потом в двухэтапном кластерном анализе??? вот что люди говорят http://spssx-discussion.1045642.n5.nabble....-td3209580.html http://www.talkstats.com/showthread.php/13...stic-Regression PS мда, в R все процедуры как то сами считают. вот что значит "люди для людей делали" ![]() ![]() |
|
![]() |
![]() |
![]()
Сообщение
#24
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
тоесть если я правильно вас поняла - запускаю лог регресию и по одной переменной перебираю все подряд методом принудительного включения??? имеется в виду уже например методом исключения загнать все оставшиеся и посмотреть или снова по несколько подбирать??? 1) да 2) да, оставшиеся загонять постепенно усложняя модель, посматривая на AIC ![]() |
|
![]() |
![]() |
![]() ![]() |