spss17 |
Здравствуйте, гость ( Вход | Регистрация )
spss17 |
5.02.2012 - 21:22
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
|
|
5.02.2012 - 21:57
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
Если параметров очень много можно действовать обратным способом включая переменные в модель. Начать с ряда моделей в каждой из которых одна переменная. Потом отобрав те параметры которые лучше всего объясняют данные объединить их в одну модель. К ней добавить по одной оставшиеся невключенными показатели. Ну и все время следить за AIC как только он перестанет падать значит оптимальная модель построена. параметров много. тоесть мне брать к примеру первый из интересующих меня параметр, скажем влияние поступления (первично/повторно) на исход (выжил умер) и смотреть значение р при лог регрессии, дискриминантном анализе при корреляции??? или о каких моделях идет речь? если так то мне тогда так сделать по всем переменным по одному а потом в конце что наиболее подойдет запихнуть в лог регрессию и пусть она из того еще исключит часть переменных? |
|
5.02.2012 - 21:59
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
а про АIC я все равно не поняла((( даже почитав... в книгах читала что важным является или р или хи-квадрат и R2
|
|
5.02.2012 - 22:26
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
файлик Вы построили пространство из 2х шкал по расстояниям между 99 переменным. фактически оно в таблице на 39й странице. Что бы посмотреть нет ли связи с целевыми переменными, лучше построить пространство по расстояниям между наблюдениями. И посмотреть куда попадают те 10 случаев исхода. Если они образуют компактную группу (даже в перемешк с другими случаями), то можно надеяться что может быть построена модель для вероятности исходов. Если анализировать все таки в пространстве переменных то надо туда же добавить и ishod. Те кто рядом с ней окажутся ведут себя так же. Конечно 10 случаев откровенно маловато. Может сами данные присоедините виде таблицы или csv? можно было бы посмотреть их подробнее. А то из ворда выковыривать результаты трудновато. |
|
5.02.2012 - 22:33
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
параметров много. тоесть мне брать к примеру первый из интересующих меня параметр, скажем влияние поступления (первично/повторно) на исход (выжил умер) и смотреть значение р при лог регрессии, дискриминантном анализе при корреляции??? или о каких моделях идет речь? если так то мне тогда так сделать по всем переменным по одному а потом в конце что наиболее подойдет запихнуть в лог регрессию и пусть она из того еще исключит часть переменных? Да 99 это многовато Модель может быть любой, это не влияет на процедуру её оценки. Ну значит на первом шаге строите 99 моделей (каждая по одной переменной) лог регрессии с целевой переменной исход. Отбираете те из них у которых меньший AIC. Объединяете их пошагово (сначала те переменные которые дали модели с наименьшим AIC) в одну модель, при каждом добавлении смотрите на получившийся AIC. Как только AIC перестал уменьшаться модель получена. |
|
5.02.2012 - 22:37
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
а про АIC я все равно не поняла((( даже почитав... в книгах читала что важным является или р или хи-квадрат и R2 мало того что бы модель идеально подходила к данным, важно чтобы она что то могла предсказать. если у Вас 10 точек и полином высокой степени который проходит через все 10 точек то прогностическая сила равно 0 с вероятность 99,9%. критерий Акаике учитывает и точность подгонки модели и ее сложность. В случае полинома он смог бы помочь выбрать оптимальную степень полинома для этих 10 экспериментальных точек. чтобы для 11й точки предсказание было наилучшим. |
|
6.02.2012 - 09:17
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 |
Ну значит на первом шаге строите 99 моделей (каждая по одной переменной) лог регрессии с целевой переменной исход. тоесть если я правильно вас поняла - запускаю лог регресию и по одной переменной перебираю все подряд методом принудительного включения??? а как непосредственно в логрегрессии мне определять AIC? его нужно вручную считать или потом в двухэтапном кластерном анализе??? Отбираете те из них у которых меньший AIC. Объединяете их пошагово (сначала те переменные которые дали модели с наименьшим AIC) в одну модель, при каждом добавлении смотрите на получившийся AIC. имеется в виду уже например методом исключения загнать все оставшиеся и посмотреть или снова по несколько подбирать??? |
|
6.02.2012 - 10:54
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
а как непосредственно в логрегрессии мне определять AIC? его нужно вручную считать или потом в двухэтапном кластерном анализе??? вот что люди говорят http://spssx-discussion.1045642.n5.nabble....-td3209580.html http://www.talkstats.com/showthread.php/13...stic-Regression PS мда, в R все процедуры как то сами считают. вот что значит "люди для людей делали" |
|
6.02.2012 - 10:55
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
тоесть если я правильно вас поняла - запускаю лог регресию и по одной переменной перебираю все подряд методом принудительного включения??? имеется в виду уже например методом исключения загнать все оставшиеся и посмотреть или снова по несколько подбирать??? 1) да 2) да, оставшиеся загонять постепенно усложняя модель, посматривая на AIC |
|