Цитата(_alena_ @ 21.11.2011 - 17:44)

скорее всего оно бы использовалось не для анализа, а просто для общих сведений, как айдишка. а вообще задача немного поменялась.... сказали из базы проанализировать 4 столбца. к примеру инфаркт миокарда. и найти какие то зависящие факторы. из этого сделать выборку и посмотреть будет ли достаточное количество данных.
просто по литературе (запомнилось) обычно встречаешь что учитывают день недели и сезон года, это как я понимаю считается вполне влияющим фактором на исход операции. еще бывает ситуация повторных операций, но здесь ситуация другая.
просто так запихивать в glm() (generalized linear models) предикторы явно не стоит. сейчас понятно что имеет место зависимая бинарная --- выжил-нет.
как я понял мы ищем что связано с этой переменной? (и её в самом файле с примером данных нет?)
тогда нам надо подготовить предикторы,
Код
> read.csv2("файл с данными.csv")
ID Familia Vozrast Data_operatsii Pol
1 13 Абдула?в 72 24.06.2010 Мужской
2 506 Бунчук 57 17.12.2010 Мужской
3 862 Гладчук 85 01.06.2010 Мужской
4 951 Горбенко 60 11.05.2010 Мужской
5 2163 Крoт 56 15.12.2010 Мужской
HronichZabol_Legkih Nevrolgiya PerenOperatsii
1 нет нет да
2 лёгкой степени нет нет
3 тяжёлые (требующие ингаляционную гормонотерапию) нет да
4 средней степени да да
5 тяжёлые (требующие ингаляционную гормонотерапию) нет да
Stenokardiya Vremya_posle_posled_IM Gipertrof_L_ZH IM
1 напряжения+покоя нет умеренная нет
2 напряжения нет умеренная нет
3 напряжения+покоя нет умеренная нет
4 напряжения нет умеренная нет
5 нет нет умеренная нет
например словесно записана степень проявления HronichZabol_Legkih. если это степень проявления и все уровни нарастают от нет, то надо её преобразовать в ранговую величину. "нет" - 0, "легкая" - 1 и т.д. (при этом если гормонотерапия приписывается к разным уровням, то это выносится в отдельный бинарный признак).
аналогично преобразуется Gipertrof_L_ZH, тоже в ранговую величину.
если это все уровни у стенокардии то её тоже в ранговую
наиболее трудно с Vremya_posle_posled_IM. "нет" и время очень даже различные вещи что бы быть в одной переменной. тут надо думать как это представить.