![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 ![]() |
всем привет. очень нуждаюсь в помощи и советах.... кто то знаком с multifactor dimensionality reduction??? что можно почитать о том как работать в этой среде? для каких видов данных она предназначена??? а то мне все что встречалось касается генной информации. можно ли применять другие выборки? спасибо
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 ![]() |
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
![]() |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 42 Регистрация: 14.11.2011 Пользователь №: 23301 ![]() |
так время операции в качестве чего будет использоваться? скорее всего оно бы использовалось не для анализа, а просто для общих сведений, как айдишка. а вообще задача немного поменялась.... сказали из базы проанализировать 4 столбца. к примеру инфаркт миокарда. и найти какие то зависящие факторы. из этого сделать выборку и посмотреть будет ли достаточное количество данных. |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
скорее всего оно бы использовалось не для анализа, а просто для общих сведений, как айдишка. а вообще задача немного поменялась.... сказали из базы проанализировать 4 столбца. к примеру инфаркт миокарда. и найти какие то зависящие факторы. из этого сделать выборку и посмотреть будет ли достаточное количество данных. просто по литературе (запомнилось) обычно встречаешь что учитывают день недели и сезон года, это как я понимаю считается вполне влияющим фактором на исход операции. еще бывает ситуация повторных операций, но здесь ситуация другая. просто так запихивать в glm() (generalized linear models) предикторы явно не стоит. сейчас понятно что имеет место зависимая бинарная --- выжил-нет. как я понял мы ищем что связано с этой переменной? (и её в самом файле с примером данных нет?) тогда нам надо подготовить предикторы, Код > read.csv2("файл с данными.csv") ID Familia Vozrast Data_operatsii Pol 1 13 Абдула?в 72 24.06.2010 Мужской 2 506 Бунчук 57 17.12.2010 Мужской 3 862 Гладчук 85 01.06.2010 Мужской 4 951 Горбенко 60 11.05.2010 Мужской 5 2163 Крoт 56 15.12.2010 Мужской HronichZabol_Legkih Nevrolgiya PerenOperatsii 1 нет нет да 2 лёгкой степени нет нет 3 тяжёлые (требующие ингаляционную гормонотерапию) нет да 4 средней степени да да 5 тяжёлые (требующие ингаляционную гормонотерапию) нет да Stenokardiya Vremya_posle_posled_IM Gipertrof_L_ZH IM 1 напряжения+покоя нет умеренная нет 2 напряжения нет умеренная нет 3 напряжения+покоя нет умеренная нет 4 напряжения нет умеренная нет 5 нет нет умеренная нет например словесно записана степень проявления HronichZabol_Legkih. если это степень проявления и все уровни нарастают от нет, то надо её преобразовать в ранговую величину. "нет" - 0, "легкая" - 1 и т.д. (при этом если гормонотерапия приписывается к разным уровням, то это выносится в отдельный бинарный признак). аналогично преобразуется Gipertrof_L_ZH, тоже в ранговую величину. если это все уровни у стенокардии то её тоже в ранговую наиболее трудно с Vremya_posle_posled_IM. "нет" и время очень даже различные вещи что бы быть в одной переменной. тут надо думать как это представить. ![]() |
|
![]() |
![]() |
![]() ![]() |