Здравствуйте, гость ( Вход | Регистрация )
15.10.2017 - 16:20
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 15.10.2017 Пользователь №: 30359 |
Приветствую всех, моя тема косвенно связано с медицинской. а именно в случае медстраховки.
Подскажите, а можно ли в R методом теории графов найти зависимости между 2-мя людьми, как в этом датасете, например найти связи между одинаковыми фамилиями?
Прикрепленные файлы
|
|
|
![]() |
![]() |
![]() |
19.10.2017 - 00:11
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 15.10.2017 Пользователь №: 30359 |
Не злитесь, это страховая статистика, но по мед.тематики
withTentative = T , что T,что F дает те же переменные. Я ж пробовал, когда курил мануал к боруте и в любом случае, ответ на этот вопрос был бы ценен Цитата А размер выборки в >60000 не смущает?
этот размер критичен для feature selection или лог.регрессия рассчитана на до 60 000 наблюдений? простите , что много вопросов, я стажируюсь, поэтому и возникают проблемы. |
|
|
![]() |
![]() |
19.10.2017 - 10:53
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Не злитесь, это страховая статистика, но по мед.тематики withTentative = T , что T,что F дает те же переменные. Я ж пробовал, когда курил мануал к боруте и в любом случае, ответ на этот вопрос был бы ценен 1. Кто "злиться" то? 2. Борута рисует график _величины_ достоверных эффектов. При выборке стремящейся к бесконечности будет достоверным отличие практически _любой_ малости. Решите какой размер эффекта будет включен в модель путем проверки кроссвалидацией метрики качества подогнанной модели. Но сначала разберитесь с показателями в датасете. Все ранговое и номинальное надо в онехот (думми) переводить, и тогда уже смотреть борутой что выкидывать, а что оставлять. И все равно финальная модель будет состав предикторов иметь подобранный по оптимуму кроссвалидации. ![]() |
|
|
![]() |
![]() |
med-ick Теория графов в медицине 15.10.2017 - 16:20
passant Цитата(med-ick @ 15.10.2017 - 16... 15.10.2017 - 17:22
med-ick я просто стажер
мне дали задачу
дословно формулиро... 15.10.2017 - 18:14
ogurtsov Цитата(med-ick @ 15.10.2017 - 18... 15.10.2017 - 18:43
p2004r Цитата(med-ick @ 15.10.2017 - 16... 15.10.2017 - 19:13
med-ick p2004r, добрый день. Скажите, а чем тогда обоснова... 16.10.2017 - 11:50
p2004r Цитата(med-ick @ 16.10.2017 - 11... 16.10.2017 - 19:57
med-ick p2004r, не злитесь, пожалуйста, я просто хотел про... 16.10.2017 - 21:39
p2004r Цитата(med-ick @ 16.10.2017 - 21... 17.10.2017 - 00:19
med-ick p2004r, а вы можете вот сказать, в этом массиве да... 17.10.2017 - 14:43
p2004r Цитата(med-ick @ 17.10.2017 - 14... 17.10.2017 - 19:05
med-ick Дано:
Сервер
xeon cpu-e5-1650 3600Ghz
64 гигов опе... 18.10.2017 - 19:34
p2004r А withTentative = T что бы точно всё включило? Ах,... 18.10.2017 - 22:32
med-ick ЦитатаВсе ранговое и номинальное надо в онехот (ду... 19.10.2017 - 12:05
p2004r Цитата(med-ick @ 19.10.2017 - 12... 19.10.2017 - 13:09
med-ick Я не хочу в ручную, как в statistica это сделать?)... 19.10.2017 - 14:21
p2004r Цитата(med-ick @ 19.10.2017 - 14... 19.10.2017 - 15:05
med-ick вряд ли)) У меня чуть-чуть не лицензионная, так бы... 19.10.2017 - 15:10
p2004r Цитата(med-ick @ 19.10.2017 - 15... 19.10.2017 - 15:20
comisora Уважаемые стажёры (им). Вопрос про боруту, rf и по... 24.10.2017 - 16:01
p2004r Цитата(comisora @ 24.10.2017 - 16:01... 24.10.2017 - 20:16
comisora 2p2004r
+сто нефти, спасибо 26.10.2017 - 20:56
med-ick p2004r, а что делать со случайным лесом, например ... 26.10.2017 - 21:46
p2004r Цитата(med-ick @ 26.10.2017 - 21... 27.10.2017 - 20:47![]() ![]() |