![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 15.10.2017 Пользователь №: 30359 ![]() |
Приветствую всех, моя тема косвенно связано с медицинской. а именно в случае медстраховки.
Подскажите, а можно ли в R методом теории графов найти зависимости между 2-мя людьми, как в этом датасете, например найти связи между одинаковыми фамилиями?
Прикрепленные файлы
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 12 Регистрация: 15.10.2017 Пользователь №: 30359 ![]() |
Не злитесь, это страховая статистика, но по мед.тематики
withTentative = T , что T,что F дает те же переменные. Я ж пробовал, когда курил мануал к боруте и в любом случае, ответ на этот вопрос был бы ценен Цитата А размер выборки в >60000 не смущает?
этот размер критичен для feature selection или лог.регрессия рассчитана на до 60 000 наблюдений? простите , что много вопросов, я стажируюсь, поэтому и возникают проблемы. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
Не злитесь, это страховая статистика, но по мед.тематики withTentative = T , что T,что F дает те же переменные. Я ж пробовал, когда курил мануал к боруте и в любом случае, ответ на этот вопрос был бы ценен 1. Кто "злиться" то? ![]() 2. Борута рисует график _величины_ достоверных эффектов. При выборке стремящейся к бесконечности будет достоверным отличие практически _любой_ малости. Решите какой размер эффекта будет включен в модель путем проверки кроссвалидацией метрики качества подогнанной модели. Но сначала разберитесь с показателями в датасете. Все ранговое и номинальное надо в онехот (думми) переводить, и тогда уже смотреть борутой что выкидывать, а что оставлять. И все равно финальная модель будет состав предикторов иметь подобранный по оптимуму кроссвалидации. ![]() |
|
![]() |
![]() |
![]() ![]() |