Здравствуйте,
хотелось бы обратиться за помощью к профессионалам.
Для исследования применяется бимодальная логистическая регрессия.
Зависимая переменная - приверженность либо уход клиента, 3 группы приверженности клиентов, независимых переменных 7: шесть принимают значение от 0 до 2, а одна переменная от 0 до 16; выборка из более 23 тыс. наблюдений. Независимые переменные - мероприятия, в которых участвует клиент.
Задача:1) определить влияние каждого мероприятия на верность/неверность клиента внутри каждой группы, т.е. структуру связей, 2) составить оптимальный набор мероприятий, которые позволят "сохранить" клиента, а также обеспечивать его переход в более выгодную группу.
Анализ усложнен несбалансированностью верных/неверных внутри каждой группы. 2 подхода было использовано: 1) коррекция коэффициентов с учетом привалентности "положительных", 2) оценка модели по ROC кривой без пересчета коэффициентов.
Для каждой группы были найдены odds-ratio для значимых независимых переменных. Значимых мероприятий не более 2-3 из 7-ми.
Вдобавок есть стоимость участия клиента в каждом мероприятии.
Посоветуйте, пожалуйста, какой метод использовать, чтобы составить оптимальный набор мероприятий для каждой группы "верности" клиентов, таким образом, зафиксировать бюджет на следующий год.
Деревья решений не дали результата.
Большое спасибо за внимание.