Цитата(зоо @ 22.01.2018 - 17:25)

Добрый день, подскажите пожалуйста, между переменными Y и X я построил график рассеяния. (обе метрические переменные)
(Но он какой то странный, у него как будто значения поделились на два класса. вот они
Скажите могу ли я использовать дерево решений или обычный регрессионный анализ при таком графике. Если да, то всё ок, если нет, то что делать.
Я просто решил посоветоваться с более опытными статистиками.
У Вас - все ОК, за исключением того, что Вы смешали два алгортма, предназначение которых различны.
Деревья решений относятся к алгоритмам, решающим задачи классификации, т.е. задачу отнесения объекта к определенному классу. В Вашей задачи необходимости в выполнении этого алгоритма нет, все и так видно "на глаз". А вот в более сложных случаях, например при многомерном анализе, этот этап придется выполнить, причем можно и деревьями, можно и SVM, можно и кNN - вариантов много, для разных случаев. Более того, возможно предварительно еще и выполнив кластеризацию. Но - повторю - в Вашем случае в этом потребности нет.
После того, как группы выделены - Вы имеете право выполнить классический регрессионный анализ. Естественно, для каждой группы в отдельности.
Удачи.