Помогите разобраться со скаттерплотом |
Здравствуйте, гость ( Вход | Регистрация )
Помогите разобраться со скаттерплотом |
22.01.2018 - 17:25
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 24 Регистрация: 6.12.2017 Пользователь №: 30681 |
Добрый день, подскажите пожалуйста, между переменными Y и X я построил график рассеяния. (обе метрические переменные)
(Но он какой то странный, у него как будто значения поделились на два класса. вот они Скажите могу ли я использовать дерево решений или обычный регрессионный анализ при таком графике. Если да, то всё ок, если нет, то что делать. Я просто решил посоветоваться с более опытными статистиками. Сообщение отредактировал зоо - 22.01.2018 - 17:25 |
|
22.01.2018 - 17:35
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 105 Регистрация: 23.11.2016 Пользователь №: 28953 |
Добрый день, подскажите пожалуйста, между переменными Y и X я построил график рассеяния. (обе метрические переменные) (Но он какой то странный, у него как будто значения поделились на два класса. вот они Скажите могу ли я использовать дерево решений или обычный регрессионный анализ при таком графике. Если да, то всё ок, если нет, то что делать. Я просто решил посоветоваться с более опытными статистиками. Коллега, ! График интересный и полезный. Действительно, очень чётко видны 2 группы наблюдений. Разделяются эти 2 группы примерно по значению горизонтальной оси равному 14. Установите, что это за 2 группы. Далее, рекомендую для двух этих групп сделать раздельные оценки корреляций и регрессий. И затем сделать сравнения, которые описаны по адресу http://www.biometrica.tomsk.ru/comp_aver_5.htm Успеха! |
|
22.01.2018 - 21:11
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Добрый день, подскажите пожалуйста, между переменными Y и X я построил график рассеяния. (обе метрические переменные) (Но он какой то странный, у него как будто значения поделились на два класса. вот они Скажите могу ли я использовать дерево решений или обычный регрессионный анализ при таком графике. Если да, то всё ок, если нет, то что делать. Я просто решил посоветоваться с более опытными статистиками. У Вас - все ОК, за исключением того, что Вы смешали два алгортма, предназначение которых различны. Деревья решений относятся к алгоритмам, решающим задачи классификации, т.е. задачу отнесения объекта к определенному классу. В Вашей задачи необходимости в выполнении этого алгоритма нет, все и так видно "на глаз". А вот в более сложных случаях, например при многомерном анализе, этот этап придется выполнить, причем можно и деревьями, можно и SVM, можно и кNN - вариантов много, для разных случаев. Более того, возможно предварительно еще и выполнив кластеризацию. Но - повторю - в Вашем случае в этом потребности нет. После того, как группы выделены - Вы имеете право выполнить классический регрессионный анализ. Естественно, для каждой группы в отдельности. Удачи. Сообщение отредактировал passant - 22.01.2018 - 21:12 |
|
23.01.2018 - 10:01
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 24 Регистрация: 6.12.2017 Пользователь №: 30681 |
|
|
23.01.2018 - 11:33
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 24 Регистрация: 6.12.2017 Пользователь №: 30681 |
|
|
23.01.2018 - 13:48
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 46 Регистрация: 19.07.2013 Из: Украина, Харьков Пользователь №: 25002 |
Спасибо, коллеги. Подскажите, еще пожалуйста по этому графику. Есть ли метод, чтобы линейно разделить эти точки? Очевидно, что нет. А вообще, Вы можете сформулировать цель исследований? Например, с какой целью Вы строили полином, проходящий через все экспериментальные точки? Или вопрос к началу этой темы. С какой целью Вам нужно строить уравнение регрессии? |
|
23.01.2018 - 15:23
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|
23.01.2018 - 15:29
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 24 Регистрация: 6.12.2017 Пользователь №: 30681 |
100$, спасибо, а по поводу полинома сможете подсказать правильно ли так приближать точки или нет?
|
|
23.01.2018 - 15:35
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Ещё вопросик возник. Я полиномом приблизил точки см. скрин. Правильно ли так приближать или есть более крутое решение \К вопросу о крутизне статистических решений\ А вот в нашей местности даже первоклашки знают, что через N точек единственным образом проходит полином N-1 степени. Куды уж круче... |
|
23.01.2018 - 15:45
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|
23.01.2018 - 17:48
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 46 Регистрация: 19.07.2013 Из: Украина, Харьков Пользователь №: 25002 |
|
|
23.01.2018 - 17:57
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Еще более очевидно, что да. Метод называется Supporting Vector Machine (SVM). Дополню. И не только SVM-методом. Простейшее решение, основанное на школьной математике - перейти из декартовых в полярные координаты представления данных. Где задача решается тем самым методом "линейного разделения". Сообщение отредактировал passant - 23.01.2018 - 18:24 |
|
23.01.2018 - 18:02
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Ещё вопросик возник. Я полиномом приблизил точки см. скрин. Правильно ли так приближать или есть более крутое решение Это - самое НЕ крутое решение. Называется - переобучение. Типичная ошибка юных Сообщение отредактировал passant - 23.01.2018 - 18:04 |
|
24.01.2018 - 22:26
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Господа! А вас что, вот эти весь этот нескончаемый поток "тестов на интеллект", действительно не задрал ещё?
(мне когда все эти глупости стали повторяться "по второму кругу" стало совсем не хорошо) |
|