Здравствуйте, гость ( Вход | Регистрация )
25.08.2015 - 20:37
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375 |
Даже не знаю как вопрос сформулировать:) Есть такие критерии, как Шапиро-Уилка, Колмогорова-Смирнова, но они смотрят отличается ли распределение выборки по переменной от теоретического.
А как мне посмотреть принадлежность человека к выборке? Т.е., допустим есть 200 человек в наборе данных и каждый из них может относится как бы к отдельной выборке. Т.е. из 200 человек можно выделить 3 выборки (или сколько там) и это важно учитывать при построении модели т.к., если в модель брать все подряд можно получить некачественные или некорректные модели. В модель нужно брать только однородные наблюдения. Но как определить какие наблюдения (люди) относятся к одной выборке. Думаю кластерный анализ тут будет упрощенным методом. Может есть что-то более стоящее. Надеюсь мой вопрос понятен:))) |
|
|
![]() |
![]() |
![]() |
26.08.2015 - 18:55
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Даже не знаю как вопрос сформулировать:) Есть такие критерии, как Шапиро-Уилка, Колмогорова-Смирнова ,но они смотрят отличается ли распределение выборки по переменной от теоретического. А как мне посмотреть принадлежность человека к выборке? Т.е. допустим есть 200 человек в наборе данных и каждый из них может относится как бы к отдельной выборке. Т.е. из 200 человек можно выделить 3 выборки (или сколько там) и это важно учитывать при построении модели т.к, если в модель брать все подряд можно получить некачественные или некорректные модели. В модель нужно брать только однородные наблюдения. Но как определить какие наблюдения(люди) относятся к одной выборке. Думаю кластерный анализ тут будет упрощенным методом. Может есть что-то более стоящее. Надеюсь мой вопрос понятен:))) Понятно не всё. Варианты: 1). Показатель для выделения однородных групп один. Тогда нужно строить распределение и в случае гетерогенности материала проводить разделение смеси распределений. Типа как в сообщении #5 отсюда: http://forum.disser.ru/index.php?showtopic=3376 2) Если нужно выделить однородные группы по совокупности показателей, то методов больше. Есть аналогичные 1) подходы: типа ссылки p2004r; делал нечто похожее здесь: http://molbiol.ru/forums/index.php?showtop...t&p=1526151. Можно и кластерный анализ - он здесь вполне уместен, тонкости только в том а) что использовать в качестве расстояния между объектами и б) работать ли с исходными показателями или с факторными метками, полученными после редукции данных с обобщением (чтобы нивелировать влияние на результаты кластеризации коррелированность некоторых покзателей между собой). |
|
|
![]() |
![]() |
nastushka Как определить принадлежность к выборке 25.08.2015 - 20:37
p2004r Надеюсь, что понял правильно вопрос
http://www.m... 25.08.2015 - 22:33
nastushka тут только картинки:) Буду Вам признательна, если ... 26.08.2015 - 11:01
p2004r Цитата(nastushka @ 26.08.2015 - 11:0... 26.08.2015 - 21:57
anserovtv Для выполнения группировки можно использовать особ... 29.08.2015 - 12:19
nastushka Всех благодарю за ответы.
А можно узнать что за пр... 1.09.2015 - 12:22
anserovtv Вот этот продукт http://basegroup.ru/deductor/desc... 1.09.2015 - 12:46![]() ![]() |