Как определить принадлежность к выборке

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Как определить принадлежность к выборке

nastushka Просмотр профиля	25.08.2015 - 20:37 Сообщение #1
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375	Даже не знаю как вопрос сформулировать:) Есть такие критерии, как Шапиро-Уилка, Колмогорова-Смирнова, но они смотрят отличается ли распределение выборки по переменной от теоретического. А как мне посмотреть принадлежность человека к выборке? Т.е., допустим есть 200 человек в наборе данных и каждый из них может относится как бы к отдельной выборке. Т.е. из 200 человек можно выделить 3 выборки (или сколько там) и это важно учитывать при построении модели т.к., если в модель брать все подряд можно получить некачественные или некорректные модели. В модель нужно брать только однородные наблюдения. Но как определить какие наблюдения (люди) относятся к одной выборке. Думаю кластерный анализ тут будет упрощенным методом. Может есть что-то более стоящее. Надеюсь мой вопрос понятен:)))

Ответов

nokh Просмотр профиля	26.08.2015 - 18:55 Сообщение #2
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(nastushka @ 25.08.2015 - 22:37) Даже не знаю как вопрос сформулировать:) Есть такие критерии, как Шапиро-Уилка, Колмогорова-Смирнова ,но они смотрят отличается ли распределение выборки по переменной от теоретического. А как мне посмотреть принадлежность человека к выборке? Т.е. допустим есть 200 человек в наборе данных и каждый из них может относится как бы к отдельной выборке. Т.е. из 200 человек можно выделить 3 выборки (или сколько там) и это важно учитывать при построении модели т.к, если в модель брать все подряд можно получить некачественные или некорректные модели. В модель нужно брать только однородные наблюдения. Но как определить какие наблюдения(люди) относятся к одной выборке. Думаю кластерный анализ тут будет упрощенным методом. Может есть что-то более стоящее. Надеюсь мой вопрос понятен:))) Понятно не всё. Варианты: 1). Показатель для выделения однородных групп один. Тогда нужно строить распределение и в случае гетерогенности материала проводить разделение смеси распределений. Типа как в сообщении #5 отсюда: http://forum.disser.ru/index.php?showtopic=3376 2) Если нужно выделить однородные группы по совокупности показателей, то методов больше. Есть аналогичные 1) подходы: типа ссылки p2004r; делал нечто похожее здесь: http://molbiol.ru/forums/index.php?showtop...t&p=1526151. Можно и кластерный анализ - он здесь вполне уместен, тонкости только в том а) что использовать в качестве расстояния между объектами и б) работать ли с исходными показателями или с факторными метками, полученными после редукции данных с обобщением (чтобы нивелировать влияние на результаты кластеризации коррелированность некоторых покзателей между собой).

Сообщений в этой теме

nastushka Как определить принадлежность к выборке 25.08.2015 - 20:37

p2004r Надеюсь, что понял правильно вопрос http://www.m... 25.08.2015 - 22:33

nastushka тут только картинки:) Буду Вам признательна, если ... 26.08.2015 - 11:01

p2004r Цитата(nastushka @ 26.08.2015 - 11:0... 26.08.2015 - 21:57

nokh Цитата(nastushka @ 25.08.2015 - 22:3... 26.08.2015 - 18:55

anserovtv Для выполнения группировки можно использовать особ... 29.08.2015 - 12:19

nastushka Всех благодарю за ответы. А можно узнать что за пр... 1.09.2015 - 12:22

anserovtv Вот этот продукт http://basegroup.ru/deductor/desc... 1.09.2015 - 12:46

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум