Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Как определить принадлежность к выборке

Автор: nastushka 25.08.2015 - 20:37

Даже не знаю как вопрос сформулировать:) Есть такие критерии, как Шапиро-Уилка, Колмогорова-Смирнова, но они смотрят отличается ли распределение выборки по переменной от теоретического.
А как мне посмотреть принадлежность человека к выборке? Т.е., допустим есть 200 человек в наборе данных и каждый из них может относится как бы к отдельной выборке.
Т.е. из 200 человек можно выделить 3 выборки (или сколько там) и это важно учитывать при построении модели т.к., если в модель брать все подряд можно получить некачественные или некорректные модели.
В модель нужно брать только однородные наблюдения. Но как определить какие наблюдения (люди) относятся к одной выборке.
Думаю кластерный анализ тут будет упрощенным методом. Может есть что-то более стоящее.
Надеюсь мой вопрос понятен:)))

Автор: p2004r 25.08.2015 - 22:33

Надеюсь, что понял правильно вопрос smile.gif

http://www.mixmod.org/article.php3?id_article=25&lang=en

Автор: nastushka 26.08.2015 - 11:01

тут только картинки:) Буду Вам признательна, если пару слов обозначите о методе) Я предпочитаю почитать описание))) Но судя по названию возможно ручь идет о смешанных моделях)

Автор: nokh 26.08.2015 - 18:55

Цитата(nastushka @ 25.08.2015 - 22:37) *
Даже не знаю как вопрос сформулировать:) Есть такие критерии, как Шапиро-Уилка, Колмогорова-Смирнова ,но они смотрят отличается ли распределение выборки по переменной от теоретического. А как мне посмотреть принадлежность человека к выборке? Т.е. допустим есть 200 человек в наборе данных и каждый из них может относится как бы к отдельной выборке. Т.е. из 200 человек можно выделить 3 выборки (или сколько там) и это важно учитывать при построении модели т.к, если в модель брать все подряд можно получить некачественные или некорректные модели. В модель нужно брать только однородные наблюдения. Но как определить какие наблюдения(люди) относятся к одной выборке. Думаю кластерный анализ тут будет упрощенным методом. Может есть что-то более стоящее.
Надеюсь мой вопрос понятен:)))

Понятно не всё. Варианты:
1). Показатель для выделения однородных групп один. Тогда нужно строить распределение и в случае гетерогенности материала проводить разделение смеси распределений. Типа как в сообщении #5 отсюда: http://forum.disser.ru/index.php?showtopic=3376
2) Если нужно выделить однородные группы по совокупности показателей, то методов больше. Есть аналогичные 1) подходы: типа ссылки p2004r; делал нечто похожее здесь: http://molbiol.ru/forums/index.php?showtopic=553421&view=findpost&p=1526151. Можно и кластерный анализ - он здесь вполне уместен, тонкости только в том
а) что использовать в качестве расстояния между объектами и
б) работать ли с исходными показателями или с факторными метками, полученными после редукции данных с обобщением (чтобы нивелировать влияние на результаты кластеризации коррелированность некоторых покзателей между собой).

Автор: p2004r 26.08.2015 - 21:57

Цитата(nastushka @ 26.08.2015 - 11:01) *
тут только картинки:) Буду Вам признательна, если пару слов обозначите о методе) Я предпочитаю почитать описание))) Но судя по названию возможно ручь идет о смешанных моделях)


прямо в меню сайта по ссылке есть вот такой pdf http://www.mixmod.org/IMG/pdf/statdoc_2014.pdf

Автор: anserovtv 29.08.2015 - 12:19

Для выполнения группировки можно использовать особые методы, которые часто дают более хорошие результаты (по сравнению с традиционным кластерным анализом):
ЕМ- кластеризацию и самоорганизующиеся карты Кохонена с интерактивной визуализацией (!) групп.
Для создания качественной выборки можно использовать сэмплинг и др.
По этим методам имеется отечественный программный продукт высокого качества (есть демоверсия).
Я бы начал с более простого - двухэтапного кластерного анализа для автоматического определения числа кластеров и качества кластеризации,
создания кластерных профилей и др.
.

Автор: nastushka 1.09.2015 - 12:22

Всех благодарю за ответы.
А можно узнать что за продукт?

Автор: anserovtv 1.09.2015 - 12:46

Вот этот продукт http://basegroup.ru/deductor/description

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)