группировка наблюдений - Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

группировка наблюдений

drZub Просмотр профиля	12.03.2015 - 16:01 Сообщение #1
Группа: Пользователи Сообщений: 11 Регистрация: 2.06.2014 Пользователь №: 26440	Нужно проверсти кластерный анализ. У меня 20 наблюдений, но каждое из них делится на 2. То есть наблюдение 1 a=0,8765 b=0,645 наблюдение 2 a=0,297 b=0,397 Итак далее. эти a и b не отделимы, их в одном наблюдении надо учитывать. Но программа не может так работать. Она их воспринимает как разные наблюдения. Как же мне провести кластерный анализ по 20 наблюдениям не разделяя поднаблюдения? У меня было предположение для каждого наблюдения вывести среднее, но я не знаю насколько это будет точно. Просто не вдаваясь в подробности, 0,87 консистенция раствора. 0,6 и выше это хорошо. ниже плохо. Может быть у одного под 0,9, а у второго раствора 0,3. Среднее тут некорретно. Тут как бы вещество и ко-вещество.

Ответов

anserovtv Просмотр профиля	17.03.2015 - 21:30 Сообщение #2
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927	Цитата(p2004r @ 17.03.2015 - 20:55) Какое отношение имеет последовательность в которой возможны перестановки к данным топикстартера? Слово перестановка здесь не используется и я не использовал. Кластерный анализ последовательностей - это интегративный метод , сочетающий в себе анализ последовательностей и кластерный анализ. Читайте Д. Макленнен и др. SQL Server 2008 Data mining ИАД 2009. стр 373 и далее. Да , чтобы его использовать, эти данные нужно несколько преобразовать. В общем случае метод использует и цепи Маркова. Диаграмма кластеров в SQL будет похожа на диаграмму в Deductor со связями между кластерами. но и с вероятностями перехода (алгоритм Microsoft Sequence Cluctering). Считаю, что в этом случае данный метод наиболее применим из того, что известно мне. Остальные подходы ( в том числе и мои) можно считать наивными. Следующий по сложности метод в этом ряду - кластерный анализ временных рядов (здесь применять нельзя). В Россси , по моим сведениям, этими методами почти никто не занимается. Сообщение отредактировал anserovtv - 17.03.2015 - 21:56

p2004r Просмотр профиля	17.03.2015 - 21:47 Сообщение #3
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Здесь нет никакой последовательности (а есть два значения, назвать это последовательностью как то слишком круто, это просто а и b), а указанный вами линк на R пакет ведет именно на модель данных с перестановками, которая применяется в случае множественного ранжирования (типа анализа данных выдачи поисковиков и последовательностей у биоинформатиков). http://r-statistics.livejournal.com/

anserovtv Просмотр профиля	18.03.2015 - 07:08 Сообщение #4
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927	Определение последовательности на стр. 374. В математике последовательность может состоять из двух чисел, здесь аналогично: начальное состояние - конечное состояние. Судя по описанию алгоритма в этой книге, метод применим и в этом случае. / Цепи Маркова - первого порядка . Рисунок на стр.391./ В алгоритме применяется EM-кластеризация. Сообщение отредактировал anserovtv - 18.03.2015 - 09:54

p2004r Просмотр профиля	18.03.2015 - 12:42 Сообщение #5
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(anserovtv @ 18.03.2015 - 07:08) Определение последовательности на стр. 374. В математике последовательность может состоять из двух чисел, здесь аналогично: начальное состояние - конечное состояние. Судя по описанию алгоритма в этой книге, метод применим и в этом случае. / Цепи Маркова - первого порядка . Рисунок на стр.391./ В алгоритме применяется EM-кластеризация. ну тогда это подходит и под определение временной серии которую почему то "нельзя использовать" цепь Маркова в данном случае это простая регрессия, частный случай которой (без интерцепта) я и предложил для преобразования данных http://r-statistics.livejournal.com/

Сообщений в этой теме

drZub группировка наблюдений 12.03.2015 - 16:01

nokh Цитата(drZub @ 12.03.2015 - 18:01) Н... 12.03.2015 - 17:49

drZub nokh, лучший способ оисать структуру данных, это е... 12.03.2015 - 18:39

nokh Цитата(drZub @ 12.03.2015 - 20:39) n... 13.03.2015 - 11:55

anserovtv Мне также Ваша задача кажется странной: для класте... 13.03.2015 - 14:42

drZub Спасибо за Ваши подробные ответы. А как мне прави... 13.03.2015 - 18:40

nokh Цитата(drZub @ 13.03.2015 - 20:40) А... 13.03.2015 - 19:52

anserovtv Двухэтапный кластерный анализ есть в SPSS. КА п... 13.03.2015 - 19:23

p2004r Цитата(drZub @ 12.03.2015 - 16:01) Н... 16.03.2015 - 11:28

anserovtv Кластерный анализ последовательностей Sequence ... 17.03.2015 - 17:39

p2004r Цитата(anserovtv @ 17.03.2015 - 17:3... 17.03.2015 - 20:55

anserovtv Цитата(p2004r @ 17.03.2015 - 20:55) ... 17.03.2015 - 21:30

p2004r Здесь нет никакой последовательности (а есть два з... 17.03.2015 - 21:47

anserovtv Определение последовательности на стр. 374. В мат... 18.03.2015 - 07:08

p2004r Цитата(anserovtv @ 18.03.2015 - 07:0... 18.03.2015 - 12:42

anserovtv Если я правильно понимаю структуру этих данных, то... 18.03.2015 - 13:02

p2004r Цитата(anserovtv @ 18.03.2015 - 13:0... 18.03.2015 - 19:25

anserovtv Нет , не шучу. Возможно, это просто многозначность... 18.03.2015 - 19:46

p2004r Цитата(anserovtv @ 18.03.2015 - 19:4... 18.03.2015 - 22:18

anserovtv Да, возможно и так. Данные я видел. Полагаю. что м... 18.03.2015 - 22:45

100$ Если принять, что в двумерном (R2) пространстве Фа... 18.03.2015 - 23:10

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум