Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> группировка наблюдений
drZub
сообщение 12.03.2015 - 16:01
Сообщение #1





Группа: Пользователи
Сообщений: 11
Регистрация: 2.06.2014
Пользователь №: 26440



Нужно проверсти кластерный анализ. У меня 20 наблюдений, но каждое из них делится на 2. То есть
наблюдение 1
a=0,8765
b=0,645

наблюдение 2
a=0,297
b=0,397

Итак далее. эти a и b не отделимы, их в одном наблюдении надо учитывать.

Но программа не может так работать. Она их воспринимает как разные наблюдения. Как же мне провести кластерный анализ по 20 наблюдениям не разделяя поднаблюдения?

У меня было предположение для каждого наблюдения вывести среднее, но я не знаю насколько это будет точно. Просто не вдаваясь в подробности, 0,87 консистенция раствора. 0,6 и выше это хорошо. ниже плохо. Может быть у одного под 0,9, а у второго раствора 0,3. Среднее тут некорретно.
Тут как бы вещество и ко-вещество.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
anserovtv
сообщение 17.03.2015 - 21:30
Сообщение #2





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Цитата(p2004r @ 17.03.2015 - 20:55) *
Какое отношение имеет последовательность в которой возможны перестановки к данным топикстартера?

Слово перестановка здесь не используется и я не использовал.
Кластерный анализ последовательностей - это интегративный метод , сочетающий в себе анализ последовательностей и кластерный анализ.
Читайте Д. Макленнен и др. SQL Server 2008 Data mining ИАД 2009. стр 373 и далее.
Да , чтобы его использовать, эти данные нужно несколько преобразовать.
В общем случае метод использует и цепи Маркова.
Диаграмма кластеров в SQL будет похожа на диаграмму в Deductor со связями между кластерами. но и с вероятностями перехода (алгоритм Microsoft Sequence Cluctering).
Считаю, что в этом случае данный метод наиболее применим из того, что известно мне. Остальные подходы ( в том числе и мои) можно считать наивными.

Следующий по сложности метод в этом ряду - кластерный анализ временных рядов (здесь применять нельзя).
В Россси , по моим сведениям, этими методами почти никто не занимается.

Сообщение отредактировал anserovtv - 17.03.2015 - 21:56
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 17.03.2015 - 21:47
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Здесь нет никакой последовательности (а есть два значения, назвать это последовательностью как то слишком круто, это просто а и b), а указанный вами линк на R пакет ведет именно на модель данных с перестановками, которая применяется в случае множественного ранжирования (типа анализа данных выдачи поисковиков и последовательностей у биоинформатиков).


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- drZub   группировка наблюдений   12.03.2015 - 16:01
- - nokh   Цитата(drZub @ 12.03.2015 - 18:01) Н...   12.03.2015 - 17:49
- - drZub   nokh, лучший способ оисать структуру данных, это е...   12.03.2015 - 18:39
|- - nokh   Цитата(drZub @ 12.03.2015 - 20:39) n...   13.03.2015 - 11:55
- - anserovtv   Мне также Ваша задача кажется странной: для класте...   13.03.2015 - 14:42
- - drZub   Спасибо за Ваши подробные ответы. А как мне прави...   13.03.2015 - 18:40
|- - nokh   Цитата(drZub @ 13.03.2015 - 20:40) А...   13.03.2015 - 19:52
- - anserovtv   Двухэтапный кластерный анализ есть в SPSS. КА п...   13.03.2015 - 19:23
- - p2004r   Цитата(drZub @ 12.03.2015 - 16:01) Н...   16.03.2015 - 11:28
- - anserovtv   Кластерный анализ последовательностей Sequence ...   17.03.2015 - 17:39
|- - p2004r   Цитата(anserovtv @ 17.03.2015 - 17:3...   17.03.2015 - 20:55
- - anserovtv   Цитата(p2004r @ 17.03.2015 - 20:55) ...   17.03.2015 - 21:30
|- - p2004r   Здесь нет никакой последовательности (а есть два з...   17.03.2015 - 21:47
|- - anserovtv   Определение последовательности на стр. 374. В мат...   18.03.2015 - 07:08
|- - p2004r   Цитата(anserovtv @ 18.03.2015 - 07:0...   18.03.2015 - 12:42
- - anserovtv   Если я правильно понимаю структуру этих данных, то...   18.03.2015 - 13:02
|- - p2004r   Цитата(anserovtv @ 18.03.2015 - 13:0...   18.03.2015 - 19:25
- - anserovtv   Нет , не шучу. Возможно, это просто многозначность...   18.03.2015 - 19:46
|- - p2004r   Цитата(anserovtv @ 18.03.2015 - 19:4...   18.03.2015 - 22:18
- - anserovtv   Да, возможно и так. Данные я видел. Полагаю. что м...   18.03.2015 - 22:45
- - 100$   Если принять, что в двумерном (R2) пространстве Фа...   18.03.2015 - 23:10


Добавить ответ в эту темуОткрыть тему