![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 11 Регистрация: 2.06.2014 Пользователь №: 26440 ![]() |
Нужно проверсти кластерный анализ. У меня 20 наблюдений, но каждое из них делится на 2. То есть
наблюдение 1 a=0,8765 b=0,645 наблюдение 2 a=0,297 b=0,397 Итак далее. эти a и b не отделимы, их в одном наблюдении надо учитывать. Но программа не может так работать. Она их воспринимает как разные наблюдения. Как же мне провести кластерный анализ по 20 наблюдениям не разделяя поднаблюдения? У меня было предположение для каждого наблюдения вывести среднее, но я не знаю насколько это будет точно. Просто не вдаваясь в подробности, 0,87 консистенция раствора. 0,6 и выше это хорошо. ниже плохо. Может быть у одного под 0,9, а у второго раствора 0,3. Среднее тут некорретно. Тут как бы вещество и ко-вещество. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 ![]() |
Какое отношение имеет последовательность в которой возможны перестановки к данным топикстартера? Слово перестановка здесь не используется и я не использовал. Кластерный анализ последовательностей - это интегративный метод , сочетающий в себе анализ последовательностей и кластерный анализ. Читайте Д. Макленнен и др. SQL Server 2008 Data mining ИАД 2009. стр 373 и далее. Да , чтобы его использовать, эти данные нужно несколько преобразовать. В общем случае метод использует и цепи Маркова. Диаграмма кластеров в SQL будет похожа на диаграмму в Deductor со связями между кластерами. но и с вероятностями перехода (алгоритм Microsoft Sequence Cluctering). Считаю, что в этом случае данный метод наиболее применим из того, что известно мне. Остальные подходы ( в том числе и мои) можно считать наивными. Следующий по сложности метод в этом ряду - кластерный анализ временных рядов (здесь применять нельзя). В Россси , по моим сведениям, этими методами почти никто не занимается. Сообщение отредактировал anserovtv - 17.03.2015 - 21:56 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
Здесь нет никакой последовательности (а есть два значения, назвать это последовательностью как то слишком круто, это просто а и b), а указанный вами линк на R пакет ведет именно на модель данных с перестановками, которая применяется в случае множественного ранжирования (типа анализа данных выдачи поисковиков и последовательностей у биоинформатиков).
![]() |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 ![]() |
Определение последовательности на стр. 374.
В математике последовательность может состоять из двух чисел, здесь аналогично: начальное состояние - конечное состояние. Судя по описанию алгоритма в этой книге, метод применим и в этом случае. / Цепи Маркова - первого порядка . Рисунок на стр.391./ В алгоритме применяется EM-кластеризация. Сообщение отредактировал anserovtv - 18.03.2015 - 09:54 |
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
![]() Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 ![]() |
Определение последовательности на стр. 374. В математике последовательность может состоять из двух чисел, здесь аналогично: начальное состояние - конечное состояние. Судя по описанию алгоритма в этой книге, метод применим и в этом случае. / Цепи Маркова - первого порядка . Рисунок на стр.391./ В алгоритме применяется EM-кластеризация. ну тогда это подходит и под определение временной серии ![]() ![]() цепь Маркова в данном случае это простая регрессия, частный случай которой (без интерцепта) я и предложил для преобразования данных ![]() |
|
![]() |
![]() |
![]() ![]() |