Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> группировка наблюдений
anserovtv
сообщение 18.03.2015 - 13:02
Сообщение #16





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Если я правильно понимаю структуру этих данных, то определяю эти данные как панельные, а не как перекрестные. В этом и основная проблема топикстартера.
Вроде бы панельные данные обычно отличают от временных рядов.

Сообщение отредактировал anserovtv - 18.03.2015 - 16:46
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 18.03.2015 - 19:25
Сообщение #17





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(anserovtv @ 18.03.2015 - 13:02) *
Если я правильно понимаю структуру этих данных, то определяю эти данные как панельные, а не как перекрестные. В этом и основная проблема топикстартера.
Вроде бы панельные данные обычно отличают от временных рядов.


панельные онижеТМ лонгитудинальные онижеТМ кросссекционные и они же временные ряды (причем это принципиальное условие)

признайтесь что вы так шутите?

но зато я придумал второй способ обработать эту таблицу у топик стартера smile.gif

там просто надо для a и b размножить (на двоих) строчку точку всех остальных параметров smile.gif такие данные можно спокойно вставлять в любой метод smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 18.03.2015 - 19:46
Сообщение #18





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Нет , не шучу. Возможно, это просто многозначность терминов в разных подходах. Единого дискурса в матстатистике в нашей стране нет.
Во временных рядах ориентируюсь плохо.
Вы меня не убедили в преобразованиях данных (я и сам предлагал упростить структуру).
Топикстартер так и не пояснил структуру данных, возможно, это военная тайна.
Преобразовать можно любые данные и к ним применять разные методы, только вот как это потом интерпретировать.
Скорее всего, алгоритм существует в простой реализации и применяется где-нибудь в биоинформатике или в химии.
Какую структуру имеют эти данные на Ваш взгляд?

Сообщение отредактировал anserovtv - 18.03.2015 - 22:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 18.03.2015 - 22:18
Сообщение #19





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(anserovtv @ 18.03.2015 - 19:46) *
Нет , не шучу. Возможно, это просто многозначность терминов в разных подходах. Единого дискурса в матстатистике в нашей стране нет.
Во временных рядах ориентируюсь плохо.
Вы меня не убедили в преобразованиях данных (я и сам предлагал упростить структуру).
Топикстартер так и не пояснил структуру данных, возможно, это военная тайна.
Преобразовать можно любые данные и к ним применять разные методы, только вот как это потом интерпретировать.
Скорее всего, алгоритм существует в простой реализации и применяется где-нибудь в биоинформатике или в химии.
Какую структуру имеют эти данные на Ваш взгляд?


1. И русскоязычное и англоязычное определение панельных данных практически совпадает.

2. Топикстартер вообще то привел даже кусок своих реальных данных.

PS ещё раз посмотрел, ничего сложного на самом деле, просто посчитать PCA для a, пометить в это же пространство b с помощью predict(); и нарисовать стрелочки от a к b... на получившуюся картину надо помедитировать и выдвинутые гипотезы потом подоказывать smile.gif

Сообщение отредактировал p2004r - 18.03.2015 - 22:28


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 18.03.2015 - 22:45
Сообщение #20





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Да, возможно и так. Данные я видел. Полагаю. что многомерное шкалирование будет работать лучше чем PCA - больше исходной информации сохранится и можно пытаться интерпретировать шкалы.Опять же можно оценивать качество моделей: RSQ обычно больше 0,9. а стресс маленький. Вычислить расстояния между строками и по ним построить модели МШ.
Где-то читал о том, что можно вручную (в графическом виде) накладывать, поворачивать (!) и вычислять расстояния-отклонения для двух моделей
многомерного шкалирования для одних и тех же объектов на разных этапах.
Полагаю, что если и сравнивать, то по таблицам координат.

Я об этом подходе писал выше.

Если бы были полные данные, можно было бы построить модели для а и b разными методами и выбрать метод, при котором модели наиболее похожи.

Сообщение отредактировал anserovtv - 19.03.2015 - 10:12
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 18.03.2015 - 23:10
Сообщение #21





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Если принять, что в двумерном (R2) пространстве Фактор-Кофактор определены две последовательности a и b, то каждому наблюдению вместо двух векторов можно (?) поставить в соответствие их свертку, затем 20 полученных сверток кластеризовать, пока не надоест.

Сообщение отредактировал 100$ - 18.03.2015 - 23:19
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему