Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Сравнение результатов корреляции и классификации
amphipole
сообщение 23.10.2007 - 11:59
Сообщение #1





Группа: Пользователи
Сообщений: 9
Регистрация: 18.08.2007
Пользователь №: 4270



Вопрос по интерпретации результатов корреляционного анализа и Иерархического кластерного анализа. В процессе анализа медицинских данных при помощи SPSS получены результаты корреляции для переменных (больницы) которые показывают что некоторые больницы очень сильно коррелированны между собой (0.96-0.98 с р<0.05). Но затем использую класстерный анализ (среднее расстояние между группами, квадратное евклидово расстояние), получаем, что данные больницы отнесенены к разным классам (искл. составляет только две).
Как это можно обяснить с теоритической точки зрения, возможно ли сопоставлять результаты корреляционного и кластерного анализа?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 26.10.2007 - 09:37
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Нет, просто разные вопросы. Корреляция отвечает на вопрос - а одинаковы ли изменения (однонаправлены ли)? Ну а расстояние - это расстояние. Скажем, Москва и Питер находятся к северу от Душанбе, а Монреаль и Оттава - от Мехико-сити. Направление - одинаковое. Но расстояния могут быть очень разными. Поэтому надо исходить из вопроса - объединять в группы по какому признаку?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
amphipole
сообщение 26.10.2007 - 17:22
Сообщение #3





Группа: Пользователи
Сообщений: 9
Регистрация: 18.08.2007
Пользователь №: 4270



Цитата(плав @ 26.10.2007 - 10:37) *
Нет, просто разные вопросы. Корреляция отвечает на вопрос - а одинаковы ли изменения (однонаправлены ли)? Ну а расстояние - это расстояние. Скажем, Москва и Питер находятся к северу от Душанбе, а Монреаль и Оттава - от Мехико-сити. Направление - одинаковое. Но расстояния могут быть очень разными. Поэтому надо исходить из вопроса - объединять в группы по какому признаку?

Попытаюсь изложить.
Есть данные(в %) по 14 типам заболеваний в 20 больницах. Цель: найти больницы имеющие одинаковую структуру заболеваемости и обьеденить в группы. Вроде все логично. Таким образом признаком являются заболевания выраженные в % для каждой больницы.
Как считаете, какую дистанцию необходимо использовать в данном случае?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему