Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Перевод данных, можно ли переводить разнородные данные в единые единицы измерения?
kostya
сообщение 13.08.2009 - 15:57
Сообщение #1





Группа: Пользователи
Сообщений: 1
Регистрация: 13.08.2009
Из: Харьков
Пользователь №: 6190



Всем доброго времени суток!

Помогите, пожалуйста, в следующей проблеме: есть результаты выборки по 50 тестам, которые делятся на 5 категорий по десять тестов в каждой. Я хочу получить значение выборки для каждой категории отдельно взяв среднее по соответствующим десяти тестам (чтобы использовать их в дальнейшем анализе). Но проблема состоит в том, что в 4 категориях тесты измеряются в 5-ти бальной метрической шкале, и тут все нормально, а в оставшейся категории все тесты измеряются в различных шкалах (при этом,как метрических, так и порядковых). Могу ли я применить к ним какое-нибудь преобразование так, чтобы они тоже стали измерятся в единой шкале (5-ти бальной)? Если да, то какое и как его применить?

И еще есть вопрос с этим связанный: а как влияют линейные преобразования данных на ANOVA и регрессионный анализ? Просто я пробовал применять линейные преобразования в описанной выше ситуации (после чего делал АNOVA и регрессию), и очень сомневаюсь в достоверности и правильности полученных результатов...

Зараннее спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 16.08.2009 - 04:57
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



По дисперсионному и регрессионному анализу еще добавлю, что нет никаких теоретических обоснований почему должны использоваться исходные сырые данные, а не какие-либо функции от них. Но преобразования просто необходимы, чтобы привести данные в соответствие с той статистической моделью, которая будет использована в ходе анализа. Поэтому, если преобразование выбрано верно - в результатах не сомневайтесь. Другое дело, что преобразованные данные не всегда удобно представлять на графиках, особенно взаимодействия факторов. Это связано с тем, что единицы измерения на графиках должны быть: (1) понятны и (2) верно отражать результаты анализа. В случае многофакторного anova на графиках с исходными единицами могут появляться взаимодействия факторов, отсутствующие на графиках с преобразованными данными. С преобразованием логарифма все просто - можно сделать ось Y в логарифмическом масштабе, а вот в других случаях нужно выкручиваться ведь не подпишешь ось Y "преобразованные по Боксу-Коксу значения показателя" - люди, работающие с этими показателями не поймут.
По поводу усреднений в пределах группы идея не нравится. Игорь рекомендовал корреляционный подход. Но если данных очень много, а для дальнейшего анализа нужно мало - можно пойти и дальше. Существуют методы редукции данных типа главных компонент и факторного анализа. Все они используют матрицу корреляций и позволяют получить новые обобщающие переменные естественным образом в отличие от искусственного усреднения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему