Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Перевод данных, можно ли переводить разнородные данные в единые единицы измерения?
kostya
сообщение 13.08.2009 - 15:57
Сообщение #1





Группа: Пользователи
Сообщений: 1
Регистрация: 13.08.2009
Из: Харьков
Пользователь №: 6190



Всем доброго времени суток!

Помогите, пожалуйста, в следующей проблеме: есть результаты выборки по 50 тестам, которые делятся на 5 категорий по десять тестов в каждой. Я хочу получить значение выборки для каждой категории отдельно взяв среднее по соответствующим десяти тестам (чтобы использовать их в дальнейшем анализе). Но проблема состоит в том, что в 4 категориях тесты измеряются в 5-ти бальной метрической шкале, и тут все нормально, а в оставшейся категории все тесты измеряются в различных шкалах (при этом,как метрических, так и порядковых). Могу ли я применить к ним какое-нибудь преобразование так, чтобы они тоже стали измерятся в единой шкале (5-ти бальной)? Если да, то какое и как его применить?

И еще есть вопрос с этим связанный: а как влияют линейные преобразования данных на ANOVA и регрессионный анализ? Просто я пробовал применять линейные преобразования в описанной выше ситуации (после чего делал АNOVA и регрессию), и очень сомневаюсь в достоверности и правильности полученных результатов...

Зараннее спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 15.08.2009 - 18:13
Сообщение #2





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Сначала по теме - нет, нельзя. Единицы измерения зависят от физики изучаемых параметров. Да и зачем? Пусть одна переменная - в градусах. Другая - в метрах. Что мешает посчитать корреляцию?
Цитата(kostya @ 13.08.2009 - 16:57) *
... в 4 категориях тесты измеряются в 5-ти бальной метрической шкале, и тут все нормально,

Под "метрической", видимо, подразумевается количественная шкала. Поэтому данное утверждение "нормальным" как раз не является, а содержит в себе ошибочную мысль, ибо бальная шкала - порядковая.
Цитата(kostya @ 13.08.2009 - 16:57) *
а в оставшейся категории все тесты измеряются в различных шкалах (при этом,как метрических, так и порядковых). Могу ли я применить к ним какое-нибудь преобразование так, чтобы они тоже стали измерятся в единой шкале (5-ти бальной)? Если да, то какое и как его применить?

Преобразование шкал допустимо, если такое преобразование понижает шкалу. При этом теряется полезная информация, но появляется возможность сделать какие-либо аналитические выводы. Во-вторых, есть методы для анализа данных в различных шкалах (т.е. можно оперировать данными в разных шкалах, не прибегая к преобразованию). К примеру, точечно-бисериальная корреляция.
Цитата(kostya @ 13.08.2009 - 16:57) *
И еще есть вопрос с этим связанный: а как влияют линейные преобразования данных на ANOVA и регрессионный анализ? Просто я пробовал применять линейные преобразования в описанной выше ситуации (после чего делал АNOVA и регрессию), и очень сомневаюсь в достоверности и правильности полученных результатов...

Необходимо смотреть в конкретном случае (что именно и как преобразуется). Есть же программное обеспечение - попробуйте. Это дело считанных секунд.

Сообщение отредактировал Игорь - 15.08.2009 - 18:18


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
avorotniak
сообщение 15.08.2009 - 23:18
Сообщение #3





Группа: Пользователи
Сообщений: 23
Регистрация: 24.07.2009
Пользователь №: 6183



Комментарии по поводу влияния шкалы измерений на линейную регрессию и АNOVA:

В общем матричном виде линейные преобразования регрессоров можно представить как ХА, где Х ? это матрица плана. Отсюда можно легко доказать, что проекционная матрица Р (hat matriх) не зависит от А, то есть является инвариантной к линейным преобразованиям. Поэтому, ни предсказуемые значения отклика (У), ни остатки (residuals) не зависят от линейных преобразований.

Значения коэффициентов линейной регрессии при изменении шкалы изменяются пропорционально обратной матрице А, то есть, если вы умножили регрессор на константу С, то нужно поделить соответствующий коэффициент на ту же константу. Критерий F для значимости регрессии (основная гипотеза ? все коэффициенты равны 0) не зависит от линейных преобразований регрессоров.

АNOVA можно представить в виде модели линейной регрессии, поэтому, используются те же рассуждения, что и для линейной регрессии.

Успехов
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 16.08.2009 - 04:57
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



По дисперсионному и регрессионному анализу еще добавлю, что нет никаких теоретических обоснований почему должны использоваться исходные сырые данные, а не какие-либо функции от них. Но преобразования просто необходимы, чтобы привести данные в соответствие с той статистической моделью, которая будет использована в ходе анализа. Поэтому, если преобразование выбрано верно - в результатах не сомневайтесь. Другое дело, что преобразованные данные не всегда удобно представлять на графиках, особенно взаимодействия факторов. Это связано с тем, что единицы измерения на графиках должны быть: (1) понятны и (2) верно отражать результаты анализа. В случае многофакторного anova на графиках с исходными единицами могут появляться взаимодействия факторов, отсутствующие на графиках с преобразованными данными. С преобразованием логарифма все просто - можно сделать ось Y в логарифмическом масштабе, а вот в других случаях нужно выкручиваться ведь не подпишешь ось Y "преобразованные по Боксу-Коксу значения показателя" - люди, работающие с этими показателями не поймут.
По поводу усреднений в пределах группы идея не нравится. Игорь рекомендовал корреляционный подход. Но если данных очень много, а для дальнейшего анализа нужно мало - можно пойти и дальше. Существуют методы редукции данных типа главных компонент и факторного анализа. Все они используют матрицу корреляций и позволяют получить новые обобщающие переменные естественным образом в отличие от искусственного усреднения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему