Здравствуйте, гость ( Вход | Регистрация )
13.08.2009 - 15:57
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 1 Регистрация: 13.08.2009 Из: Харьков Пользователь №: 6190 |
Всем доброго времени суток!
Помогите, пожалуйста, в следующей проблеме: есть результаты выборки по 50 тестам, которые делятся на 5 категорий по десять тестов в каждой. Я хочу получить значение выборки для каждой категории отдельно взяв среднее по соответствующим десяти тестам (чтобы использовать их в дальнейшем анализе). Но проблема состоит в том, что в 4 категориях тесты измеряются в 5-ти бальной метрической шкале, и тут все нормально, а в оставшейся категории все тесты измеряются в различных шкалах (при этом,как метрических, так и порядковых). Могу ли я применить к ним какое-нибудь преобразование так, чтобы они тоже стали измерятся в единой шкале (5-ти бальной)? Если да, то какое и как его применить? И еще есть вопрос с этим связанный: а как влияют линейные преобразования данных на ANOVA и регрессионный анализ? Просто я пробовал применять линейные преобразования в описанной выше ситуации (после чего делал АNOVA и регрессию), и очень сомневаюсь в достоверности и правильности полученных результатов... Зараннее спасибо! |
|
|
![]() |
![]() |
![]() |
16.08.2009 - 04:57
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
По дисперсионному и регрессионному анализу еще добавлю, что нет никаких теоретических обоснований почему должны использоваться исходные сырые данные, а не какие-либо функции от них. Но преобразования просто необходимы, чтобы привести данные в соответствие с той статистической моделью, которая будет использована в ходе анализа. Поэтому, если преобразование выбрано верно - в результатах не сомневайтесь. Другое дело, что преобразованные данные не всегда удобно представлять на графиках, особенно взаимодействия факторов. Это связано с тем, что единицы измерения на графиках должны быть: (1) понятны и (2) верно отражать результаты анализа. В случае многофакторного anova на графиках с исходными единицами могут появляться взаимодействия факторов, отсутствующие на графиках с преобразованными данными. С преобразованием логарифма все просто - можно сделать ось Y в логарифмическом масштабе, а вот в других случаях нужно выкручиваться ведь не подпишешь ось Y "преобразованные по Боксу-Коксу значения показателя" - люди, работающие с этими показателями не поймут.
По поводу усреднений в пределах группы идея не нравится. Игорь рекомендовал корреляционный подход. Но если данных очень много, а для дальнейшего анализа нужно мало - можно пойти и дальше. Существуют методы редукции данных типа главных компонент и факторного анализа. Все они используют матрицу корреляций и позволяют получить новые обобщающие переменные естественным образом в отличие от искусственного усреднения. |
|
|
![]() |
![]() |
kostya Перевод данных 13.08.2009 - 15:57
Игорь Сначала по теме - нет, нельзя. Единицы измерения з... 15.08.2009 - 18:13
avorotniak Комментарии по поводу влияния шкалы измерений на л... 15.08.2009 - 23:18![]() ![]() |