![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 6.11.2007 Пользователь №: 4508 ![]() |
Здравствуйте,
Ситуация: есть данные по шести экспериментальным группам. Хочу сделать АНОВУ, знаю что для этого данные должны быть нормально распределены. Вопрос такой: Как смотреть распределение (1) у всех групп по отдельности или (2) у всех групп вместе. Если (1) у 5 групп нормально распределены а у одной нет. Что делать. Что такое Cox-Box трансформация. Как ее сделать. Правда ли что это самая мощная трансформация? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Айвазян пишет, что после преобразования Б-К совокупность удовлетворяет всем требованиям нормальной классической линейной модели регрессии (включая нормальность остатков и однородность дисперсий). Может быть я не правильно понял, или не все знаю, но может быть или один Y, или Y и X вместе? И в том и в другом случае нормализует, а во втором случае еще делает однородными дисперсии остатков и линеаризует. А один X без Y в регрессии похоже нельзя. Что значит заточить под однородность дисперсий? Методом подбора найти нужный эффект? Неоднородность дисперсий часто вызывается тем, что в асимметричных распределениях среднее связано с дисперсией (см. Закс, стр. 466-468). Поэтому нормализация данных "развязывает" среднее и дисперсию и т.о. помимо собственно нормализации ведёт и к повышению однородности дисперсий. Но если причина неоднородности дисперсий не была связана с асимметричностью распределения - преобразование проблему гетероскедастичности не решит. Например известно, что с возрастом шум биологических процессов увеличивается, поэтому теоретически можно предположить существование таких признаков, которые будучи нормально распределены, тем не менее с возрастом увеличивают изменчивость. Тогда классический нормализующий Бокс-Кокс не поможет. Кстати параметр лямбда ищется именно методом подбора, а функцию правдоподобия можно переписать в зависимости от цели: нормализация, увеличение гомоскедастичности, увеличение линейности отклика. Просто обычно речь идёт только о нормализации. ... Но тогда уж пусть Y - будет нормально. Т.е. сначала тянуть до нормальности. Потом тянуть до линейности. А как мы определим ненормальность Y? Построим зависимость, найдём остатки и проанализируем их распределение. А какой функцией мы будем приближать нелинейную зависимость, если её истинная форма нам не известна? - ведь мы и выбрали линеаризирующее преобразование Бокса-Кокса чтобы максимально спрямить неизвестную функцию. Если выберем для криволинейной зависимости прямую - остатки будут помимо вариабельности Y содержать также отклонения от линейности, а это помешает правильно нормализовать Y. Выходит сначала нужно линеаризовать зависимость преобразованием X, а уже затем подбирать нормализующее преобразование для Y. Но тогда, учитывая ненормальность Y линеаризация будет сделана с погрешностью. Такой вот замкнутый круг. Поэтому и написал, что вопрос - на засыпку. |
|
![]() |
![]() |
![]() ![]() |