Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Трансформация Бокса-Кокса
fruitfly
сообщение 10.12.2007 - 02:46
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 6.11.2007
Пользователь №: 4508



Здравствуйте,
Ситуация: есть данные по шести экспериментальным группам. Хочу сделать АНОВУ, знаю что для этого данные должны быть нормально распределены. Вопрос такой: Как смотреть распределение (1) у всех групп по отдельности или (2) у всех групп вместе. Если (1) у 5 групп нормально распределены а у одной нет. Что делать. Что такое Cox-Box трансформация. Как ее сделать. Правда ли что это самая мощная трансформация?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Игорь
сообщение 16.07.2008 - 09:56
Сообщение #2





Группа: Пользователи
Сообщений: 1141
Регистрация: 10.04.2007
Пользователь №: 4040



Поизучал немного источники по данной новой для себя теме. Ну вот, оказалось все так.
Цитата(nokh @ 13.07.2008 - 18:21) *
>Сходный с представленным выше Плавом алгоритм Заребки нашел тоже в C. Dougherty. Introduction to Econometrics (видно издание другое стр. 167 и без вывода формул): http://www.iaaeg.de/documents/kapitel_5.pdf .Только там не максимизируется коэффициент корреляции x и y, а минимизируется сумма квадратов отклонений от линейной регресии x и y, что аналогично.

Есть русское издание "Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 1999". Причем даже в Сети smile.gif
Цитата(nokh @ 13.07.2008 - 18:21) *
В моем примере преобразование Бокса-Кокса использовалось для другой цели - нормализации распределения (в одной выборке). Если будете разбираться с алгоритмами, подскажите, пожалуйста, автора алгоритма в примере. Встречал также третью разновидность преобразования - программную реализацию алгоритма Б-K с одновременной оптимизацией нормальности и однородности дисперсий (для случая нескольких выборок) в бесплатной программе Rundom-BC: http://pjadw.tripod.com/legacy.htm#j2. Мой ручной расчет совпадает с выдаваемым этой программой для одновыборочного случая (не SAS, конечно, но тоже приятно smile.gif).

Алгоритм практически из статьи Бокса-Кокса "Box G.E.P., Cox D.R. An analysis of transformations // Journal of Royal Statistical Society: Series B (Statistical Methodology), 1964, vol. 26, no. 2, pp. 211-246" с той разницей, что, в отличие от примера, в оригинале (в формуле для логарифмической функции максимального правдоподобия) нет умножения на "ню" (смысл? - разве если не игнорировать константу - вот здесь полная версия ФМП: http://projecteuclid.org/euclid.lnms/121546484) и на n не делится второе слагаемое, а умножается первое. Собственно, для максимизации ФМП все это не имеет никакого значения.
Поиск оптимальной лямбды перебором неэффективен. Можно использовать любой метод оптимизации. Хотя бы метод деления отрезка пополам.

Наверное, неплохо бы сделать и еще ряд преобразований. Хотя бы гиперболический арксинус, который, в отличие от Бокса-Кокса, может производить преобразование не только положительных, но и любых данных. ФМП для гиперболического арксинуса имеет другой вид, нежели для Бокса-Кокса. Для Бокса-Кокса - это кривая типа параболы. Для гиперболического арксинуса - две кривых, симметричных относительно нуля. Лямбда для Бокса-Кокса в наших экспериментах всегда была в интервале от -2 до 2. Для гиперболического арксинуса лямбда находилась в интервале от 0 (не включая) до 1. Источники: http://personal.lse.ac.uk/lintono/downloads/llvtrafo.pdf, http://citeseer.ist.psu.edu/linton97analysis.html. В обоих источниках только, по-моему, небольшая ошибка в ФМП (нет 1/2) и явная ошибка (лямбда должна быть в квадрате) в якобиане для гиперболического арксинуса.

Численные эксперименты показали следующее:

1. Вместо ФМП с успехом можно применить любой критерий проверки нормальности (например, статистику или p-значение критерия Шапиро-Франсиа). Представляется, что это даже более объективная характеристика. ФМП дает лучшую, в рамках рассматриваемой модели, трансформацию. Но "лучшая" еще не значит "верная". Так, некоторые наборы данных, в рамках модели, нельзя трансформировать в данные с нужными свойствами. Например, нормальны ли новые данные, все равно необходимо проверить. Почему бы это не сделать сразу?

2. Возможно организовать трансформацию данных для получения результата с требуемыми свойствами (симметричность, скошенность, функция распределения). Например, требуется симметричность. В качестве критерия используем значимость коэффициента асимметрии. И т.п.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- fruitfly   Трансформация Бокса-Кокса   10.12.2007 - 02:46
- - Игорь   В случае, если распределение не является нормальны...   10.12.2007 - 14:04
- - плав   Рискуя показаться назойливым, все равно повторю - ...   11.12.2007 - 22:21
|- - bubnilkin   Цитата(плав @ 11.12.2007 - 22:21) дл...   11.02.2010 - 02:21
- - Игорь   Если не трудно, просьба указать источники, по кото...   12.12.2007 - 09:10
- - плав   Достаточно полное описание методов трансформации, ...   12.12.2007 - 13:09
- - Игорь   Большое спасибо.   12.12.2007 - 13:16
- - Игорь   Собрал комплект оригинальных источников. А есть л...   12.07.2008 - 16:46
|- - плав   Цитата(Игорь @ 12.07.2008 - 17:46) С...   12.07.2008 - 18:22
- - Игорь   Да, конечно, изучаем. Метод Зарембки оценки парам...   12.07.2008 - 18:49
- - nokh   Цитата(Игорь @ 12.07.2008 - 21:49) ....   13.07.2008 - 13:24
- - Игорь   Спасибо, уважаемый nokh! А вот эта работа Вам...   13.07.2008 - 14:29
- - плав   Кстати, попытаться разобраться в подходах можно пр...   13.07.2008 - 16:26
- - плав   Нуждается в проверке, но, похоже, можно использова...   13.07.2008 - 17:40
- - nokh   >Игорь. Нет не встречалась, да и не знал про та...   13.07.2008 - 18:21
|- - плав   Цитата(nokh @ 13.07.2008 - 19:21) ...   13.07.2008 - 19:52
- - Игорь   Поизучал немного источники по данной новой для себ...   16.07.2008 - 09:56
- - nokh   Большое спасибо за информацию! Доугерти в и-не...   17.07.2008 - 18:28
- - Игорь   Цитата(nokh @ 17.07.2008 - 18:28) По...   18.07.2008 - 08:27
- - Игорь   Цитата(fruitfly @ 10.12.2007 - 02:46...   26.07.2008 - 12:58
|- - плав   Цитата(Игорь @ 26.07.2008 - 13:58) Х...   26.07.2008 - 16:51
- - Игорь   Прошу прощения, что отнимаю внимание собеседников,...   27.07.2008 - 09:09
|- - плав   Цитата(Игорь @ 27.07.2008 - 10:09) П...   27.07.2008 - 10:48
- - Игорь   Цитата(плав @ 26.07.2008 - 16:51) Не...   27.07.2008 - 15:08
|- - плав   Цитата(Игорь @ 27.07.2008 - 16:08) О...   27.07.2008 - 21:54
- - Pinus   Разбираюсь с Боксом-Коксом, в целом технология вро...   5.02.2010 - 10:58
- - Pinus   Нашел еще хороший русский источник по Боксу-Коксу:...   6.02.2010 - 13:52
- - nokh   Цитата(Pinus @ 6.02.2010 - 15:52) На...   7.02.2010 - 10:46
|- - Pinus   Цитата(nokh @ 7.02.2010 - 17:46) Т.о...   7.02.2010 - 12:50
- - Green   > Нормализующее преобразование для Y и линеализ...   7.02.2010 - 13:45
- - nokh   Цитата(Pinus @ 7.02.2010 - 14:50) Ай...   8.02.2010 - 00:35
- - Green   >А как мы определим ненормальность Y? Самым обы...   8.02.2010 - 22:32
|- - nokh   Цитата(Green @ 9.02.2010 - 00:32) ...   8.02.2010 - 23:34
|- - Pinus   Цитата(Green @ 9.02.2010 - 05:32) В ...   10.02.2010 - 11:50
- - Green   Как описывается введение в регрессионную модель? В...   9.02.2010 - 22:30
|- - nokh   Цитата(Green @ 10.02.2010 - 00:30) ....   9.02.2010 - 23:03
|- - Pinus   Цитата(nokh @ 10.02.2010 - 06:03) .....   10.02.2010 - 11:53
|- - nokh   Цитата(Pinus @ 10.02.2010 - 13:53) N...   12.02.2010 - 21:31
- - Green   nokh, Pinus Афифи, Эйзен. Статистический анализ, М...   10.02.2010 - 17:33
|- - Pinus   Цитата(Green @ 11.02.2010 - 00:33) n...   11.02.2010 - 10:03
- - Green   Есть такая центральная предельная теорема, котор...   11.02.2010 - 10:38
- - Pinus   Nokh, спасибо большое за ответ! А то я уже дум...   13.02.2010 - 01:31
- - nokh   Бокс-Кокс для расчёта средних и ДИ Нашёл у себя о...   26.07.2013 - 13:06


Добавить ответ в эту темуОткрыть тему