Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Дисперсионный анализ
Мария Александро...
сообщение 12.03.2009 - 13:23
Сообщение #1





Группа: Пользователи
Сообщений: 14
Регистрация: 1.03.2009
Пользователь №: 5873



Здравствуйте! у меня вопрос по возможности использования дисперсионного анализа, Ситуация такая. Всего 206 пациентов, они делятся на 5 видов заболевания и 5 возрастных групп, необходимо сравнить средние в этих группах для лейкоцитоза и ЛИИ. Число пациентов в подгруппах разное (от 1 до 50). Количественные переменные распределены ненормально если брать все 206, либо если делить на подгруппы то тоже ненормально. Проверка однородности дисперсий тестом Левена в основном р>0,05, средние и стандартные отклонения коррелируют незначительно. Могу ли я проводить сравнение дисперсионным анализом в Stat 6, либо мне необходимо делить их на группы (в сочетании возраст вид заболевания) и сравнивать непараметрическими методами, если второй вариант, то как учитывать множественные сравнения и если барть критерий Краскела-Уоллиса, то каким потом методом узнать значимо отличающиеся средние. Подойдет ли Ньюмена-Кейлса. С уважением, спасибо за помощь.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Мария Александро...
сообщение 12.03.2009 - 22:34
Сообщение #2





Группа: Пользователи
Сообщений: 14
Регистрация: 1.03.2009
Пользователь №: 5873



Спасибо за помощь. Сразу извиняюсь за глупые вопросы. Программу по Вашей ссылке я скачала, но данные скопировать не удается. Их нужно вводить от руки? Еще она запрашивает уровень лямбда, как его определить. По сайту я искала - нашла в основном ссылки на преобразование Бокса-Кокса, но пока не понятно как его применить. Была ссылка, что в Stat6 есть функция egen, что это и где ее искать не подскажете? Постараюсь еще поискать и вникнуть. Еесли у меня получится то анализ проводить дальше с преобразованным распределением? А значимость различий можно представлять для непреобразованных? И опять же к вопросу о сравнении средних после выявления значимых различий в дисперсионном анализе: если количество разное то какой критерий предпочесть (Ньюмена-Кейлса не подходит)?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 13.03.2009 - 01:23
Сообщение #3





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Лямбду, конечно же руками считать не стоит smile.gif, это - итерационный алгоритм, пусть машины считают. Работа с Rundom Box-Cox неудобная (непривычная), но считает она верно - неоднократно проверял. Нужно скопировать колонку цифр в Statistic'е, в Rundom BС выбрать Edit - Paste ... from clipboard - задать номер колонки (1) и нажать Paste, Close. В настройках задать Sample in var 1, Step value 0,001, Transformed data to var 2, округлять до 3 знаков, можно поставить ниже галочку - построит график значений функции правдоподобия. Поставить галочку в single-sample case (я всегда преобразую как одну выборку, хотя программа может подобрать преобразование и для нормальности и для однородности дисперсий одновременно - нужно читать документацию). Запустить - Run. Программа выдаст лямбду, статистику Шапиро-Уилка, а в колонке 2 появятся преобразованные значения. Далее по обратному - Edit, скопировать в буфер колонку 2 и вставить в Статистике. Далее - Table-Clear и все по новой для второй переменной.
Цитата(Мария Александровна @ 13.03.2009 - 00:34) *
А значимость различий можно представлять для непреобразованных? И опять же к вопросу о сравнении средних после выявления значимых различий в дисперсионном анализе: если количество разное то какой критерий предпочесть (Ньюмена-Кейлса не подходит)?

Смысл преобразований - сделать данные подходящими для модели, заложенной в статистическом тесте. Иначе тест применен неверно. Весь этот сыр-бор с Боксом-Коксом и нужен именно для корректной оценки статистической значимости различий! Для сравнений можно взять и LSD, и Шеффе и др. Они дадут близкие результаты. Если хотите с этим разбираться - посмотрите здесь кратко охарактеризованы все распространенные тесты для запланированных (planned) и незапланированных (post-hoc) сравнений: http://faculty.chass.ncsu.edu/garson/PA765/anova.htm#pair . Но чаще нужно не столько указать какая группа (подгруппа) от какой (каких) отличалась, сколько описать структуру различий. Для этого в первом приближении можно использовать доверительные интервалы, которые Statistica выдает на графиках по умолчанию: если интервалы не пересекаются - различия между этими точками значимы. Т.е. можно смотреть в таблице результатов anova значимые эффекты, строить к ним графики и описывать. В отчет можно вставить рисунок для взаимодействия факторов - все будет понятно. Про функцию egen ничего не знаю.

Сообщение отредактировал nokh - 13.03.2009 - 01:33
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему