Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Стадии заболевания, статистический анализ
lymphoma
сообщение 13.04.2008 - 21:19
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 13.04.2008
Пользователь №: 4958



Здравствуйте, уважаемые форумчане!
Вопрос такой: есть 2 группы больных раком молочной железы (15 и 9 больных), стадии 0, I, IIa, IIb и III. Хочется доказать, что эти группы сопоставимы, т.е. нет статистически значимого различия в распределении по стадиям. Каким образом это можно сделать? Насколько корректно использование U-критерия Манна-Уитни после присвоения стадиям числовых эквивалентов (напр., 0-1, I-2, IIA - 3 и т.д.)
ps работаю в пакете Statistica
pps заранее спасибо за ответы
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Игорь
сообщение 15.04.2008 - 06:44
Сообщение #2





Группа: Пользователи
Сообщений: 1162
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(nokh @ 14.04.2008 - 20:13) *
То что в этих данных есть нулевая ячейка - цветочки. 8 ячеек из 10 имеют частоты меньше 5: действительно любые аппроксимации необоснованы, нужно считать точное значение. Знаю насколько вы любите тоный метод Фишера, но я от его использования практически отказался, как и от хи-квадрат. В этом ориентируюсь на учебник: Sokal R.R., Rohlf F.J. Biometry: the principles and practice of statistics in biological research. ? N-Y: Freeman & Co, 1995. ? 850 p. Согласно ему выделяют три модели анализа таблиц сопряженности 2х2 и RхC:
модель I - маргинальные частоты не фиксированы (задача поиска связи), модель II - фиксированы по одному критерию (задача сравнения процентов или однородности в группах - данный случай) и модель III - фиксированы по обоим критериям. Последняя модель соответствует логике точного метода Фишера, когда изменяют частоты внутри таблицы при фиксированных маргинальных. На практике такая схема может возникнуть при изучении предпочтений, когда фиксированы количества испытуемых и объектов, но неизвестно как они распределятся. Для моделей I и II рекомендуется использовать G-критерий (likelihood ratio). Раньше при малой насыщенности таблиц применяли т.к.Ф., но с появлением точных методов необходимость в нем для моделей I и II отпала. У меня 30-дневная лицензия на StatXact закончилась, а распаковывать образ диска С: - долго. Если не сложно, посмотрите пожалуйста, насколько близки будут точные значения Р для т.к.Ф. и отношения правдоподобия (для отношения правдоподобия и хи-квадрат Пирсона совпадают - проверял раньше).

Численность в ячейке должна быть более 3, 4 или 5 - согласитесь, это неубедительные рекомендации. Вот если бы был объективный критерий, почему хи-квадрат аппроксимация допустима, а почему нет. К счастью, такие критерии есть и называются они диагностиками.
Для рассматриваемых данных:
Диагностика Симонов-Цай
0,32519593 < 0.3 - указывает на потенциальную проблему аппроксимации хи-квадрат
Диагностика Хабермана
0,274178189 < 0.1 - указывает на возможную проблему аппроксимации хи-квадрат

И в самом деле:
Критерий хи-квадрат
2,398845599 p = 0,662835902
Критерий отношения правдоподобия (G2)
2,711690631 p = 0,607170481
Критерий Хеллингера
5,320231259 p = 0,255989003
Критерий Зелтермана
-0,720033289 p = 0,764247749

Все это весьма отличается от точного критерия Фримана-Холтона p = 0,099113272

Если для какой-либо конкретной таблицы аппроксимации по диагностикам получаются допустимыми, что все упомянутые методы дают примерно одинаковый результат.

К программе StatXact приведенные расчеты отношения не имеют, хотя источники использовались.

В Вашей терминологии модель III - это ТМФ и его расширения, модель II - это критерий Барнарда и методы, на данной идее основанные. Методы для таблиц более 2 х 2 для модели II мне неизвестны. Думаю, теоретически возможна реализация критерия Барнарда для таблиц r x c. Вот только практически такой расчет займет очень много времени - современные персональные компьютеры пока не готовы к таким алгоритмам.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- lymphoma   Стадии заболевания, статистический анализ   13.04.2008 - 21:19
- - Игорь   Цитата(lymphoma @ 13.04.2008 - 21:19...   14.04.2008 - 08:28
- - nokh   Присвоить то стадиям ранги можно, и формально срав...   14.04.2008 - 14:50
- - Игорь   Вот еще днем я то же самое написал - о критерии хи...   14.04.2008 - 16:05
- - lymphoma   Боьшое спасибо за подробные ответы; В прикрепленно...   14.04.2008 - 17:21
- - Игорь   Что и оказалось - нулевая ячейка. Единственным при...   14.04.2008 - 17:41
- - nokh   >Игорь. То что в этих данных есть нулевая ячей...   14.04.2008 - 20:13
- - lymphoma   Игорь, спасибо Вам за ответ! Не очень понял: ...   14.04.2008 - 20:20
- - DrgLena   Слабость планирования очевидна. Нельзя сравнивать ...   14.04.2008 - 22:52
- - lymphoma   DrgLena: Спасибо за конструктивную критику. Соглас...   14.04.2008 - 23:26
- - DrgLena   Лимфома? Меланома? Множество характеристик на вход...   15.04.2008 - 00:02
- - Игорь   Цитата(nokh @ 14.04.2008 - 20:13) То...   15.04.2008 - 06:44
- - плав   Коллеги, мне кажется, все немного забыли основную ...   15.04.2008 - 10:26
- - Игорь   Цитата(плав @ 15.04.2008 - 10:26) К ...   15.04.2008 - 10:40
- - плав   По-моему, Вы не поняли. Меня не интересовал хи2, п...   15.04.2008 - 10:46
- - DrgLena   Игорь, мы получили одинаковые статистические вывод...   15.04.2008 - 11:55
- - Игорь   Цитата(плав @ 15.04.2008 - 10:46) По...   16.04.2008 - 05:53
- - DrgLena   Согласна! Проценты, не частоты, можете на проц...   16.04.2008 - 08:43


Добавить ответ в эту темуОткрыть тему