Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Стадии заболевания, статистический анализ
lymphoma
сообщение 13.04.2008 - 21:19
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 13.04.2008
Пользователь №: 4958



Здравствуйте, уважаемые форумчане!
Вопрос такой: есть 2 группы больных раком молочной железы (15 и 9 больных), стадии 0, I, IIa, IIb и III. Хочется доказать, что эти группы сопоставимы, т.е. нет статистически значимого различия в распределении по стадиям. Каким образом это можно сделать? Насколько корректно использование U-критерия Манна-Уитни после присвоения стадиям числовых эквивалентов (напр., 0-1, I-2, IIA - 3 и т.д.)
ps работаю в пакете Statistica
pps заранее спасибо за ответы
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 14.04.2008 - 08:28
Сообщение #2





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(lymphoma @ 13.04.2008 - 21:19) *
Насколько корректно использование U-критерия Манна-Уитни после присвоения стадиям числовых эквивалентов (напр., 0-1, I-2, IIA - 3 и т.д.)

Если считать указанные данные порядковыми, то можно.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 14.04.2008 - 14:50
Сообщение #3





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Присвоить то стадиям ранги можно, и формально сравнивать группы по таким рангам с помощью U-критерия тоже можно, но при этом проверяемая гипотеза будет совершенно отличной от сформулированной вами, она будет звучать так: отличаются ли группы по тяжести рака. Т.е. группы будут сравниваться по средней тяжести рака, выраженной в баллах-рангах, а не по распределению по стадиям. Если подойти неформально, то дело еще хуже: критерий Манна-Уитни предполагает, что распределения признака в группах относятся к одинаковому типу, а вы это специально не проверяете и на таких объемах выборок проверить не сможете.
Чтобы действительно проверить однородность распределения по стадиям нужно анализировать таблицу частот (таблицу сопряженности) с двумя строками и количеством столбцов, равным числу стадий. Это делается с помощью критериев типа хи-квадрат. Расчет проще сделать на калькуляторе, если неонородность будет статистически значимой - будет хорошо видно за счет каких стадий эта значимость образовалась.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 14.04.2008 - 16:05
Сообщение #4





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Вот еще днем я то же самое написал - о критерии хи-квадрат. Подходит он здесь. Но потом подумал немного и убрал эту информацию. А почему? А все потому, что
Цитата(lymphoma @ 13.04.2008 - 21:19) *
есть 2 группы больных раком молочной железы (15 и 9 больных), стадии 0, I, IIa, IIb и III

Малы группы для хи-квадрат! Вот потому он и не годится тут. Аппроксимация хи-квадрат для всех методов, на хи-квадрат основанных, в данных условиях под вопросом. Для подтверждения этого разработаны так называемые диагностики. Но для вывода нужны исходные данные, которые нам не показали.

А выборки-то номинальные с числом градаций 5. А потому, предполагаю, годится тут точный критерий Фишера-Фримана-Холтона (это расширение точного метода Фишера на номинальные выборки с числом градаций признаков более 2). В Statistica он есть или нет - не знаю. Есть в StatXact и должен быть в SPSS и SAS. Ну еще в некоторых малоизвестных продуктах.

lymphoma, если это не проблема, дайте исходные данные, попробую посчитать (без гарантии).


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
lymphoma
сообщение 14.04.2008 - 17:21
Сообщение #5





Группа: Пользователи
Сообщений: 4
Регистрация: 13.04.2008
Пользователь №: 4958



Боьшое спасибо за подробные ответы;
В прикрепленном файле - данные.
И еще тогда такой вопрос - можно ли для сравнения этих групп по возрасту использовать критерий Стьюдента после проверки нормальности распределения критерием Шапиро-Уилка в каждой из групп? Я прочитал где-то про этот критерий, нашел функцию в программе Statistica, но не очень понял как им пользоваться: программа возвращает значение критерия(W) и значение p, а как их трактовать мне не ясно.
Или же для сравнения по возрасту лучше использовать таблицу сопряженности?

Прикрепленные файлы
Прикрепленный файл  стадии.doc ( 27 килобайт ) Кол-во скачиваний: 566
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 14.04.2008 - 17:41
Сообщение #6





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Что и оказалось - нулевая ячейка. Единственным пригодным методом оказался критерий Фримана-Холтона - все хи-квадрат отпадают. Как и ТМФ, критерий Фримана-Холтона основан на переборе всех возможных вариантов заполнения таблицы. Для Ваших данных было сгенерировано 0,000162 млн. таблиц. P-значение получилось 0,099113272.

Проверка нормальности корректна только для выборок, измеренных в количественной шкале. Если шкала количественная - проверяйте. Выводы стандартные (но как бы "наоборот" относительно проверки гипотез в смысле желаемого результата - хочется, чтобы различий не было). Например, Если p > 0,05 - различие эмпирического распределения по сравнению с нормальным не доказано. Следовательно, считаем его нормальным и применяем критерий Стьюдента.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 14.04.2008 - 20:13
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



>Игорь.
То что в этих данных есть нулевая ячейка - цветочки. 8 ячеек из 10 имеют частоты меньше 5: действительно любые аппроксимации необоснованы, нужно считать точное значение. Знаю насколько вы любите тоный метод Фишера, но я от его использования практически отказался, как и от хи-квадрат. В этом ориентируюсь на учебник: Sokal R.R., Rohlf F.J. Biometry: the principles and practice of statistics in biological research. ? N-Y: Freeman & Co, 1995. ? 850 p. Согласно ему выделяют три модели анализа таблиц сопряженности 2х2 и RхC:
модель I - маргинальные частоты не фиксированы (задача поиска связи), модель II - фиксированы по одному критерию (задача сравнения процентов или однородности в группах - данный случай) и модель III - фиксированы по обоим критериям. Последняя модель соответствует логике точного метода Фишера, когда изменяют частоты внутри таблицы при фиксированных маргинальных. На практике такая схема может возникнуть при изучении предпочтений, когда фиксированы количества испытуемых и объектов, но неизвестно как они распределятся. Для моделей I и II рекомендуется использовать G-критерий (likelihood ratio). Раньше при малой насыщенности таблиц применяли т.к.Ф., но с появлением точных методов необходимость в нем для моделей I и II отпала. У меня 30-дневная лицензия на StatXact закончилась, а распаковывать образ диска С: - долго. Если не сложно, посмотрите пожалуйста, насколько близки будут точные значения Р для т.к.Ф. и отношения правдоподобия (для отношения правдоподобия и хи-квадрат Пирсона совпадают - проверял раньше).

>lymphoma
если не знаете как обращаться с t-критерием - лучше пока не связывайтесь: вопросов будет меньше. Здесь как раз хорошо подойдет к. Манна-Уитни.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
lymphoma
сообщение 14.04.2008 - 20:20
Сообщение #8





Группа: Пользователи
Сообщений: 4
Регистрация: 13.04.2008
Пользователь №: 4958



Игорь, спасибо Вам за ответ! Не очень понял: "Что и оказалось - нулевая ячейка". В итоге-то, если P-значение получилось 0,099113272 (т.е. >0,05), то мы отвергаем нулевую гипотезу о том, что выборки различаются в отношении распределения по стадиям, т.е. выборки однородны по данному признаку. Правильно я понимаю?
Читал еще, что для корректного применения критерия Стьюдента помимо доказательства нормальности распределение необходимо доказать равенствр дисперсий в двух выборках. Каким образом это делается и нужно ли это вообще?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 14.04.2008 - 22:52
Сообщение #9





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Слабость планирования очевидна. Нельзя сравнивать группы 15 и 9 пациентов, если каждую нужно разделить по стадии процесса, поскольку именно она определяет исход и прогноз любого метода лечения в онкологии. Даже если формально группы по распределению по стадиям статистически не различаются, а это действительно так (хи-кв=2,399; р=0,66, M-L хи-кв=2,71; р=0,61), во второй группе выше процент последних двух стадий (55,5%), чем в первой (26,7%). Статистически эти проценты не различаются из-за малочисленности групп, но клинически вторая группа хуже. А нулевая ячейка и означает, что во второй группе нет больных со стадией "0". Процент соотношения в двух группах внимательно проанализируйте, как клиницист, а не арифметик, желающий непременно получить доказательство однородности этих групп.

Row Percent 6,67% 13,33% 53,33% 20,00% 6,67%
Row Percent 0,00% 11,11% 33,33% 44,44% 11,11%

Отсюда следует, что доказывать сопоставимость групп по возрасту не имеет особого смысла. Проверять нормальность распределения, чтобы применить критерий Стьюдента при таком числе наблюдений также не имеет смысла. И равенство дисперсий вам не поможет.
Доказывать сопоставимость групп исследования безусловно нужно, и именно по тем фаторам, которые влияют на результат лечения, а у вас это именно стадии в первую очередь.
Интересно, что вы будете сравнивать в конце наблюдения?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
lymphoma
сообщение 14.04.2008 - 23:26
Сообщение #10





Группа: Пользователи
Сообщений: 4
Регистрация: 13.04.2008
Пользователь №: 4958



DrgLena: Спасибо за конструктивную критику. Согласен с вами в отношении маленьких выборок, однако сделать их больше не представляется возможным. В конечном итоге предполагаю оценивать частоту местных рецидивов и качество жизни больных в зависимости от вида выполненного вмешательства. Понимаю, что рассчитывать на какой-то результат, обладающий высокой доказательностью не приходится (и выборки маленькие, и сроки наблюдения, к сожалению тоже), однако хочется хотя бы с методической точки зрения правильно выполнить статистическю обработку данных, т.е. в каком-то смысле меня больше интересуют формальные аспекты.
ps я студент 6-го курса и это не диссертация
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 15.04.2008 - 00:02
Сообщение #11





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Лимфома? Меланома? Множество характеристик на входе, определяющие степень злокачественности, будут влиять на рецидивирование в большей степени, чем различия в лечении. Однородность групп можно попытаться найти по клеточному типу опухоли. Но это тема другой ветки. И еще , поскольку вы учитесь, рекомендовано, при малочисленных группах, при описании редких патологий описывать все случаи. У вас по одному пациенту в последней стадии в каждой группе, опишите, какой результат при одном и другом вмешательстве. Не усредняйте результат у 3-х и 4-х больных в 3 стадии. Это дизайн описания серии случаев. Не пытайтесь навязать вывод о достоинствах определенного метода, пусть читатель сам оценит результат на определенный срок наблюдения. Удачи!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 15.04.2008 - 06:44
Сообщение #12





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(nokh @ 14.04.2008 - 20:13) *
То что в этих данных есть нулевая ячейка - цветочки. 8 ячеек из 10 имеют частоты меньше 5: действительно любые аппроксимации необоснованы, нужно считать точное значение. Знаю насколько вы любите тоный метод Фишера, но я от его использования практически отказался, как и от хи-квадрат. В этом ориентируюсь на учебник: Sokal R.R., Rohlf F.J. Biometry: the principles and practice of statistics in biological research. ? N-Y: Freeman & Co, 1995. ? 850 p. Согласно ему выделяют три модели анализа таблиц сопряженности 2х2 и RхC:
модель I - маргинальные частоты не фиксированы (задача поиска связи), модель II - фиксированы по одному критерию (задача сравнения процентов или однородности в группах - данный случай) и модель III - фиксированы по обоим критериям. Последняя модель соответствует логике точного метода Фишера, когда изменяют частоты внутри таблицы при фиксированных маргинальных. На практике такая схема может возникнуть при изучении предпочтений, когда фиксированы количества испытуемых и объектов, но неизвестно как они распределятся. Для моделей I и II рекомендуется использовать G-критерий (likelihood ratio). Раньше при малой насыщенности таблиц применяли т.к.Ф., но с появлением точных методов необходимость в нем для моделей I и II отпала. У меня 30-дневная лицензия на StatXact закончилась, а распаковывать образ диска С: - долго. Если не сложно, посмотрите пожалуйста, насколько близки будут точные значения Р для т.к.Ф. и отношения правдоподобия (для отношения правдоподобия и хи-квадрат Пирсона совпадают - проверял раньше).

Численность в ячейке должна быть более 3, 4 или 5 - согласитесь, это неубедительные рекомендации. Вот если бы был объективный критерий, почему хи-квадрат аппроксимация допустима, а почему нет. К счастью, такие критерии есть и называются они диагностиками.
Для рассматриваемых данных:
Диагностика Симонов-Цай
0,32519593 < 0.3 - указывает на потенциальную проблему аппроксимации хи-квадрат
Диагностика Хабермана
0,274178189 < 0.1 - указывает на возможную проблему аппроксимации хи-квадрат

И в самом деле:
Критерий хи-квадрат
2,398845599 p = 0,662835902
Критерий отношения правдоподобия (G2)
2,711690631 p = 0,607170481
Критерий Хеллингера
5,320231259 p = 0,255989003
Критерий Зелтермана
-0,720033289 p = 0,764247749

Все это весьма отличается от точного критерия Фримана-Холтона p = 0,099113272

Если для какой-либо конкретной таблицы аппроксимации по диагностикам получаются допустимыми, что все упомянутые методы дают примерно одинаковый результат.

К программе StatXact приведенные расчеты отношения не имеют, хотя источники использовались.

В Вашей терминологии модель III - это ТМФ и его расширения, модель II - это критерий Барнарда и методы, на данной идее основанные. Методы для таблиц более 2 х 2 для модели II мне неизвестны. Думаю, теоретически возможна реализация критерия Барнарда для таблиц r x c. Вот только практически такой расчет займет очень много времени - современные персональные компьютеры пока не готовы к таким алгоритмам.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 15.04.2008 - 10:26
Сообщение #13





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Коллеги, мне кажется, все немного забыли основную задачу - не проверка различий между группами, а проверка одинаковости (эквивалентности) групп. Иными словами, автору надо больше внимания уделять не нулевой гипотезе, а альтернативной - насколько высока вероятность ее пропуска при данном дизайне. Все обсуждение приведенное выше хорошо и здорово, но если бы задача была найти отличия между группами по распределению, тогда 0,25 вероятность нулевой гипотезы говорит о том, что ее отклонять не стоит. Однако стоит ли отклонять альтернативную? Или вообще исследование ничего не дает? Для формулировки альтернативной гипотезы данных мало, но учитывая размер выборки сразу можно сказать, что мощность исследования малая и поэтому высокое значение ошибки I типа сопровождается еще более высоким значением ошибки II типа, а, значит, никаких выводов относительно одинаковости групп сделать нельзя. К тому же, как указывает DrgLena, визуально (процентное распределение) группы не очень-то похожи.
Самое ужасное, это то, что было написано в ответе на письмо DrgLena - понятно, что исследование никуда, но хочется сделать правильную статистическую обработку. НЕВОЗМОЖНО сделать ПРАВИЛЬНУЮ статистическую обработку при плохом дизайне. Она всегда будет неправильная и проходят подобные мысли только благодаря статистической безграмотности т.н. ученых. Помимо всего прочего малые выборки не репрезентативны, соответственно любая генерализация (о чем и говорит статистическая обработка) является ошибочной, поскольку в исследовании физически отсутствуют представители всех классов (например, в описанном выше массиве это 0 стадия во второй группе). А автор пытается обрабатывать данные так, как если бы они присутствовали!
В данном случае уж лучше просто привести все исходные данные (всего-то 24 наблюдения), нарисовать графики типа ствола с листьями и успокоиться.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 15.04.2008 - 10:40
Сообщение #14





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(плав @ 15.04.2008 - 10:26) *
К тому же, как указывает DrgLena, визуально (процентное распределение) группы не очень-то похожи.

DrgLena получила парадоксальный результат по причине некорректного применения асмиптотики хи-квадрат (а не по причине "плохих" данных - данные не плохие и не хорошие, они просто есть, и из них нужно извлечь полезную информацию ), что я и попытался показать в предыдущем посте. А именно - все критерии, основанные на хи-квадрат, в данной ситуации неадекватны. Поэтому комментировать выводы по их результатам - пустая трата времени.

Рискую еще раз повториться, но единственно адекватными методами при таких данных оказываются точные перестановочные критерии (о Монте-Карло не говорим). Что, собственно, и подтверждает визуальные выводы DrgLena. Они действительно не очень похожи - p = 0,099113272.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 15.04.2008 - 10:46
Сообщение #15





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



По-моему, Вы не поняли. Меня не интересовал хи2, примененный DrgLena, я имел ввиду просто процентное распределение по группам. Что касается всех остальных критериев, то они предназначены для решения другой задачи, а именно - нахождения различий, а тут задача - установления эквивалентности. Поэтому все точные критерии являются такими же неправильными в этом контексте, как и асимптотитческие. В теории клинчиеских испытаний это учже давно известно (там много таких трайлов проводится). Для быстрой ориентировки, посмотрите http://www.graphpad.com/library/BiostatsSp...article_182.htm или сделайте поиск в PubMed по statistical equivalence.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему