Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V   1 2 3 > »   
Добавить ответ в эту темуОткрыть тему
> Критерий Краскела-Уоллиса, использование критерия в программе Statistca
ortoped74
сообщение 17.04.2007 - 12:08
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 17.04.2007
Пользователь №: 4059



Здравствуйте, участники форума!
Прошу помощи по применению критерия Краскела-Уоллиса в программе STATISTICA.
Мне необходимо доказать, что три группы пациентов отличаются по одному признаку.
В программе при обработке данных требуется отметить группирующий признак и анализируемые признаки.
Как разобраться в этих признаках и правильно отметить группы?
Заранее благодарен.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 26.04.2007 - 09:35
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Группируюшщий признак - это качественный признак, по которому Вы ищите различия. Анализируемые - количественные признаки. Иными словами, если Вам надо найти различия в концентрации IgG у пациентов с разной степенью тяжести состояния (удовлетворительное, средней тяжести, тяжелое), то тяжесть состояния (переменная с тремя значениями, например 0,1,2) - группирующий признак, IgG - анализируемый. Если у Вас более 2х групп, то КУ дает ответ на вопрос о том, есть ли различия хотя бы у одной группы (причем сравниваются, обратите внимание, не средние, а медианы). Далее Вы должны использовать попарные сравнения для того, чтобы найти ответ на вопрос - каковы эти различия (отличаются уровни 0-1, 0-2, 1-2?). Поскольку Вы используете непараметрическую статистику, то Вам придется использовать критерий Мэнна-Уитни для попарных сравнений (три сравнения), а пограничное значение доверительной вероятности будет 0,017 (0,05/3, поскольку Вы делаете три сравнения - т.н. подход Бонферонни). Если парные различия будут менее 0,017, Вы признаете, что между медианами групп есть достоверные различия.
Если бы Вы воспользовались параметрическим дисперсионным анализом, Вам бы были доступны другие варианты сранения групп после выявления факта наличия различий между ними (т.н. post hoc тесты). В непараметрическом такой возможности нет, и Вы рискуете пропустить различия даже тогда. когда они существуют.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ortoped74
сообщение 30.04.2007 - 06:59
Сообщение #3





Группа: Пользователи
Сообщений: 4
Регистрация: 17.04.2007
Пользователь №: 4059



Цитата(плав @ 26.04.2007 - 09:35) [snapback]2782[/snapback]
Группируюшщий признак - это качественный признак, по которому Вы ищите различия. Анализируемые - количественные признаки. Иными словами, если Вам надо найти различия в концентрации IgG у пациентов с разной степенью тяжести состояния (удовлетворительное, средней тяжести, тяжелое), то тяжесть состояния (переменная с тремя значениями, например 0,1,2) - группирующий признак, IgG - анализируемый. Если у Вас более 2х групп, то КУ дает ответ на вопрос о том, есть ли различия хотя бы у одной группы (причем сравниваются, обратите внимание, не средние, а медианы). Далее Вы должны использовать попарные сравнения для того, чтобы найти ответ на вопрос - каковы эти различия (отличаются уровни 0-1, 0-2, 1-2?). Поскольку Вы используете непараметрическую статистику, то Вам придется использовать критерий Мэнна-Уитни для попарных сравнений (три сравнения), а пограничное значение доверительной вероятности будет 0,017 (0,05/3, поскольку Вы делаете три сравнения - т.н. подход Бонферонни). Если парные различия будут менее 0,017, Вы признаете, что между медианами групп есть достоверные различия.
Если бы Вы воспользовались параметрическим дисперсионным анализом, Вам бы были доступны другие варианты сранения групп после выявления факта наличия различий между ними (т.н. post hoc тесты). В непараметрическом такой возможности нет, и Вы рискуете пропустить различия даже тогда. когда они существуют.

Спасибо за подробное разъяснение. Но, к сожалению я ещё больше запутался. Ситуация такая. Я изучаю сужение позвоночного канала у пациентов трёх групп: компенсированные, субкомпенсированные, декомпенсированные. Первым делом проверяю данные на нормальность распределения и получаю, что нормально они распределяются лишь в одной из трёх групп, следовательно, делаю заключение, что для доказательства различия групп необходимо применение непараметрической статистики, выбираю КУ. Из Вашего пояснения получается, что и с помощью КУ доказать значимость различий в группах я не смогу? Дополнительно необходимо применение статистики МУ? Ведь дисперсионный анализ применить нельзя если распределение отлично от нормального?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 30.04.2007 - 13:20
Сообщение #4





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Обратите внимание на критерий Данна (Bonferroni-Dunn post hoc test). Его подробное описание см. в книге Холлендера и Вулфа. Примеры из области медицины см. у Гланца.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 1.05.2007 - 11:10
Сообщение #5





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



to ortoped74: ситуация здесь такая - 1) наиболее распространенная ошибка, считать, что по выборочному распределению Вы можете определить распределение в популяции (а именно оно важно для определения того, каким методом пользоваться). Иными словами, если у Вас в группах количество людей более 30 и у Вас нет оснований предполагать, что ошибка измерений не случайна, то лучше использовать обычный дисперсионный анализ. Он достаточно устойчив к небольшим отклонениям от нормального распределения и более мощный, чем непараметрика. 2) Непараметрика не спасает от определенных типов ненормального распределения, таких как смешанные распределения (смешанное распределение, когда у Вас две группы, которые превращены в одну, с одинаковыми средними и разными дисперсиями). По опыту, именно смешанные распределения наблюдаются чаще всего в биомедицинских данных. 3) Оценка результатов одинакова вне зависимости от того, пользуетесь ли Вы КУ или обычным дисперсионным анализом. Последовательность всегда одна и та же: 1) выполнить дисперсионный анализ и т.н. омнибусный тест чтобы выяснить, не пришли ли все средние (медианы) из одной популяции 2) Если все из одной популяции, анализ прекращается 3) Если не все из одной, выполняется группа post hoc тестов, выявляющая какие именно группы отличаюся. Для параметрического анализа эти тесты отработаны, для непараметрического - нет (хотя никто не мешает заменить значения и ранги и работать с ними в рамках обычного дисперсионного анализа - КУ - это не что иное, как дисперсионный анализ ранговых значений).
to Игорь: давайте не будем плодить рекламные ссылки из одного поста в другой. Если Вы можете ответить - ответьте (например, путем copy-paste из своей справочной системы). Просят ответ по существу. Хотите ссылками - пожалуйста, страницу или главу и библиографическое (краткое) описание, чтобы человек легко нашел. Кстати о хелпах к программам. Statistica имеет великолепную справочную систему и бесплатный учебник, с примерами в этой системе, описанием статистических методов и т.п., которая, кстати, доступна в режиме on-line и не требует никакой установки. Адрес сайта Статсофта знают, наверное, все в этом форуме
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 1.05.2007 - 13:17
Сообщение #6





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



tо плав: Принята критика. Все ссылки удалил.
to ortoped74: Считаю, что для решения Вашей задачи можно применить критерий Данна. Его описание и пример применения содержится на с. 351 книги Гланца С. "Медико-биологическая статистика", изд-во "Практика", 1998. К книге прилагается программа BIOSTAT, с помощью которой данный тест можно посчитать.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ortoped74
сообщение 3.05.2007 - 07:16
Сообщение #7





Группа: Пользователи
Сообщений: 4
Регистрация: 17.04.2007
Пользователь №: 4059



to плав: Спасибо за поддержку. Самостоятельно разобраться в статистической обработке данных не очень-то легко, но жуть как интересно. Тогда какими тестами лучше пользоваться (из омнибусных и post hoc)? Достовернее, проще, правильнее?
to Игорь: ссылками тоже обязательно воспользуюсь. Часто одно и то же понятие в разных источниках освящается по разному и понимание его приходит лишь с 3-4 прочтения (особенно когда на словах или пальцах объяснить не кому).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 9.05.2007 - 12:13
Сообщение #8





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Если речь идет об обычном диспернсионном анализе, то омнибусный тест - критерий F Фишера. Насчет post hoc тестов единодушия среди экспертов нет. Бонфероннии считается очень консервативным (т.е. легко пропустить различия, если они сущетсвуют), Шиффе - в принципе просто попарный t-тест. Создатели SAS, а за ними и статистики работающие в этой системе любят тест Данкана, однако большинство склоняются к использованию Ньюмена-Койлса и HSD Тьюки (HSD хорошо расшифровывается - "честно значимые различия"). В принципе, поскольку времени это занимает не много, лучше прогнать несколько тестов и, если они все дают одинаковй результат - значит он правильный.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 20.05.2007 - 08:15
Сообщение #9





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



Цитата(плав @ 1.05.2007 - 12:10) [snapback]2795[/snapback]
to ortoped74: ситуация здесь такая - 1) наиболее распространенная ошибка, считать, что по выборочному распределению Вы можете определить распределение в популяции (а именно оно важно для определения того, каким методом пользоваться). Иными словами, если у Вас в группах количество людей более 30 и у Вас нет оснований предполагать, что ошибка измерений не случайна, то лучше использовать обычный дисперсионный анализ. Он достаточно устойчив к небольшим отклонениям от нормального распределения и более мощный, чем непараметрика.


to плав: Согласен, что по выборочному распределению, особенно если количество наблюдений не велико, нельзя судить о распределении в популяции, но часто бывает так, что я не знаю каково истинное распределение интересующего признака в популяции (например, потому, что этот признак очень мало изучен). Поэтому я решил использовать дисперсионный анализ для определения статистической значимости различий между группами только в том случае, если проверка нормальности распределения признака в группе подтвердила нормальность распределения. Если распределение отличается от нормального - непараметрические критерии. Прав?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 20.05.2007 - 15:46
Сообщение #10





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



М-м-м... Если распределение признака в популяции неизвестно, то как можно считать, что популяция настолько гомогенна, что взяв выборку вы не совершили ошибку отбора? Я понимаю, что это вопрос риторический, но если подходить к исследованию с нормальных научных позиций, то пока Вы не изучили распределение признака в группе здоровых лиц, дальше двигаться нельзя.
Теперь с небес на землю. Ваш подход является разумным, и, более того, в случае сравнения двух групп часто рекомендуют использовать сразу тест Мэнна-Уитни, ибо его мощность примерно равна мощности t-теста, а предположений о нормальности распределения он не требует (правда, это не спасет Вас от проблем со смешанными распределениями). Однако обсуждавшийся в этой ветке случай несколько иной - сравнивается несколько групп. И вот тут использование непараметрики приводит к проблеме отсутствия тестов, аналогичных post hoc тестам и, соответственно, резкой потере мощности (т.е. Вы не найде различий даже если они есть). Поэтому необходимо балансировать опасность от использования параметрики на распределении, отличающемся от нормального и потере мощности. Учитывая тот факт, что дисперсионный анализ в принципе устойчив к небольшим отклонениям от нормальности, я бы рекомендовал в ситуации, описанной выше использовать дисперсионный анализ с адекватными post hoc тестами.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 20.05.2007 - 17:52
Сообщение #11





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



У меня была аналогичная ситуация. Мне требовалось проверить статистическую значимость различий между четырех групп с ненормальным распределением. Сначала я использовал критерий Краскала-Уоллиса, а для попарного сравнения критерий Данна. Я прочитал о нем у Гланца, а для рассчета использовал программку, которая прилагается к его книге! Обошелся без параметрики. smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 21.05.2007 - 15:29
Сообщение #12





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



А можно поинтересоваться, каким образом удалось доказать, что критерий Данна был именно тем, что был нужен в данном случае? Из того, что после подстановки цифр в формулу получились некоторые величины еще не следует, что они правильные... Вы сравнили мощность (в вычислительном эксперименте) для выборок Вашего размера? Или еще как? Не хочу придираться, но пример по типу "я воспользовался критерием ХХХ и у меня получился результат" не убедительный, критерии выбираются на основе теоретических расуждений или (лучше) вычислительных экспериментов. Так вот, повторюсь, большого выигрыша от использования непараметрики в дисперсионном анализе нет (это уже я проверял в вычилительном эксперименте - если кто не верит, возьмите, сгенерируйте популяцию в сотню тысяч объектов, затем берите оттуда случайные выборки и рассчитывайте достоверность различий между ними разными методами) и вообще увлечение непараметрикой это просто попытка прикрыть дефекты дизайна исследования (основной и убийственный вопрос для непараметрики - а почему распределение не нормальное? дело в том, что при случайной вариабельности ошибка должна подчиняться нормальному закону (или данные должны быть нормализуемыми - как я уже писал выше, непараметрика это часто нормализация путем замены значений на их ранговые номера). Если это не так, то, скорее всего, в данных присутствует неслучайный источник вариабельности, а, значит, вся простейшая статистическая обработка (которая предполагает только случайную вариабельность как источник различий) является сомнительной. И, кстати, а все ли, кто пользуется непараметрикой в таблицах анализа указывают медиану и межквартильное расстояние вместо средних и в диссертации пишут "медианные значения групп составляли..." или пишут все-таки "средние значения составляли..." смешивая французский с нижегородским?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 21.05.2007 - 16:17
Сообщение #13





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



1. Про всех, кто пользуется непараметрикой, сказать, разумеется, не могу, но лично я в тексте и таблицах при использовании непараметрики указываю именно медиану и межквартильный интервал, а на графики делаю в виде ящиков с усами (min и maх).
2. Про распределение. Проверка полученных выборок на нормальность в подавляющем большинстве случаев дает отрицательный результат. Возможно, ненормальность распределения в моем случае связана именно с небольшим количеством наблюдений (10-15) в группах. При этом в популяции распределение, может быть, и подчиняется нормальному закону, но проверить это нельзя, т.к. исследования стоят достаточно дорого и проверка займет много времени. Так вот, если подходить формально, получается, что у меня нет оснований использовать параметрику, т.к. распределение ненормальное (покрайней мере в выборках).
3. Про критерий Данна. Сначала я использовал критерий Краскала-Уоллиса для выявления статистически значимых различий четырех выборок. А критерий Данна использовал для того, чтобы определить, между какими именно группами имеются различия.
4. Про мощность. Мощность, или чувствительность, критерия я не сравнивал, т.к. не знаю других непараметрических критериев, кроме критерия Данна, для множественного сравнения групп с различным числом наблюдений. Если подскажите другие критерии, применимые в моем случае, и как сравнить их мощность (если я правильно понимаю, она же чувствительность) буду очень Вам признателен!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 22.05.2007 - 11:55
Сообщение #14





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



1. Good for you! А что на этот счет говорит научный руководитель? Если серьезно, по нашему опыту замена медиан на средние в докладах и тексте самая распространенная ошибка при использовании непараметрики
2. Проблема в том, что для критерия важно не распределение в выборке, а в популяции. Оригинально У.Госсет (Стьюдент) делал свой критерий для анализа выборок в 4 наблюдения (попробуйте проверить распределение 4 наблюдений). Поэтому оснований для замены параметрики на непараметрику также нет. Учитывая более низкую мощность непараметрики повышается вероятность ошибки второго рода. Но если, Вы сделали так, то сильного криминала нет, просто я хочу сказать, что Ваш пример не означает, что подобный подход является единственно правильным. Вообще-то если бы Вы повторили расчеты параметрическим дисперсионным анализом и получили те же результаты, то тогда можно было бы быть уверенным, что все хорошо, а вот если бы были расхождения - надо было бы думать. У непараметрики есть еще один серьезный дефект - Вы не можете оценить доверительные интервалы (вообще-то можете, но большинство программ этого не делают), а доверительные интервалы сейчас являются de facto стандартом представления данных.
3. Правильно, но тест Данна не что иное как тест Бонферрони для непараметрических сравнений (см. выше по поводу Бонферрони).
4. Есть разные варианты теста Данна, вместо Крускала-Уоллеса можно использовать Ван-дер-Ваардена, есть и другие варианты, однако самое главное, что следует из 2-3, при переходе от параметрики к непараметрике Вы теряете информацию. Непараметрика не использует всю информацию, которая есть в выборке. Для непараметрики сравнение А и Б с А=1,2,3 и Б=4,5,6 аналогична А=1,2,3 и Б=24,25,26, хотя, взгляд на цифры, я думаю, убедит Вас, что второй вариант все-таки значительнос отличается от первого... В принципе, каждый исследователь выбирает то, что он считает правильным, просто должен быть готов отстоять свой выбор и, фраза "использовали параметрический дисперисонный анализ, поскольку известно, что он достаточно устойчив к отклонениям от нормальности" лучше (на мой вкус), чем фраза "использовали критерий Данна, так как других не знаем, а непараметрикой пользовались, поскольку выборка была маленькая, а о генеральной совокупнсоти ничего не знаем". В последнем случае, злобный рецензент должен сказать - "пойдите, узнайте больше об объекте исследования и тогда возвращайтесь, ибо иначе ваши данные все равно никуда не годятся - 15 человек из генеральной совокупности неизвестной гетерогенности могут быть не репрезентативными и, соответственно, все результаты бессчмысленны". Предстваьте себе случайную выборку 10 детей в возрасте от 0 до 18 и распределение их роста и сравните две случайно выбранные группы по 10 детей по росту... Нет, тут и параметрика не поможет, я просто хочу сказать, что защита "у нас мало наблюдений" - это не защита. К этому вообще лучше внимания не привлекать, ибо от Вас никто не требует защищаться/публиковаться - Вы это делаете сами, когда считаете, что эксперимент завершен.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 22.05.2007 - 17:20
Сообщение #15





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



Прочитав Ваш ответ, я вспомнил, что многие солидные журналы, например Nature, Science и др., печатают статьи, где используют критерий Стьюдента при сравнении групп из 4-5 наблюдений и почти нет непараметрики! Нда...
Получается, что непараметрикой нужно пользоваться тогда, когда на большом количестве наблюдений доказано, что распределение действительно ненормальное, а в идеале, наверное, еще нужно объяснить, почему оно ненормальное. Так?

Конкретный пример. Есть две серии из 10 наблюдений (а в экспериментальной медицине редко ведь делают выборки большего объема!). Анализировался какой-нибудь мало известный показатель клеточной функции, большие выборки по этому показателю никто не делал (как, например, для роста, веса и проч.). Проверяю нормальность в группах и получаю, что распределение ненормальное (критерий Шапиро-Уилка, P=0.001) и, кроме того, дисперсии не одинаковые (а на сколько я понимаю, нормальности распределения и равенство дисперсий сравниваемых групп - это два необходимых условия для использования параметрики). И что? Все равно надо использую параметрический дисперисонный анализ, т.к. он "достаточно устойчив к отклонениям от нормальности" (обычно говорят "к небольшим отклонениям от нормальности")? или забраковать все исследования из-за нерепрезентативности выборок (а о какой репрезентативности можно говорить, если выборки из 4 наблюдений - см. выше)? или все же можно воспользоваться непараметрическими критериями, которые не нуждаются в предположениях о типе распределения? Пусть в случае нормальности распределения непараметрика несколько повышает ошибку второго рода, но, с другой стороны, она ведь защищает от случая, когда параметрикой действительно пользоваться нельзя!

Диалог 1:
- Вы сравниваете группы из 10 наблюдений. На каком основании использовали параметрику? Вы не имеете представления о характере распределения и не можете его проверить, к тому же дисперсии в сравниваемых группах не равны.
- Потому что параметрика устойчива к отклонению от нормальности.

Диалог 2:
- Вы сравниваете группы из 10 наблюдений и используете при этом непараметрику. Вы убедились в ненормальности распределения?
- Ввиду малого числа наблюдений [а 10 это больше, чем 4! см. выше], когда невозможно однозначно сказать о характере распределения, были использованы непараметрические критерии, не учитывающие характер распределения.

Какая защита Вам кажется более убедительной?



Еще я хотел спросить: я описал выборки с помощью медианы и межквартильного интервала, а затем оценил различия между ними, применив непараметрический критерий, например критерий Манна-Уитни, и в результате выявил, что различия статистически значимы. Например, медианное значение показателя в группе А составило 100 единиц, а в группе В - 200.
Можно ли при этом сказать, что медианное значение показателя в группе В в 2 раза превышало медианное значение показателя в группе А (или медианное значение в группе В на 100% превышало медианное значение в группе А), или такое сравнение допустимо только для выборочных средних при условии нормального распределения?
Если я использовал критерий Уилкоксона для парных сравнений, можно ли различия представить как разность медиан двух групп, или критерий Уилкоксона позволяет сказать, что есть различия между этими группами и все, а количественно выразить эти различия нельзя (как, например, при использовании парного критерия Стьюдента)?

По скольку указание доверительных интервалов является стандартом представления данных, как подсчитать доверительный интервал для медианных значений групп и, если такое в принципе возможно, доверительный интервал для изменения медианных значений?

В сети мне попался такой вариант описания: "показатели были снижены на 46% (вероятность 0,54, 95% доверительный интервал 0,29-0,98, р=0,045)". Корректна ли данная запись? Что означает "вероятность 0,54"? - это чувствительность критерия, вероятность обнаружить такие-то различия при заданном значении альфа, объеме выборке? Значит ли, что в этом примере вероятность нулевой гипотезы будет 1-0,54? Можно ли приведенную цитату понимать так: "Выявлены статистически значимое (при условии, что альфа 0,05, разумеется) уменьшение показателя на 46%. Вероятность обнаружить такое изменение составляла 54%. С 95% надежностью можно утверждать, что снижение происходит не менее, чем на 29% и не более чем на 98%". Я прав? Можно ли эту запись принять за образец описания результатов? Нужно ли в диссертации указывать доверительный интервал для выборочного среднего или достаточно привести доверительный интервал для разности средних?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V   1 2 3 > » 
Добавить ответ в эту темуОткрыть тему