Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Вопрос об использовании критерия Манна-Уитни
maxandron
сообщение 24.12.2014 - 00:12
Сообщение #1





Группа: Пользователи
Сообщений: 14
Регистрация: 15.06.2014
Пользователь №: 26464



Здравствуйте! Помогите разобраться в следующем. На конференциях, в публикациях часто встречаю применение критерия Манна-Уитни (например, когда сравнивают какие-нибудь показатели в двух группах животных: контрольной и получающей препарат X). Но, вроде как, должно быть обоснование использования того или иного критерия. Почитав некоторые работы и обсуждения на данном форуме, немного непонятно: почему бы не использовать, например, ANOVA. При разговоре с авторами получал разные ответы: написано в руководствах, поэтому и применяли; выборка маленькая (по 10 крыс в каждой из групп) и т.д. Поэтому, могли бы специалисты именно в стат. обработке данных пояснить, как правильно и грамотно обосновать применение того же критерия Манна-Уитни? Когда есть необходимость в непараметрику уходить? Здесь вспоминается показательный пример, про который рассказывали на конференции по исследованию биоэквивалентности лс. Результаты существенно отличались: если непараметрику использовать два препарата-эквивалентны, если параметрику-не эквивалентны. Но там, в руководствах, все четко прописано: лог-преобразование данных, ANOVA и т.д.
Жду ответа! Заранее благодарен за помощь!

Сообщение отредактировал maxandron - 24.12.2014 - 11:41
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.12.2014 - 13:01
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Зачем вообще применять критерий (причем тот, который всегда (при должном размере "групп") найдет "значимые различия") там, где явно по всей логике ("Здесь вспоминается показательный пример, про который рассказывали на конференции по исследованию биоэквивалентности лс."(С)) требуется оценить величину эффекта?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 25.12.2014 - 09:48
Сообщение #3





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Условия применения данного критерия есть даже в интернете , например в Википедии.
В параметрическом и непараметрическом случаях проверяются все-таки разные гипотезы.
При этом всегда используется только один из критериев (в зависимости от того, выполнены условия или нет ).
Применение одновременно и сравнение обоих критериев нужно считать грубой ошибкой.
Ваш "показательный пример" да еще и на конференции является ярким и показательным примером некомпетентности.
Конечно, параметрический критерий обладает большей чувствительностью.
При чем здесь однофакторный дисперсионный анализ? ANOVA обычно применяется только для трех и более независимых групп!
Для грамотного научного применения критерия Манна -Уитни следует выполнить анализ мощности этого критерия в том или ином варианте.

Сообщение отредактировал anserovtv - 26.12.2014 - 17:41
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 25.12.2014 - 17:15
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(maxandron @ 24.12.2014 - 02:12) *
Здравствуйте! Помогите разобраться в следующем. На конференциях, в публикациях часто встречаю применение критерия Манна-Уитни (например, когда сравнивают какие-нибудь показатели в двух группах животных: контрольной и получающей препарат X). Но, вроде как, должно быть обоснование использования того или иного критерия. Почитав некоторые работы и обсуждения на данном форуме, немного непонятно: почему бы не использовать, например, ANOVA. При разговоре с авторами получал разные ответы: написано в руководствах, поэтому и применяли; выборка маленькая (по 10 крыс в каждой из групп) и т.д. Поэтому, могли бы специалисты именно в стат. обработке данных пояснить, как правильно и грамотно обосновать применение того же критерия Манна-Уитни? Когда есть необходимость в непараметрику уходить? Здесь вспоминается показательный пример, про который рассказывали на конференции по исследованию биоэквивалентности лс. Результаты существенно отличались: если непараметрику использовать два препарата-эквивалентны, если параметрику-не эквивалентны. Но там, в руководствах, все четко прописано: лог-преобразование данных, ANOVA и т.д.
Жду ответа! Заранее благодарен за помощь!

Официальная наука - это определённая система договорённостей. Начать можно хотя бы с того, что принятые 5% на ошибку I рода - это просто некое число, не имеющее никакого теоретического фундамента. Но как бы вы ни считали, а трактовать результат придётся относительно этого числа. Поэтому, по большому счёту, независимо от адекватности, мощности, новизны, крутизны и т.д. статистического метода, решение хоть как будет отчасти внестатистическим. Поэтому, если главная задача исследования - практическая, то можно руководствоваться правилом: делать так, чтобы результат принимался коллегами... ну, и хорошо бы, чтобы ещё похвалили smile.gif. А значит лучше ориентироваться на грамотных и/или авторитетных коллег, на авторитетные руководства. Поскольку в медицине мнение авторитетных людей весит куда больше чем во многих других науках, на первых порах этого будет вполне достаточно. Следуя этой логике, получается, что те, кто говорит "написано в руководствах" очень даже неплохо отвечают. Сложность в том, что эти руководства нужно штудировать.
Что касается перечисленных вами методов, то своя логика есть и за всеми этими методами и за многочисленными другими. Логика и возникающие вопросы примерно такие.

1). Почему когда мы сравниваем 2 группы, то сразу говорим о средних (медианах)? Это - так называемые меры положения. А если изменится не среднее, а разброс значений - совсем другая характеристика, которая и оценивается иначе (меры рассеяния, масштаба) и трактуется. А если изменится форма распределения показателя - это, с теоретической точки зрения на процесс пожалуй покруче любого изменения среднего будет... Поэтому методов куда больше перечисленных. Не все можно применить на сверхмалых выборках, но тем не менее... Кстати, в математической статистике малой считается выборка в 25-30 наблюдений, ну а 10 - это уже типа пилотное исследование.

2) Что касается мер положения, то выбор метода можно поставить в зависимость от степени изученности показателя. Если известно, что показатель распределён в популяции нормально или логарифмически нормально, то неразумно отказываться от этой информации. Т.е. лучше опереться на параметры этих распределений, особенно в случае сверхмалых выборок. Поскольку мы в таком параметрическом подходе используем дополнительную информацию (знание о законе распределения в популяции) - получаем выигрыш в мощности. Сложность в том, что характер распределения в популяции нам часто неизвестен, а оценить его по выборке часто не позволяет её объём. В случае параметрического подхода для 2 групп обычно используют t-критерий Стьюдента, в том числе в модификации Уэлча, а не дисперсионный анализ (ANOVA). Хотя оба метода дадут идентичный результат (F-критерий = t2), если не стоит задача вычисления компонентов дисперсии людям привычнее видеть t.

3) Если распределение ненормальное, оно может быть приведено к нормальному с помощью преобразований типа логарифмирования, квадратного корня, Бокса-Кокса и т.д. Глупо ждать нормального распределения от площади, а не от квадратного корня из неё, или нормального распределения от численности популяции организмов, а не от её логарифма. Преобразовываем, сравниваем параметрикой, делаем выводы. Хотя есть на свете упрямцы, которые считают, что "правильные данные" - это те, что они намерили своими примитивными инструментами, а не функции о них, призванные привести в соответствие наши линейки с линейками Природы.

4) Если данные распределены в популяции ненормально или исследователь не хочет их трансформировать - используем непараметрику. Критериев много, у всех свои особенности и ограничения, хотя и не такие строгие как у параметрических методов. Например, критерий Манна - Уитни сравнивает функции распределений, отклоняя нулевую гипотезу подтверждает не все возможные альтернативные и требует одинакового типа распределений. Кто из практиков про это знает/говорит?

5) Всю эту кучу информации можно сделать ненужной для практики, если опираться на другую логику. Зачем мудрить, если можно ответить на вопрос не прибегая к статистическим критериям. Это тот путь, который вам предлагает p2004r. Можно, например, перемешать ваши данные из обеих групп и сделать из них новые выборки, для которых найти разность средних. Потом снова перемешать и снова найти. И так раз эдак тысяч десять. Затем оценить частоту (вероятность) наблюдать имеющуюся разность по сравнению со случайной в перемешанных данных. Это так называемая рандомизационная техника, один из её вариантов. Или можно генерировать новые псевдовыборки из имеющихся данных и находить разность для них, затем построить распределение этой разности и найти его 95% ДИ. Если он содержит ноль - группы не различаются, не содержит - различаются. Это - вариант бутстрепа. Ввиду универсальности и того, что сейчас компьютеры это считают быстро - такие ресэмплинг-техники хорошая альтернатива классческой (не)параметрике. Почитайте Шитикова, книга написана хорошим языком, для людей и с примерами: http://www.ievbras.ru/ecostat/Kiril/Article/A32/Stare.htm

Сообщение отредактировал nokh - 25.12.2014 - 19:58
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
maxandron
сообщение 25.12.2014 - 19:10
Сообщение #5





Группа: Пользователи
Сообщений: 14
Регистрация: 15.06.2014
Пользователь №: 26464



Большое спасибо за ответы! Понятно одно: нужно больше читать толковые книги и руководства и более критично относится к мнению коллег.nokh, отдельное спасибо за ссылку.

Сообщение отредактировал maxandron - 25.12.2014 - 19:11
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 25.12.2014 - 20:54
Сообщение #6





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(nokh @ 25.12.2014 - 17:15) *
Поскольку в медицине мнение авторитетных людей весит куда больше чем во многих других науках
Когда в так называемой науке царит засилье "авторитетов", то это уже не наука, а секта типа Аум-сенрикё. Медицина - это не шоу бизнес, где крутизна определяется близостью знакомства со метрами, звездами эстрады, вроде Аллы Пугачевой. Уже из самого названия термина "Доказательная медицина" видно, что в первую очередь важны доказательства, а не ссылки на "всеми уважаемых людей в моей деревне". Читайте литературу, разбирайтесь в методах, не доверяйте никому на слово и тогда вы скоро сами станете "авторитетом".


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 26.12.2014 - 21:55
Сообщение #7





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(DoctorStat @ 25.12.2014 - 20:54) *
Когда в так называемой науке царит засилье "авторитетов", то это уже не наука, а секта типа Аум-сенрикё. Медицина - это не шоу бизнес, где крутизна определяется близостью знакомства со метрами, звездами эстрады, вроде Аллы Пугачевой. Уже из самого названия термина "Доказательная медицина" видно, что в первую очередь важны доказательства, а не ссылки на "всеми уважаемых людей в моей деревне". Читайте литературу, разбирайтесь в методах, не доверяйте никому на слово и тогда вы скоро сами станете "авторитетом".


В "Доказательной медицине" масса субъективизма остается, просто он сосредоточен в точке -- "что считается за исцеление". Например, бесполезно пытаться доказывать эффект от лечения БА с помощью дыхательной гиперкапнической тренировки, поскольку ДМ (благодаря какому то чудаку) решила что "критерий выздоровления" в этом случае это чуть ли не "соматические изменения" дыхательных путей... Так что субъективизм остается, просто сводиться к выбору "объективных критериев", никто ведь не смотрит на качество жизни, выживаемость некую "совокупную"... просто механически примененный процесс к субъективно выбранному в качестве критерия измеряемому показателю.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Vitek_24
сообщение 26.04.2016 - 19:14
Сообщение #8





Группа: Пользователи
Сообщений: 2
Регистрация: 26.04.2016
Пользователь №: 28219



Хотелось бы уточнить по U-критерию. В одной из статей на просторах интернета его рекомендовали использвоать при объёме выборки от 4 значений и даже от 3, если в другой сравниваемой выборке есть хотя бы 5 значений. И это безотносительно распределения генеральной совокупности. Вроде как он даёт меньше ошибку 1 рода, т.е. что мы ошибочно отклоним H0 и будем говорить о стат. достоврености различий выборок. И вообще t-критерий не применим при таких малых объемах выборок, ведь так? Чем считать тогда?

Если важно, то речь идёт о поведенческих зарактеристиках животных. Процедура получения экспериментальных животных слишком сложна, чтобы увеличить выборку до хотя бы 8-10... Соответственно надо как-то работать с тем что есть. Сейчас 2 группы по 5 жвиотных. исследуемый параметр - % правильно распознанных геометрических фигур от общего числа предъявлений. И время ответа на услвоный сигнал. В ген. совокупности эти параметры имеют нормальное распределение
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 26.04.2016 - 19:29
Сообщение #9





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Цитата(Vitek_24 @ 26.04.2016 - 19:14) *
Хотелось бы уточнить по U-критерию. В одной из статей на просторах интернета его рекомендовали использвоать при объёме выборки от 4 значений и даже от 3, если в другой сравниваемой выборке есть хотя бы 5 значений. И это безотносительно распределения генеральной совокупности. Вроде как он даёт меньше ошибку 1 рода, т.е. что мы ошибочно отклоним H0 и будем говорить о стат. достоврености различий выборок. И вообще t-критерий не применим при таких малых объемах выборок, ведь так? Чем считать тогда?

Если важно, то речь идёт о поведенческих зарактеристиках животных. Процедура получения экспериментальных животных слишком сложна, чтобы увеличить выборку до хотя бы 8-10... Соответственно надо как-то работать с тем что есть. Сейчас 2 группы по 5 жвиотных. исследуемый параметр - % правильно распознанных геометрических фигур от общего числа предъявлений. И время ответа на услвоный сигнал. В ген. совокупности эти параметры имеют нормальное распределение


Возьмите ГОСТ ИСО 5479-2002: при таком размере выборки вы даже нормальность распределения проверить не сможете.
Генеральная совокупность - это все ответы всех животных, т.е. чистая абстракция, так что вряд ли ее кто-то имеет возможность изучить.
А вообще применяйте перестановочные тесты или просто получайте бутстреп-оценки нужных параметров. Это лучшее, что можно сделать в такой ситуации.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Vitek_24
сообщение 26.04.2016 - 19:55
Сообщение #10





Группа: Пользователи
Сообщений: 2
Регистрация: 26.04.2016
Пользователь №: 28219



тов. ogurtsov, вы, верно, правы. Бутстреп-метод всегда интересовал, но до практики не доходило. А идея хороша. Специальные программы есть для подобных расчётов? Пользуюсь statistica 10, но там, вроде, не встречал.

Допустим в Exel случайно можно из 5 значений 5 раз надёргать случайные значения, но это ведь всего 5^5=3125 выборок, потом они начнут повторяться, вроде так, если мне память не изменяет. А что делать с ними дальше? Как посчитать вероятность случайно получить ту комбинацию, что составилась при анализе экспериментальной группы животных? Можно где почитать об этом для "чайников"? wink.gif Или может софт есть спецаильный?

P.S. Насчёт нормального расперделения в ген. совокупности, то это априори. давно установлено, что популяция по IQ расперделяется нормально. Середнячки по центру и гении с совершенно глупыми по краям. так что тут сомнений насчёт распределения нет. да и есть работы, где по 300-400 животных анализировалось. там уже шапиро-уилкса можно посчитать... и было посчитано.

Сообщение отредактировал Vitek_24 - 26.04.2016 - 19:57
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ogurtsov
сообщение 26.04.2016 - 20:15
Сообщение #11





Группа: Пользователи
Сообщений: 127
Регистрация: 15.12.2015
Пользователь №: 27760



Цитата(Vitek_24 @ 26.04.2016 - 19:55) *
тов. ogurtsov, вы, верно, правы. Бутстреп-метод всегда интересовал, но до практики не доходило. А идея хороша. Специальные программы есть для подобных расчётов? Пользуюсь statistica 10, но там, вроде, не встречал.


А вот книга на тему: http://www.ievbras.ru/ecostat/Kiril/Article/A32/Starb.pdf


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему