Вопрос об использовании критерия Манна-Уитни |
Здравствуйте, гость ( Вход | Регистрация )
Вопрос об использовании критерия Манна-Уитни |
24.12.2014 - 00:12
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 15.06.2014 Пользователь №: 26464 |
Здравствуйте! Помогите разобраться в следующем. На конференциях, в публикациях часто встречаю применение критерия Манна-Уитни (например, когда сравнивают какие-нибудь показатели в двух группах животных: контрольной и получающей препарат X). Но, вроде как, должно быть обоснование использования того или иного критерия. Почитав некоторые работы и обсуждения на данном форуме, немного непонятно: почему бы не использовать, например, ANOVA. При разговоре с авторами получал разные ответы: написано в руководствах, поэтому и применяли; выборка маленькая (по 10 крыс в каждой из групп) и т.д. Поэтому, могли бы специалисты именно в стат. обработке данных пояснить, как правильно и грамотно обосновать применение того же критерия Манна-Уитни? Когда есть необходимость в непараметрику уходить? Здесь вспоминается показательный пример, про который рассказывали на конференции по исследованию биоэквивалентности лс. Результаты существенно отличались: если непараметрику использовать два препарата-эквивалентны, если параметрику-не эквивалентны. Но там, в руководствах, все четко прописано: лог-преобразование данных, ANOVA и т.д.
Жду ответа! Заранее благодарен за помощь! Сообщение отредактировал maxandron - 24.12.2014 - 11:41 |
|
24.12.2014 - 13:01
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Зачем вообще применять критерий (причем тот, который всегда (при должном размере "групп") найдет "значимые различия") там, где явно по всей логике ("Здесь вспоминается показательный пример, про который рассказывали на конференции по исследованию биоэквивалентности лс."(С)) требуется оценить величину эффекта?
|
|
25.12.2014 - 09:48
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Условия применения данного критерия есть даже в интернете , например в Википедии.
В параметрическом и непараметрическом случаях проверяются все-таки разные гипотезы. При этом всегда используется только один из критериев (в зависимости от того, выполнены условия или нет ). Применение одновременно и сравнение обоих критериев нужно считать грубой ошибкой. Ваш "показательный пример" да еще и на конференции является ярким и показательным примером некомпетентности. Конечно, параметрический критерий обладает большей чувствительностью. При чем здесь однофакторный дисперсионный анализ? ANOVA обычно применяется только для трех и более независимых групп! Для грамотного научного применения критерия Манна -Уитни следует выполнить анализ мощности этого критерия в том или ином варианте. Сообщение отредактировал anserovtv - 26.12.2014 - 17:41 |
|
25.12.2014 - 17:15
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Здравствуйте! Помогите разобраться в следующем. На конференциях, в публикациях часто встречаю применение критерия Манна-Уитни (например, когда сравнивают какие-нибудь показатели в двух группах животных: контрольной и получающей препарат X). Но, вроде как, должно быть обоснование использования того или иного критерия. Почитав некоторые работы и обсуждения на данном форуме, немного непонятно: почему бы не использовать, например, ANOVA. При разговоре с авторами получал разные ответы: написано в руководствах, поэтому и применяли; выборка маленькая (по 10 крыс в каждой из групп) и т.д. Поэтому, могли бы специалисты именно в стат. обработке данных пояснить, как правильно и грамотно обосновать применение того же критерия Манна-Уитни? Когда есть необходимость в непараметрику уходить? Здесь вспоминается показательный пример, про который рассказывали на конференции по исследованию биоэквивалентности лс. Результаты существенно отличались: если непараметрику использовать два препарата-эквивалентны, если параметрику-не эквивалентны. Но там, в руководствах, все четко прописано: лог-преобразование данных, ANOVA и т.д. Жду ответа! Заранее благодарен за помощь! Официальная наука - это определённая система договорённостей. Начать можно хотя бы с того, что принятые 5% на ошибку I рода - это просто некое число, не имеющее никакого теоретического фундамента. Но как бы вы ни считали, а трактовать результат придётся относительно этого числа. Поэтому, по большому счёту, независимо от адекватности, мощности, новизны, крутизны и т.д. статистического метода, решение хоть как будет отчасти внестатистическим. Поэтому, если главная задача исследования - практическая, то можно руководствоваться правилом: делать так, чтобы результат принимался коллегами... ну, и хорошо бы, чтобы ещё похвалили . А значит лучше ориентироваться на грамотных и/или авторитетных коллег, на авторитетные руководства. Поскольку в медицине мнение авторитетных людей весит куда больше чем во многих других науках, на первых порах этого будет вполне достаточно. Следуя этой логике, получается, что те, кто говорит "написано в руководствах" очень даже неплохо отвечают. Сложность в том, что эти руководства нужно штудировать. Что касается перечисленных вами методов, то своя логика есть и за всеми этими методами и за многочисленными другими. Логика и возникающие вопросы примерно такие. 1). Почему когда мы сравниваем 2 группы, то сразу говорим о средних (медианах)? Это - так называемые меры положения. А если изменится не среднее, а разброс значений - совсем другая характеристика, которая и оценивается иначе (меры рассеяния, масштаба) и трактуется. А если изменится форма распределения показателя - это, с теоретической точки зрения на процесс пожалуй покруче любого изменения среднего будет... Поэтому методов куда больше перечисленных. Не все можно применить на сверхмалых выборках, но тем не менее... Кстати, в математической статистике малой считается выборка в 25-30 наблюдений, ну а 10 - это уже типа пилотное исследование. 2) Что касается мер положения, то выбор метода можно поставить в зависимость от степени изученности показателя. Если известно, что показатель распределён в популяции нормально или логарифмически нормально, то неразумно отказываться от этой информации. Т.е. лучше опереться на параметры этих распределений, особенно в случае сверхмалых выборок. Поскольку мы в таком параметрическом подходе используем дополнительную информацию (знание о законе распределения в популяции) - получаем выигрыш в мощности. Сложность в том, что характер распределения в популяции нам часто неизвестен, а оценить его по выборке часто не позволяет её объём. В случае параметрического подхода для 2 групп обычно используют t-критерий Стьюдента, в том числе в модификации Уэлча, а не дисперсионный анализ (ANOVA). Хотя оба метода дадут идентичный результат (F-критерий = t2), если не стоит задача вычисления компонентов дисперсии людям привычнее видеть t. 3) Если распределение ненормальное, оно может быть приведено к нормальному с помощью преобразований типа логарифмирования, квадратного корня, Бокса-Кокса и т.д. Глупо ждать нормального распределения от площади, а не от квадратного корня из неё, или нормального распределения от численности популяции организмов, а не от её логарифма. Преобразовываем, сравниваем параметрикой, делаем выводы. Хотя есть на свете упрямцы, которые считают, что "правильные данные" - это те, что они намерили своими примитивными инструментами, а не функции о них, призванные привести в соответствие наши линейки с линейками Природы. 4) Если данные распределены в популяции ненормально или исследователь не хочет их трансформировать - используем непараметрику. Критериев много, у всех свои особенности и ограничения, хотя и не такие строгие как у параметрических методов. Например, критерий Манна - Уитни сравнивает функции распределений, отклоняя нулевую гипотезу подтверждает не все возможные альтернативные и требует одинакового типа распределений. Кто из практиков про это знает/говорит? 5) Всю эту кучу информации можно сделать ненужной для практики, если опираться на другую логику. Зачем мудрить, если можно ответить на вопрос не прибегая к статистическим критериям. Это тот путь, который вам предлагает p2004r. Можно, например, перемешать ваши данные из обеих групп и сделать из них новые выборки, для которых найти разность средних. Потом снова перемешать и снова найти. И так раз эдак тысяч десять. Затем оценить частоту (вероятность) наблюдать имеющуюся разность по сравнению со случайной в перемешанных данных. Это так называемая рандомизационная техника, один из её вариантов. Или можно генерировать новые псевдовыборки из имеющихся данных и находить разность для них, затем построить распределение этой разности и найти его 95% ДИ. Если он содержит ноль - группы не различаются, не содержит - различаются. Это - вариант бутстрепа. Ввиду универсальности и того, что сейчас компьютеры это считают быстро - такие ресэмплинг-техники хорошая альтернатива классческой (не)параметрике. Почитайте Шитикова, книга написана хорошим языком, для людей и с примерами: http://www.ievbras.ru/ecostat/Kiril/Article/A32/Stare.htm Сообщение отредактировал nokh - 25.12.2014 - 19:58 |
|
25.12.2014 - 19:10
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 14 Регистрация: 15.06.2014 Пользователь №: 26464 |
Большое спасибо за ответы! Понятно одно: нужно больше читать толковые книги и руководства и более критично относится к мнению коллег.nokh, отдельное спасибо за ссылку.
Сообщение отредактировал maxandron - 25.12.2014 - 19:11 |
|
25.12.2014 - 20:54
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Поскольку в медицине мнение авторитетных людей весит куда больше чем во многих других науках Когда в так называемой науке царит засилье "авторитетов", то это уже не наука, а секта типа Аум-сенрикё. Медицина - это не шоу бизнес, где крутизна определяется близостью знакомства со метрами, звездами эстрады, вроде Аллы Пугачевой. Уже из самого названия термина "Доказательная медицина" видно, что в первую очередь важны доказательства, а не ссылки на "всеми уважаемых людей в моей деревне". Читайте литературу, разбирайтесь в методах, не доверяйте никому на слово и тогда вы скоро сами станете "авторитетом".Просто включи мозги => http://doctorstat.narod.ru
|
|
26.12.2014 - 21:55
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Когда в так называемой науке царит засилье "авторитетов", то это уже не наука, а секта типа Аум-сенрикё. Медицина - это не шоу бизнес, где крутизна определяется близостью знакомства со метрами, звездами эстрады, вроде Аллы Пугачевой. Уже из самого названия термина "Доказательная медицина" видно, что в первую очередь важны доказательства, а не ссылки на "всеми уважаемых людей в моей деревне". Читайте литературу, разбирайтесь в методах, не доверяйте никому на слово и тогда вы скоро сами станете "авторитетом". В "Доказательной медицине" масса субъективизма остается, просто он сосредоточен в точке -- "что считается за исцеление". Например, бесполезно пытаться доказывать эффект от лечения БА с помощью дыхательной гиперкапнической тренировки, поскольку ДМ (благодаря какому то чудаку) решила что "критерий выздоровления" в этом случае это чуть ли не "соматические изменения" дыхательных путей... Так что субъективизм остается, просто сводиться к выбору "объективных критериев", никто ведь не смотрит на качество жизни, выживаемость некую "совокупную"... просто механически примененный процесс к субъективно выбранному в качестве критерия измеряемому показателю. |
|
26.04.2016 - 19:14
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 2 Регистрация: 26.04.2016 Пользователь №: 28219 |
Хотелось бы уточнить по U-критерию. В одной из статей на просторах интернета его рекомендовали использвоать при объёме выборки от 4 значений и даже от 3, если в другой сравниваемой выборке есть хотя бы 5 значений. И это безотносительно распределения генеральной совокупности. Вроде как он даёт меньше ошибку 1 рода, т.е. что мы ошибочно отклоним H0 и будем говорить о стат. достоврености различий выборок. И вообще t-критерий не применим при таких малых объемах выборок, ведь так? Чем считать тогда?
Если важно, то речь идёт о поведенческих зарактеристиках животных. Процедура получения экспериментальных животных слишком сложна, чтобы увеличить выборку до хотя бы 8-10... Соответственно надо как-то работать с тем что есть. Сейчас 2 группы по 5 жвиотных. исследуемый параметр - % правильно распознанных геометрических фигур от общего числа предъявлений. И время ответа на услвоный сигнал. В ген. совокупности эти параметры имеют нормальное распределение |
|
26.04.2016 - 19:29
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
Хотелось бы уточнить по U-критерию. В одной из статей на просторах интернета его рекомендовали использвоать при объёме выборки от 4 значений и даже от 3, если в другой сравниваемой выборке есть хотя бы 5 значений. И это безотносительно распределения генеральной совокупности. Вроде как он даёт меньше ошибку 1 рода, т.е. что мы ошибочно отклоним H0 и будем говорить о стат. достоврености различий выборок. И вообще t-критерий не применим при таких малых объемах выборок, ведь так? Чем считать тогда? Если важно, то речь идёт о поведенческих зарактеристиках животных. Процедура получения экспериментальных животных слишком сложна, чтобы увеличить выборку до хотя бы 8-10... Соответственно надо как-то работать с тем что есть. Сейчас 2 группы по 5 жвиотных. исследуемый параметр - % правильно распознанных геометрических фигур от общего числа предъявлений. И время ответа на услвоный сигнал. В ген. совокупности эти параметры имеют нормальное распределение Возьмите ГОСТ ИСО 5479-2002: при таком размере выборки вы даже нормальность распределения проверить не сможете. Генеральная совокупность - это все ответы всех животных, т.е. чистая абстракция, так что вряд ли ее кто-то имеет возможность изучить. А вообще применяйте перестановочные тесты или просто получайте бутстреп-оценки нужных параметров. Это лучшее, что можно сделать в такой ситуации. |
|
26.04.2016 - 19:55
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 2 Регистрация: 26.04.2016 Пользователь №: 28219 |
тов. ogurtsov, вы, верно, правы. Бутстреп-метод всегда интересовал, но до практики не доходило. А идея хороша. Специальные программы есть для подобных расчётов? Пользуюсь statistica 10, но там, вроде, не встречал.
Допустим в Exel случайно можно из 5 значений 5 раз надёргать случайные значения, но это ведь всего 5^5=3125 выборок, потом они начнут повторяться, вроде так, если мне память не изменяет. А что делать с ними дальше? Как посчитать вероятность случайно получить ту комбинацию, что составилась при анализе экспериментальной группы животных? Можно где почитать об этом для "чайников"? Или может софт есть спецаильный? P.S. Насчёт нормального расперделения в ген. совокупности, то это априори. давно установлено, что популяция по IQ расперделяется нормально. Середнячки по центру и гении с совершенно глупыми по краям. так что тут сомнений насчёт распределения нет. да и есть работы, где по 300-400 животных анализировалось. там уже шапиро-уилкса можно посчитать... и было посчитано. Сообщение отредактировал Vitek_24 - 26.04.2016 - 19:57 |
|
26.04.2016 - 20:15
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 127 Регистрация: 15.12.2015 Пользователь №: 27760 |
тов. ogurtsov, вы, верно, правы. Бутстреп-метод всегда интересовал, но до практики не доходило. А идея хороша. Специальные программы есть для подобных расчётов? Пользуюсь statistica 10, но там, вроде, не встречал. А вот книга на тему: http://www.ievbras.ru/ecostat/Kiril/Article/A32/Starb.pdf |
|