Критерий Стьюдента, Манна-Уитни и ANOVA - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Добавить ответ в эту тему

Открыть тему

Критерий Стьюдента, Манна-Уитни и ANOVA, Почему при при множественных сравнениях берём ANOVA?

Cules2013 Просмотр профиля	9.07.2019 - 20:20 Сообщение #1
Группа: Пользователи Сообщений: 27 Регистрация: 5.02.2018 Пользователь №: 30938	Давно меня мучает такой вопрос (может и профанский, но тем не менее): вот смотрите, у нас есть 3 несвязанные выборки с а) нормальным распределением б) не соответствующим нормальному. Значит, вариант "а" мы сравниваем между собой ANOVA (допустим по Тьюки), вараинт "б" - тестом Данна или ещё как-то. Но вот в чём соль - если мы просто попарно сравним группы между собой тестами Стьюдента и Манна-Уитни, то уровень p будет "выше", т.е. ближе к заветным 0,05, т.е. отклонить нулевую гипотезу легче. Логично, что мы не можем использовать для множественного сравнения метод Стьюдента или Манна-Уитни из-за увеличивающихся ошибок первого и второго рода при увеличении числа выборок. Но, почему же мы не можем брать попарное сравнение вручную? Тем более вот ещё хитрость - у нас есть эти самые 3 выборки, но если бы мы провели бы эксперимент только с 2 выборками, то выборка 1 и 2 были бы идентичны выборкам 1 и 2 из 1-го эксперимента, а выборки 3 просто бы не существовало. И тогда бы мы со спокойной душой сравнили бы 2 выборки по Стьюденту или Манна-Уитни и нашли бы достоверные отличия. Однако, сравнив множественно ANOVA 3 выборки, мы получаем, что между 1 и 2 нет достоверных отличий. В какой-то стат книге вроде как вычитал, что увеличение выборок и их объёма даёт увеличение стат мощности при расчёте, но на практике уже 100 наблюдал, как обычный критерий Стьюдента оказывается мощнее. И как жить дальше после этого? Может я дурак, чего-то не догоняю? И, главное, если мы берём рисуем график со средним и ошибкой среднего, то усы не перекрываются, но если берём 95% ДИ - перекрываются, т.е. результаты о недостоверности ANOVA подтверждаются, а Стьюдента - нет. Почему тогда в статьях почти все всегда дают ошибку среднего, а не ДИ, если он информативнее? Сообщение отредактировал Cules2013 - 9.07.2019 - 20:22

nokh Просмотр профиля	13.07.2019 - 06:51 Сообщение #2
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Вот скажите, в чем наша цель: 1) найти статистически значимые различия или 2) приблизиться к пониманию устройства мира? Поскольку не для студента/аспиранта, а для учёного очевидно, что (2), многим можно пожертвовать лишь бы не сделать лжеоткрытия. То, что мы не обнаружим пока чего-то, что реально есть в устройстве мира (ошибка второго рода) не так страшно: жили же как-то до этого, не обнаружили мы - обнаружат наши последователи или потомки. А вот если мы обнаружим что-то чего на самом деле нет (ошибка первого рода) и будем действовать далее под влиянием этого заблуждения, то можем наломать дров... Именно поэтому при планировании исследований ошибка второго рода допускается и закладывается в несколько раз большей, чем первой. Поэтому когда в двух группах различия по Стьюденту есть, а в нескольких - нет, нужно в первую очередь радоваться тому, что вам удалось собрать материал не по маленькому кусочку реальности, а иметь более полную картину, иначе бы вы наломали дров. А то что какие-то различия стали незначимыми - да и хрен с ними... Ну и про множественность сравнений: если не выдрать две выборки из материала и забыть про остальные, то ведь нужно делать достаточно консервативные поправки на множественность сравнений, после которых значимость часто теряется. В случае нормального распределения половинка 95% ДИ (положительная или отрицательная по отношению к среднему, не важно) вычисляется как стандартная ошибка, умноженная на критическое значение распределения Стьюдента. Поскольку для бесконечно большой выборки при альфа=0,05 это значение равно 1,96, то в реальных выборках оно больше двух. Т.е. интервал по усам ст. ошибки всегда как минимум в два раза уже, чем 95% ДИ. По поводу "пользы" ст. ошибки для описания данных - см. в руководствах Ланга в соседней теме. А на вопрос "Почему тогда в статьях почти все всегда дают ошибку среднего, а не ДИ" ответ: потому что бараны, т.е.: 1) невежественны и 2) упёрты/консервативны. Сообщение отредактировал nokh - 13.07.2019 - 06:54

Cules2013 Просмотр профиля	15.07.2019 - 12:27 Сообщение #3
Группа: Пользователи Сообщений: 27 Регистрация: 5.02.2018 Пользователь №: 30938	Спасибо за ответы на вопросы. Всегда грамотно и по делу.

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2024 IPS, Inc.