Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Критерий Стьюдента, Манна-Уитни и ANOVA, Почему при при множественных сравнениях берём ANOVA?
Cules2013
сообщение 9.07.2019 - 20:20
Сообщение #1





Группа: Пользователи
Сообщений: 27
Регистрация: 5.02.2018
Пользователь №: 30938



Давно меня мучает такой вопрос (может и профанский, но тем не менее): вот смотрите, у нас есть 3 несвязанные выборки с а) нормальным распределением б) не соответствующим нормальному. Значит, вариант "а" мы сравниваем между собой ANOVA (допустим по Тьюки), вараинт "б" - тестом Данна или ещё как-то.
Но вот в чём соль - если мы просто попарно сравним группы между собой тестами Стьюдента и Манна-Уитни, то уровень p будет "выше", т.е. ближе к заветным 0,05, т.е. отклонить нулевую гипотезу легче. Логично, что мы не можем использовать для множественного сравнения метод Стьюдента или Манна-Уитни из-за увеличивающихся ошибок первого и второго рода при увеличении числа выборок. Но, почему же мы не можем брать попарное сравнение вручную? Тем более вот ещё хитрость - у нас есть эти самые 3 выборки, но если бы мы провели бы эксперимент только с 2 выборками, то выборка 1 и 2 были бы идентичны выборкам 1 и 2 из 1-го эксперимента, а выборки 3 просто бы не существовало. И тогда бы мы со спокойной душой сравнили бы 2 выборки по Стьюденту или Манна-Уитни и нашли бы достоверные отличия. Однако, сравнив множественно ANOVA 3 выборки, мы получаем, что между 1 и 2 нет достоверных отличий. В какой-то стат книге вроде как вычитал, что увеличение выборок и их объёма даёт увеличение стат мощности при расчёте, но на практике уже 100 наблюдал, как обычный критерий Стьюдента оказывается мощнее. И как жить дальше после этого? Может я дурак, чего-то не догоняю? И, главное, если мы берём рисуем график со средним и ошибкой среднего, то усы не перекрываются, но если берём 95% ДИ - перекрываются, т.е. результаты о недостоверности ANOVA подтверждаются, а Стьюдента - нет. Почему тогда в статьях почти все всегда дают ошибку среднего, а не ДИ, если он информативнее?

Сообщение отредактировал Cules2013 - 9.07.2019 - 20:22
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 13.07.2019 - 06:51
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Вот скажите, в чем наша цель: 1) найти статистически значимые различия или 2) приблизиться к пониманию устройства мира? Поскольку не для студента/аспиранта, а для учёного очевидно, что (2), многим можно пожертвовать лишь бы не сделать лжеоткрытия. То, что мы не обнаружим пока чего-то, что реально есть в устройстве мира (ошибка второго рода) не так страшно: жили же как-то до этого, не обнаружили мы - обнаружат наши последователи или потомки. А вот если мы обнаружим что-то чего на самом деле нет (ошибка первого рода) и будем действовать далее под влиянием этого заблуждения, то можем наломать дров... Именно поэтому при планировании исследований ошибка второго рода допускается и закладывается в несколько раз большей, чем первой. Поэтому когда в двух группах различия по Стьюденту есть, а в нескольких - нет, нужно в первую очередь радоваться тому, что вам удалось собрать материал не по маленькому кусочку реальности, а иметь более полную картину, иначе бы вы наломали дров. А то что какие-то различия стали незначимыми - да и хрен с ними... Ну и про множественность сравнений: если не выдрать две выборки из материала и забыть про остальные, то ведь нужно делать достаточно консервативные поправки на множественность сравнений, после которых значимость часто теряется.

В случае нормального распределения половинка 95% ДИ (положительная или отрицательная по отношению к среднему, не важно) вычисляется как стандартная ошибка, умноженная на критическое значение распределения Стьюдента. Поскольку для бесконечно большой выборки при альфа=0,05 это значение равно 1,96, то в реальных выборках оно больше двух. Т.е. интервал по усам ст. ошибки всегда как минимум в два раза уже, чем 95% ДИ. По поводу "пользы" ст. ошибки для описания данных - см. в руководствах Ланга в соседней теме. А на вопрос "Почему тогда в статьях почти все всегда дают ошибку среднего, а не ДИ" ответ: потому что бараны, т.е.: 1) невежественны и 2) упёрты/консервативны.

Сообщение отредактировал nokh - 13.07.2019 - 06:54
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Cules2013
сообщение 15.07.2019 - 12:27
Сообщение #3





Группа: Пользователи
Сообщений: 27
Регистрация: 5.02.2018
Пользователь №: 30938



Спасибо за ответы на вопросы. Всегда грамотно и по делу.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему