![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]() ![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 17.04.2007 Пользователь №: 4059 ![]() |
Здравствуйте, участники форума!
Прошу помощи по применению критерия Краскела-Уоллиса в программе STATISTICA. Мне необходимо доказать, что три группы пациентов отличаются по одному признаку. В программе при обработке данных требуется отметить группирующий признак и анализируемые признаки. Как разобраться в этих признаках и правильно отметить группы? Заранее благодарен. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
1. Good for you! А что на этот счет говорит научный руководитель? Если серьезно, по нашему опыту замена медиан на средние в докладах и тексте самая распространенная ошибка при использовании непараметрики
2. Проблема в том, что для критерия важно не распределение в выборке, а в популяции. Оригинально У.Госсет (Стьюдент) делал свой критерий для анализа выборок в 4 наблюдения (попробуйте проверить распределение 4 наблюдений). Поэтому оснований для замены параметрики на непараметрику также нет. Учитывая более низкую мощность непараметрики повышается вероятность ошибки второго рода. Но если, Вы сделали так, то сильного криминала нет, просто я хочу сказать, что Ваш пример не означает, что подобный подход является единственно правильным. Вообще-то если бы Вы повторили расчеты параметрическим дисперсионным анализом и получили те же результаты, то тогда можно было бы быть уверенным, что все хорошо, а вот если бы были расхождения - надо было бы думать. У непараметрики есть еще один серьезный дефект - Вы не можете оценить доверительные интервалы (вообще-то можете, но большинство программ этого не делают), а доверительные интервалы сейчас являются de facto стандартом представления данных. 3. Правильно, но тест Данна не что иное как тест Бонферрони для непараметрических сравнений (см. выше по поводу Бонферрони). 4. Есть разные варианты теста Данна, вместо Крускала-Уоллеса можно использовать Ван-дер-Ваардена, есть и другие варианты, однако самое главное, что следует из 2-3, при переходе от параметрики к непараметрике Вы теряете информацию. Непараметрика не использует всю информацию, которая есть в выборке. Для непараметрики сравнение А и Б с А=1,2,3 и Б=4,5,6 аналогична А=1,2,3 и Б=24,25,26, хотя, взгляд на цифры, я думаю, убедит Вас, что второй вариант все-таки значительнос отличается от первого... В принципе, каждый исследователь выбирает то, что он считает правильным, просто должен быть готов отстоять свой выбор и, фраза "использовали параметрический дисперисонный анализ, поскольку известно, что он достаточно устойчив к отклонениям от нормальности" лучше (на мой вкус), чем фраза "использовали критерий Данна, так как других не знаем, а непараметрикой пользовались, поскольку выборка была маленькая, а о генеральной совокупнсоти ничего не знаем". В последнем случае, злобный рецензент должен сказать - "пойдите, узнайте больше об объекте исследования и тогда возвращайтесь, ибо иначе ваши данные все равно никуда не годятся - 15 человек из генеральной совокупности неизвестной гетерогенности могут быть не репрезентативными и, соответственно, все результаты бессчмысленны". Предстваьте себе случайную выборку 10 детей в возрасте от 0 до 18 и распределение их роста и сравните две случайно выбранные группы по 10 детей по росту... Нет, тут и параметрика не поможет, я просто хочу сказать, что защита "у нас мало наблюдений" - это не защита. К этому вообще лучше внимания не привлекать, ибо от Вас никто не требует защищаться/публиковаться - Вы это делаете сами, когда считаете, что эксперимент завершен. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 23 Регистрация: 20.05.2007 Пользователь №: 4112 ![]() |
Прочитав Ваш ответ, я вспомнил, что многие солидные журналы, например Nature, Science и др., печатают статьи, где используют критерий Стьюдента при сравнении групп из 4-5 наблюдений и почти нет непараметрики! Нда...
Получается, что непараметрикой нужно пользоваться тогда, когда на большом количестве наблюдений доказано, что распределение действительно ненормальное, а в идеале, наверное, еще нужно объяснить, почему оно ненормальное. Так? Конкретный пример. Есть две серии из 10 наблюдений (а в экспериментальной медицине редко ведь делают выборки большего объема!). Анализировался какой-нибудь мало известный показатель клеточной функции, большие выборки по этому показателю никто не делал (как, например, для роста, веса и проч.). Проверяю нормальность в группах и получаю, что распределение ненормальное (критерий Шапиро-Уилка, P=0.001) и, кроме того, дисперсии не одинаковые (а на сколько я понимаю, нормальности распределения и равенство дисперсий сравниваемых групп - это два необходимых условия для использования параметрики). И что? Все равно надо использую параметрический дисперисонный анализ, т.к. он "достаточно устойчив к отклонениям от нормальности" (обычно говорят "к небольшим отклонениям от нормальности")? или забраковать все исследования из-за нерепрезентативности выборок (а о какой репрезентативности можно говорить, если выборки из 4 наблюдений - см. выше)? или все же можно воспользоваться непараметрическими критериями, которые не нуждаются в предположениях о типе распределения? Пусть в случае нормальности распределения непараметрика несколько повышает ошибку второго рода, но, с другой стороны, она ведь защищает от случая, когда параметрикой действительно пользоваться нельзя! Диалог 1: - Вы сравниваете группы из 10 наблюдений. На каком основании использовали параметрику? Вы не имеете представления о характере распределения и не можете его проверить, к тому же дисперсии в сравниваемых группах не равны. - Потому что параметрика устойчива к отклонению от нормальности. Диалог 2: - Вы сравниваете группы из 10 наблюдений и используете при этом непараметрику. Вы убедились в ненормальности распределения? - Ввиду малого числа наблюдений [а 10 это больше, чем 4! см. выше], когда невозможно однозначно сказать о характере распределения, были использованы непараметрические критерии, не учитывающие характер распределения. Какая защита Вам кажется более убедительной? Еще я хотел спросить: я описал выборки с помощью медианы и межквартильного интервала, а затем оценил различия между ними, применив непараметрический критерий, например критерий Манна-Уитни, и в результате выявил, что различия статистически значимы. Например, медианное значение показателя в группе А составило 100 единиц, а в группе В - 200. Можно ли при этом сказать, что медианное значение показателя в группе В в 2 раза превышало медианное значение показателя в группе А (или медианное значение в группе В на 100% превышало медианное значение в группе А), или такое сравнение допустимо только для выборочных средних при условии нормального распределения? Если я использовал критерий Уилкоксона для парных сравнений, можно ли различия представить как разность медиан двух групп, или критерий Уилкоксона позволяет сказать, что есть различия между этими группами и все, а количественно выразить эти различия нельзя (как, например, при использовании парного критерия Стьюдента)? По скольку указание доверительных интервалов является стандартом представления данных, как подсчитать доверительный интервал для медианных значений групп и, если такое в принципе возможно, доверительный интервал для изменения медианных значений? В сети мне попался такой вариант описания: "показатели были снижены на 46% (вероятность 0,54, 95% доверительный интервал 0,29-0,98, р=0,045)". Корректна ли данная запись? Что означает "вероятность 0,54"? - это чувствительность критерия, вероятность обнаружить такие-то различия при заданном значении альфа, объеме выборке? Значит ли, что в этом примере вероятность нулевой гипотезы будет 1-0,54? Можно ли приведенную цитату понимать так: "Выявлены статистически значимое (при условии, что альфа 0,05, разумеется) уменьшение показателя на 46%. Вероятность обнаружить такое изменение составляла 54%. С 95% надежностью можно утверждать, что снижение происходит не менее, чем на 29% и не более чем на 98%". Я прав? Можно ли эту запись принять за образец описания результатов? Нужно ли в диссертации указывать доверительный интервал для выборочного среднего или достаточно привести доверительный интервал для разности средних? |
|
![]() |
![]() |
![]() ![]() |