Тест Манна-Уитни в Statistica 6.0 Как правильно представить?, Выводятся три значения р, какое из них представить? |
Здравствуйте, гость ( Вход | Регистрация )
Тест Манна-Уитни в Statistica 6.0 Как правильно представить?, Выводятся три значения р, какое из них представить? |
16.10.2010 - 13:32
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 14.10.2010 Пользователь №: 22819 |
Здравствуйте, коллеги!
В результатах теста Манна-Уитни выводятся следующие значения: U, Z, p-level, Z-adjusted, снова p-level и 2*1 sided exat p. Что эти значения обозначают, какие из этих значений важны? Какие значения приводить в своей работе, особенно какой уровень p (хотя они все примерно одинаковы)? Я так понимаю, что нам выводятся уточненные на объем выборки значения и результат 2-х стороннего теста. С уважением, Lev |
|
16.10.2010 - 13:50
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Здравствуйте, коллеги! В результатах теста Манна-Уитни выводятся следующие значения: U, Z, p-level, Z-adjusted, снова p-level и 2*1 sided exat p. Что эти значения обозначают, какие из этих значений важны? Какие значения приводить в своей работе, особенно какой уровень p (хотя они все примерно одинаковы)? Я так понимаю, что нам выводятся уточненные на объем выборки значения и результат 2-х стороннего теста. С уважением, Lev Посмотрели бы Help - там всё описано. Разбирались здесь: http://forum.disser.ru/index.php?showtopic=1673 , см #14. Для небольших объёмов выборки лучше 2*1 sided exat p, но в этом варианте в Statistica не учитываются связки, что увеличивает консервативность критерия. |
|
16.10.2010 - 14:15
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 14.10.2010 Пользователь №: 22819 |
nokh, спасибо за ответ!
Я прочитал Help и понял следующее: при выборке более 20 программа выдает значение р на основе параметрического аналога теста Манна-Уитни, считая его более точным. Но у меня все данные по ранговой шкале, размеры групп 30-100. Вопрос: мне лучше в данном случае ориентироваться на самое первое значение р ? |
|
16.10.2010 - 15:02
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
nokh, спасибо за ответ! Я прочитал Help и понял следующее: при выборке более 20 программа выдает значение р на основе параметрического аналога теста Манна-Уитни, считая его более точным. Но у меня все данные по ранговой шкале, размеры групп 30-100. Вопрос: мне лучше в данном случае ориентироваться на самое первое значение р ? Нет, о параметрике здесь речи не идёт. Речь идёт о возможности аппроксимации U-статистики нормальным распределением (центральная предельная теорема). Такая аппроксимация допустима если объёмы выборок больше 8 (Закс, Статистическое оценивание), если 20 и более (ваш случай) - вообще проблем нет. Если данные изначально представлены порядковой шкалой должно быть много одинаковых значений в обеих группах (связок - ties). В этом случае однозначно лучше использовать нормальную аппроксимацию лишь бы учесть связки, т.к. без их учёта тест становится слишком консервативным (величина р завышена - увеличивается ошибка II типа). Т.е. В Вашем случае безальтернативно - наилучшее из того, что выдаёт для этого критерия Statistica - второе значение P из трёх имеющихся, т.е. с нормальной аппроксимацией и учётом связок. |
|
16.10.2010 - 15:50
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 14.10.2010 Пользователь №: 22819 |
nokh, можно еще вопрос. А есть ли необходимость приводить в работе помимо значения р еще и значение U ?
|
|
16.10.2010 - 16:29
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
nokh, можно еще вопрос. А есть ли необходимость приводить в работе помимо значения р еще и значение U ? Обязательно. Более того, для этого критерия нужно привести ещё и объёмы выборок (для хи-квадрат, t-критерия и мн. других приводятся не объёмы выборок, а степени свободы). Я их даю нижним индексом в скобках, например: U[10; 10]= 25,0; P=0,063. И ещё: эта программа "по умолчанию" выдаёт слишком много цифр, лучше округлять до 3 знаков после запятой, т.е. писать не p=0,002892, а р=0,003. Если выдаёт 0,000028 или 0,000000 - писать р<0,001 (или р<<0,001). В принципе, слишком малое значение р для эксперимента - тоже плохо: это значит исследование плохо планировались и наблюдался переизбыток доказательств для отвержения нулевой гипотезы, т.е. попросту деньги тратились нерационально. Сообщение отредактировал nokh - 16.10.2010 - 16:32 |
|
17.10.2010 - 18:44
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 14.10.2010 Пользователь №: 22819 |
nokh, спасибо Вам большое !
Надеюсь, Ваши ответы помогут многим людям грамотно представить статистические данные в своих работах. У меня есть еще похожие вопросы, мне бы хотелось их задать потом в отдельных темах. |
|