![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
![]() Группа: Пользователи Сообщений: 1141 Регистрация: 10.04.2007 Пользователь №: 4040 ![]() |
Когда двустороннее P-значение статистики критерия равно удвоенному одностороннему, а когда нет?
![]() Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
![]() Группа: Пользователи Сообщений: 1141 Регистрация: 10.04.2007 Пользователь №: 4040 ![]() |
Про общеупотребительную формулу, считающую одностороннюю вероятность не понятно. При чем тут "общеупотребительная формула, считающую одностороннюю вероятность"? Никто о ней не говорил. Формула для критерия: t = |m1 - m2| / s / sqrt(1 / n1 + 1 / n2), где m1 и m2 - средние совокупностей, s - оценка выборочной дисперсии, n1 и n2 - численности совокупностей. Квадрат s считается как s2 = (s12(n1 - 1) + s22(n2 - 1)) / (n1 + n2 - 2), где s12 и s22 - оценки выборочных дисперсий. По таблицам для вычисленного t и для (n1 + n2 - 2) степеней свободы можно найти p-значение. Можно его посчитать и как корень уравнения через обратную функцию t-распределения (кто умеет - не суть важно). Прошу прощения, обозначения кривы из-за невозможности ввода формул в форуме. Возможно потому что не считаю в Excel'е статистику - не знаю что там за формулы. Для t-критерия должны выдаваться только степень свободы и значение t - оно ведь будет одинаковым независимо от одно-двусторонности. А одно- или двусторонняя P считается далее по этому t...? Excel тут не при чем. Использован только в качестве доступного средства анализа данных, данный тест считающий правильно, а потому годный для сравнительного анализа. Приведенные данные примера не очень удобны чтобы разбираться, лучше бы иметь значение P в диапазоне, который более-менее подробно табулирован в руководствах. Менее 0,001 - очень мало. Данные примера нужны лишь для того, чтобы подставить их в формулу и посмотреть результат. Без его трактовки. Только цифры. Для сравнения. Большие - малые - не имеет значения. Обсуждается проблема, что именно считает формула, а не значимость теста. Из бесплатных пакетов очень рекомендую попробовать KyPlot. Она есть в списке бесплатных программ, который вы здесь раньше выкладывали. Прямая ссылка: http://freestatistics.altervista.org/kyp2b15.zip Данной программы нет в упомянутом списке, и слышу о ней впервые. Но спасибо. К сожалению, ссылка битая. Но бета-версию упомянутой программы можно найти в Интернете. Например, тут http://woundedmoon.org/win32/kyp2b15.exe. А вот что к великому сожалению, программа KyPlot перестала быть бесплатной. Ссылка http://www.kyenslab.com/en/index.html. ![]() Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Данные примера нужны лишь для того, чтобы подставить их в формулу и посмотреть результат. Без его трактовки. Только цифры. Для сравнения. Большие - малые - не имеет значения. Обсуждается проблема, что именно считает формула, а не значимость теста. Статистические таблицы в хороших руководствах точнее чем результаты кривоватых программ. В особенности это справедливо для значений на концах распределений. Известно, что Exсel не является статистическим пакетом, и не принимается в качестве такового по крайней мере некоторыми профессиональными статистиками (быстро ссылку не найду). Неточность статистических функций в Excel'е поднималась на этом форуме, правда давно, в "прошлой жизни" сайта. В интернете про это можно немало найти, хороший обзор проблем здесь: http://www.practicalstats.com/xlsstats/excelstats.html . Есть и другие пакеты, доверие к которым было когда-то и чем-то подорвано. Например, обнаружением в известном пакете кусков кода статистических алгоритмов из продукта SYSTAT. Поэтому чтобы разбираться со значениями P лучше иметь и программы и хорошие статистические таблицы. В статистических таблицах наиболее полно табулирован интервал значений, сопровождающий принятие решения. Где-то от 0,15 до 0,01. Значение P=0,0001254896 из примера (1) находится на конце распределения, а здесь экселю (и другим потенциально кривоватым программам) нет доверия и (2) если я захочу найти это значение P в хорошей статистической таблице, то не смогу этого сделать, уж больно оно маленькое. Именно это я хотел сказать фразой, что "приведенные данные примера не очень удобны чтобы разбираться". Обсуждение программы KyPlot вынесу в имеющуюся более подходящую ветку. |
|
![]() |
![]() |
![]() ![]() |