Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Одновыборочный z-тест и одновыборочный t-тест, В чем различия
paravoz
сообщение 23.12.2013 - 06:41
Сообщение #1





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Уважаемые специалисты подскажите, пожалуйста, чем отличаются одновыборочные z-тест и t-тест.
Изучаю иностранную литературу, но знания английского средние. Так вот изучаю Rosner B. Fundamentals of Biostatistics. Seventh Edition. 2010 (эта книга как-то упоминалась здесь - на форуме), там рассматриваются оба этих теста и они имеют одну и ту же формулу, но в алгоритме
статистической обработки на стр. 258 написано, что если известно стандартное отклонение выборки, то нужно использовать z-тест, а если оно неизвестно - t-тест, но формулы то одинаковые.

Поясните, пожалуйста, в чем тут хитрость.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 23.12.2013 - 11:31
Сообщение #2





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(paravoz @ 23.12.2013 - 07:41) *
Поясните, пожалуйста, в чем тут хитрость.
Я, конечно не гуру, но вот мои соображения. Формулы для одновыборочного теста с известной и неизвестной дисперсиями совокупности могут быть похожими (я не проверял). Но статистики (т.е. функции выборочных характеристик, которые вы подставляете в формулу) разные, их даже разными английскими буквами обозначают: Z (нормальное распределение) и T (распределение Стъюдента). Отличающиеся функции для одинаковых аргументов принимают РАЗНЫЕ значения, поэтому и результаты тестов будут отличаться.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 23.12.2013 - 14:40
Сообщение #3





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(DoctorStat @ 23.12.2013 - 16:31) *
Я, конечно не гуру, но вот мои соображения. Формулы для одновыборочного теста с известной и неизвестной дисперсиями совокупности могут быть похожими (я не проверял). Но статистики (т.е. функции выборочных характеристик, которые вы подставляете в формулу) разные, их даже разными английскими буквами обозначают: Z (нормальное распределение) и T (распределение Стъюдента). Отличающиеся функции для одинаковых аргументов принимают РАЗНЫЕ значения, поэтому и результаты тестов будут отличаться.


Честно. Ничего не понял. Про распределения понял. А вот про тесты не понял.

Формула критерия z: z=(x-X)/(s*sqrt(n)), где x-выборочное среднее, X-значение показателя с которым мы сравниваем выборку, s-стандартное отклонение выборки, sqrt(n)-квадратный корень объема выборки.

Формула одновыборочного критерия t: t=(x-X)/(s*sqrt(n)), где x-выборочное среднее, X-значение показателя с которым мы сравниваем выборку, s-стандартное отклонение выборки, sqrt(n)-квадратный корень объема выборки.

Абсолютно одинаковые, во всяком случае по этой книге. Понятно, что критическое значение с которым в конце концов необходимо будет сравнивать результат будет не одинаковым (в первом случае оно берется на основе нормального распределения, а во втором на основе распределения Стьюдента).

По мнению автора книги, критерий z используется при известном стандартном отклонении, а критерий t при неизвестном стандартном отклонении. Мой главный вопрос: как так?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 23.12.2013 - 15:48
Сообщение #4





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(paravoz @ 23.12.2013 - 15:40) *
Честно. Ничего не понял

ОШИБКА В ФОРМУЛАХ.
Для ответа на ваш вопрос это замечание не принципиально, но всегда полезно поработать над ошибками. В вашей формуле для Z вкралась ма-а-аленькая неточность: s - это стандартное отклонение генеральной совокупности, которая обычно обозначается через сигма, а не ее оценка для данной выборки, см. Википедию: http://ru.wikipedia.org/wiki/Z-%D1%82%D0%B5%D1%81%D1%82

КАКУЮ СТАТИСТИКУ ВЫБРАТЬ.
Теперь попробуем разобраться, почему используются разные статистики: Z и T, и чем они отличаются.
Случай 1. Пусть нам точно известна дисперсия совокупности сигма. По выборке считаем Z0, строим график нормальной функции (колокол), откладываем по оси x полученное значение Z0 и интегрируем нормальную функцию от Z0 до бесконечности (площадь хвоста нормального распределения), чтобы получить значимость p-value нулевой гипотезы. Вместо интегрирования можно использовать таблицы.
Случай 2. Пусть теперь дисперсия совокупности неизвестна и, следовательно, неопределенность ситуации возросла. Чтобы отвергнуть нулевую гипотезу, требуются более сильные аргументы по сравнению с предыдущим случаем. Грубо говоря, для того же вычисленного Z0 мы должны получить большее p-value. Как это сделать? А легко. Нужно просто слегка надавить на функцию нормального распределения сверху, чтобы "прижать, сплющить" ее колокол по направлению к оси абсцисс x. Вот мы и получили функцию распределения Стъюдента!

Сообщение отредактировал DoctorStat - 23.12.2013 - 16:07


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 23.12.2013 - 16:27
Сообщение #5





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(DoctorStat @ 23.12.2013 - 20:48) *
ОШИБКА В ФОРМУЛАХ.
Для ответа на ваш вопрос это замечание не принципиально, но всегда полезно поработать над ошибками. В вашей формуле для Z вкралась ма-а-аленькая неточность: s - это стандартное отклонение генеральной совокупности, которая обычно обозначается через сигма, а не ее оценка для данной выборки, см. Википедию: http://ru.wikipedia.org/wiki/Z-%D1%82%D0%B5%D1%81%D1%82

КАКУЮ СТАТИСТИКУ ВЫБРАТЬ.
Теперь попробуем разобраться, почему используются разные статистики: Z и T, и чем они отличаются.
Случай 1. Пусть нам точно известна дисперсия совокупности сигма. По выборке считаем Z0, строим график нормальной функции (колокол), откладываем по оси x полученное значение Z0 и интегрируем нормальную функцию от Z0 до бесконечности (площадь хвоста нормального распределения), чтобы получить значимость p-value нулевой гипотезы. Вместо интегрирования можно использовать таблицы.
Случай 2. Пусть теперь дисперсия совокупности неизвестна и, следовательно, неопределенность ситуации возросла. Чтобы отвергнуть нулевую гипотезу, требуются более сильные аргументы по сравнению с предыдущим случаем. Грубо говоря, для того же вычисленного Z0 мы должны получить большее p-value. Как это сделать? А легко. Нужно просто слегка надавить на функцию нормального распределения сверху, чтобы "прижать, сплющить" ее колокол по направлению к оси абсцисс x. Вот мы и получили функцию распределения Стъюдента!


Ну вроде более ли менее понятно.
То есть z критерий используется для сравнения при известных генеральном среднем, генеральной дисперсии и выборочном среднем. А t критерий используется при известных генеральном среднем, выборочном среднем и выборочной дисперсии. Правильно я понимаю?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 23.12.2013 - 17:06
Сообщение #6





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(paravoz @ 23.12.2013 - 17:27) *
Ну вроде более ли менее понятно.
То есть z критерий используется для сравнения при известных генеральном среднем, генеральной дисперсии и выборочном среднем. А t критерий используется при известных генеральном среднем, выборочном среднем и выборочной дисперсии. Правильно я понимаю?
Правильно. Можно сказать короче: если среднее и дисперсия совокупности известны, то применяем z-test, если среднее известно, а дисперсия - нет, то t-test. Только учтите, что я - не волшебник и могу ошибаться smile.gif


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 23.12.2013 - 17:29
Сообщение #7





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(DoctorStat @ 23.12.2013 - 22:06) *
Только учтите, что я - не волшебник и могу ошибаться smile.gif


Наверное так. Даже в книге генеральное стандартное отклонение и стандартное отклонение выборки обозначаются по разному (s и сигма). Это свидетельствует о том, что Вы говорите.

Но почему-то в книге оба этих теста демонстрируются на одном и том же примере, в котором одни и те же известные параметры, к сожалению книга так написана, что я не могу понять какие (да уровень знания английского языа видимо подводит). Вот это меня смущает.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Irina_S
сообщение 14.01.2014 - 10:02
Сообщение #8





Группа: Пользователи
Сообщений: 3
Регистрация: 14.01.2014
Пользователь №: 25871



Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 14.01.2014 - 22:23
Сообщение #9





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(Irina_S @ 14.01.2014 - 15:02) *
Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/


Ну теперь наконец понятно что к чему! Спасибо за ссылку, а за ссылку на русский источник огромное спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 15.01.2014 - 21:37
Сообщение #10





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(paravoz @ 14.01.2014 - 23:23) *
Ну теперь наконец понятно что к чему! Спасибо за ссылку, а за ссылку на русский источник огромное спасибо.



Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник?
Вопрос без подвоха. Просто интересно.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 16.01.2014 - 01:45
Сообщение #11





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(100$ @ 16.01.2014 - 02:37) *
Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник?
Вопрос без подвоха. Просто интересно.


Хорошо, резюмирую сию тему.

Тема заключется в отличии z-теста и t-теста. DoctotStat высказал свою точку зрения на данный вопрос, но при этом немного усомнился в этом:
Цитата(DoctorStat @ 23.12.2013 - 22:06) *
Если среднее и дисперсия совокупности известны, то применяем z-test, если среднее известно, а дисперсия - нет, то t-test. Только учтите, что я - не волшебник и могу ошибаться smile.gif


Я также немного сомневался в этом:
Цитата(paravoz @ 23.12.2013 - 22:29) *
Но почему-то в книге оба этих теста демонстрируются на одном и том же примере, в котором одни и те же известные параметры, к сожалению книга так написана, что я не могу понять какие (да уровень знания английского языа видимо подводит). Вот это меня смущает.


Но довольно простое описание на русском языке этих тестов поставило все на свои места.
Цитата(Irina_S @ 14.01.2014 - 15:02) *
Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/


Таким образом, t-тест используется в случае когда известны параметры выборочного распределения, такие как выборочное среднее и выборочное стандартное отклонение и среднее значение генеральной совокупности. А z-тест используется когда известны среднее и стандартное отклонение генеральной совокупности. Эти параметры известны довольно редко, потому z-тест очень редко и используется.

Цитата(100$ @ 16.01.2014 - 02:37) *
Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник?
Вопрос без подвоха. Просто интересно.


По сути, пост Irina_S особо ничего серьезного не объясняет, но такого простецкого описания данных тестов я еще не встречал (кстати, побольше бы таких описаний для всех разделов статистики) и ответить человеку который даже ссылку предоставил на такое замечательное описание, несмотря на то, что оно действительно написано то ли дошколенком, то ли первоклассником (но это и хорошо), я не мог. Вот я и ответил о том, что теперь то все окончательно ясно и поблагодарил Irina_S.

Вот, собственно, что могу сказать по тому что да как. Надеюсь данная тема дает исчерпывающие описания t-теста и z-теста и их отличий для новичков форума и начинающих статистиков.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 16.01.2014 - 13:15
Сообщение #12





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(paravoz @ 16.01.2014 - 02:45) *
Хорошо, резюмирую сию тему.

Тема заключется в отличии z-теста и t-теста. DoctotStat высказал свою точку зрения на данный вопрос, но при этом немного усомнился в этом:


Я также немного сомневался в этом:


Но довольно простое описание на русском языке этих тестов поставило все на свои места.


Таким образом, t-тест используется в случае когда известны параметры выборочного распределения, такие как выборочное среднее и выборочное стандартное отклонение и среднее значение генеральной совокупности. А z-тест используется когда известны среднее и стандартное отклонение генеральной совокупности. Эти параметры известны довольно редко, потому z-тест очень редко и используется.



По сути, пост Irina_S особо ничего серьезного не объясняет, но такого простецкого описания данных тестов я еще не встречал (кстати, побольше бы таких описаний для всех разделов статистики) и ответить человеку который даже ссылку предоставил на такое замечательное описание, несмотря на то, что оно действительно написано то ли дошколенком, то ли первоклассником (но это и хорошо), я не мог. Вот я и ответил о том, что теперь то все окончательно ясно и поблагодарил Irina_S.

Вот, собственно, что могу сказать по тому что да как. Надеюсь данная тема дает исчерпывающие описания t-теста и z-теста и их отличий для новичков форума и начинающих статистиков.


Постой, paravoz, не стучите колеса.

Так какую гипотезу проверяют z-тестом?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 17.01.2014 - 01:50
Сообщение #13





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(100$ @ 16.01.2014 - 18:15) *
Постой, paravoz, не стучите колеса.

Так какую гипотезу проверяют z-тестом?


Гипотезу о равенстве какого-либо значения числа среднему арифетическому генеральной совокупности. Ту же самую, что и одновыборочный t-тест, только при разных известных параметрах.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 17.01.2014 - 10:26
Сообщение #14





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(paravoz @ 17.01.2014 - 02:50) *
Гипотезу о равенстве какого-либо значения числа среднему арифетическому генеральной совокупности. Ту же самую, что и одновыборочный t-тест, только при разных известных параметрах.


А где вы это вычитали? Я о тексте дошколенка, который вы тут расхвалили. В нем даже слово "гипотеза" не употребляется.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 17.01.2014 - 10:49
Сообщение #15





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Цитата(100$ @ 17.01.2014 - 15:26) *
А где вы это вычитали? Я о тексте дошколенка, который вы тут расхвалили. В нем даже слово "гипотеза" не употребляется.


Если вас в действительности интересует, какую гипотезу проверяет z-тест, то считайте, что гипотеза которую я написал в предыдущем моем посте и есть та гипотеза. Я ее верно вам написал.

А если вы интересуетесь, где я это вычитал с целью почитать самому, то Google или Яндекс вам в помощь. На первой же странице куча источников, в которых есть гипотеза, которую проверяет z-тест. Ну это в случае если мне не доверяете или очень хотите почитать.

А по поводу "дошколенка". Так он хотя бы понятно для начинающего пишет. А вам он чем-то не понравился?

Сообщение отредактировал paravoz - 17.01.2014 - 10:54
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему