Одновыборочный z-тест и одновыборочный t-тест, В чем различия |
Здравствуйте, гость ( Вход | Регистрация )
Одновыборочный z-тест и одновыборочный t-тест, В чем различия |
23.12.2013 - 06:41
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Уважаемые специалисты подскажите, пожалуйста, чем отличаются одновыборочные z-тест и t-тест.
Изучаю иностранную литературу, но знания английского средние. Так вот изучаю Rosner B. Fundamentals of Biostatistics. Seventh Edition. 2010 (эта книга как-то упоминалась здесь - на форуме), там рассматриваются оба этих теста и они имеют одну и ту же формулу, но в алгоритме статистической обработки на стр. 258 написано, что если известно стандартное отклонение выборки, то нужно использовать z-тест, а если оно неизвестно - t-тест, но формулы то одинаковые. Поясните, пожалуйста, в чем тут хитрость. |
|
23.12.2013 - 11:31
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Поясните, пожалуйста, в чем тут хитрость. Я, конечно не гуру, но вот мои соображения. Формулы для одновыборочного теста с известной и неизвестной дисперсиями совокупности могут быть похожими (я не проверял). Но статистики (т.е. функции выборочных характеристик, которые вы подставляете в формулу) разные, их даже разными английскими буквами обозначают: Z (нормальное распределение) и T (распределение Стъюдента). Отличающиеся функции для одинаковых аргументов принимают РАЗНЫЕ значения, поэтому и результаты тестов будут отличаться.Просто включи мозги => http://doctorstat.narod.ru
|
|
23.12.2013 - 14:40
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Я, конечно не гуру, но вот мои соображения. Формулы для одновыборочного теста с известной и неизвестной дисперсиями совокупности могут быть похожими (я не проверял). Но статистики (т.е. функции выборочных характеристик, которые вы подставляете в формулу) разные, их даже разными английскими буквами обозначают: Z (нормальное распределение) и T (распределение Стъюдента). Отличающиеся функции для одинаковых аргументов принимают РАЗНЫЕ значения, поэтому и результаты тестов будут отличаться. Честно. Ничего не понял. Про распределения понял. А вот про тесты не понял. Формула критерия z: z=(x-X)/(s*sqrt(n)), где x-выборочное среднее, X-значение показателя с которым мы сравниваем выборку, s-стандартное отклонение выборки, sqrt(n)-квадратный корень объема выборки. Формула одновыборочного критерия t: t=(x-X)/(s*sqrt(n)), где x-выборочное среднее, X-значение показателя с которым мы сравниваем выборку, s-стандартное отклонение выборки, sqrt(n)-квадратный корень объема выборки. Абсолютно одинаковые, во всяком случае по этой книге. Понятно, что критическое значение с которым в конце концов необходимо будет сравнивать результат будет не одинаковым (в первом случае оно берется на основе нормального распределения, а во втором на основе распределения Стьюдента). По мнению автора книги, критерий z используется при известном стандартном отклонении, а критерий t при неизвестном стандартном отклонении. Мой главный вопрос: как так? |
|
23.12.2013 - 15:48
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Честно. Ничего не понял ОШИБКА В ФОРМУЛАХ. Для ответа на ваш вопрос это замечание не принципиально, но всегда полезно поработать над ошибками. В вашей формуле для Z вкралась ма-а-аленькая неточность: s - это стандартное отклонение генеральной совокупности, которая обычно обозначается через сигма, а не ее оценка для данной выборки, см. Википедию: http://ru.wikipedia.org/wiki/Z-%D1%82%D0%B5%D1%81%D1%82 КАКУЮ СТАТИСТИКУ ВЫБРАТЬ. Теперь попробуем разобраться, почему используются разные статистики: Z и T, и чем они отличаются. Случай 1. Пусть нам точно известна дисперсия совокупности сигма. По выборке считаем Z0, строим график нормальной функции (колокол), откладываем по оси x полученное значение Z0 и интегрируем нормальную функцию от Z0 до бесконечности (площадь хвоста нормального распределения), чтобы получить значимость p-value нулевой гипотезы. Вместо интегрирования можно использовать таблицы. Случай 2. Пусть теперь дисперсия совокупности неизвестна и, следовательно, неопределенность ситуации возросла. Чтобы отвергнуть нулевую гипотезу, требуются более сильные аргументы по сравнению с предыдущим случаем. Грубо говоря, для того же вычисленного Z0 мы должны получить большее p-value. Как это сделать? А легко. Нужно просто слегка надавить на функцию нормального распределения сверху, чтобы "прижать, сплющить" ее колокол по направлению к оси абсцисс x. Вот мы и получили функцию распределения Стъюдента! Сообщение отредактировал DoctorStat - 23.12.2013 - 16:07 Просто включи мозги => http://doctorstat.narod.ru
|
|
23.12.2013 - 16:27
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
ОШИБКА В ФОРМУЛАХ. Для ответа на ваш вопрос это замечание не принципиально, но всегда полезно поработать над ошибками. В вашей формуле для Z вкралась ма-а-аленькая неточность: s - это стандартное отклонение генеральной совокупности, которая обычно обозначается через сигма, а не ее оценка для данной выборки, см. Википедию: http://ru.wikipedia.org/wiki/Z-%D1%82%D0%B5%D1%81%D1%82 КАКУЮ СТАТИСТИКУ ВЫБРАТЬ. Теперь попробуем разобраться, почему используются разные статистики: Z и T, и чем они отличаются. Случай 1. Пусть нам точно известна дисперсия совокупности сигма. По выборке считаем Z0, строим график нормальной функции (колокол), откладываем по оси x полученное значение Z0 и интегрируем нормальную функцию от Z0 до бесконечности (площадь хвоста нормального распределения), чтобы получить значимость p-value нулевой гипотезы. Вместо интегрирования можно использовать таблицы. Случай 2. Пусть теперь дисперсия совокупности неизвестна и, следовательно, неопределенность ситуации возросла. Чтобы отвергнуть нулевую гипотезу, требуются более сильные аргументы по сравнению с предыдущим случаем. Грубо говоря, для того же вычисленного Z0 мы должны получить большее p-value. Как это сделать? А легко. Нужно просто слегка надавить на функцию нормального распределения сверху, чтобы "прижать, сплющить" ее колокол по направлению к оси абсцисс x. Вот мы и получили функцию распределения Стъюдента! Ну вроде более ли менее понятно. То есть z критерий используется для сравнения при известных генеральном среднем, генеральной дисперсии и выборочном среднем. А t критерий используется при известных генеральном среднем, выборочном среднем и выборочной дисперсии. Правильно я понимаю? |
|
23.12.2013 - 17:06
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Ну вроде более ли менее понятно. Правильно. Можно сказать короче: если среднее и дисперсия совокупности известны, то применяем z-test, если среднее известно, а дисперсия - нет, то t-test. Только учтите, что я - не волшебник и могу ошибаться То есть z критерий используется для сравнения при известных генеральном среднем, генеральной дисперсии и выборочном среднем. А t критерий используется при известных генеральном среднем, выборочном среднем и выборочной дисперсии. Правильно я понимаю? Просто включи мозги => http://doctorstat.narod.ru
|
|
23.12.2013 - 17:29
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Только учтите, что я - не волшебник и могу ошибаться Наверное так. Даже в книге генеральное стандартное отклонение и стандартное отклонение выборки обозначаются по разному (s и сигма). Это свидетельствует о том, что Вы говорите. Но почему-то в книге оба этих теста демонстрируются на одном и том же примере, в котором одни и те же известные параметры, к сожалению книга так написана, что я не могу понять какие (да уровень знания английского языа видимо подводит). Вот это меня смущает. |
|
14.01.2014 - 10:02
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 14.01.2014 Пользователь №: 25871 |
Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/
|
|
14.01.2014 - 22:23
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/ Ну теперь наконец понятно что к чему! Спасибо за ссылку, а за ссылку на русский источник огромное спасибо. |
|
15.01.2014 - 21:37
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Ну теперь наконец понятно что к чему! Спасибо за ссылку, а за ссылку на русский источник огромное спасибо. Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник? Вопрос без подвоха. Просто интересно. |
|
16.01.2014 - 01:45
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник? Вопрос без подвоха. Просто интересно. Хорошо, резюмирую сию тему. Тема заключется в отличии z-теста и t-теста. DoctotStat высказал свою точку зрения на данный вопрос, но при этом немного усомнился в этом: Если среднее и дисперсия совокупности известны, то применяем z-test, если среднее известно, а дисперсия - нет, то t-test. Только учтите, что я - не волшебник и могу ошибаться Я также немного сомневался в этом: Но почему-то в книге оба этих теста демонстрируются на одном и том же примере, в котором одни и те же известные параметры, к сожалению книга так написана, что я не могу понять какие (да уровень знания английского языа видимо подводит). Вот это меня смущает. Но довольно простое описание на русском языке этих тестов поставило все на свои места. Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/ Таким образом, t-тест используется в случае когда известны параметры выборочного распределения, такие как выборочное среднее и выборочное стандартное отклонение и среднее значение генеральной совокупности. А z-тест используется когда известны среднее и стандартное отклонение генеральной совокупности. Эти параметры известны довольно редко, потому z-тест очень редко и используется. Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник? Вопрос без подвоха. Просто интересно. По сути, пост Irina_S особо ничего серьезного не объясняет, но такого простецкого описания данных тестов я еще не встречал (кстати, побольше бы таких описаний для всех разделов статистики) и ответить человеку который даже ссылку предоставил на такое замечательное описание, несмотря на то, что оно действительно написано то ли дошколенком, то ли первоклассником (но это и хорошо), я не мог. Вот я и ответил о том, что теперь то все окончательно ясно и поблагодарил Irina_S. Вот, собственно, что могу сказать по тому что да как. Надеюсь данная тема дает исчерпывающие описания t-теста и z-теста и их отличий для новичков форума и начинающих статистиков. |
|
16.01.2014 - 13:15
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Хорошо, резюмирую сию тему. Тема заключется в отличии z-теста и t-теста. DoctotStat высказал свою точку зрения на данный вопрос, но при этом немного усомнился в этом: Я также немного сомневался в этом: Но довольно простое описание на русском языке этих тестов поставило все на свои места. Таким образом, t-тест используется в случае когда известны параметры выборочного распределения, такие как выборочное среднее и выборочное стандартное отклонение и среднее значение генеральной совокупности. А z-тест используется когда известны среднее и стандартное отклонение генеральной совокупности. Эти параметры известны довольно редко, потому z-тест очень редко и используется. По сути, пост Irina_S особо ничего серьезного не объясняет, но такого простецкого описания данных тестов я еще не встречал (кстати, побольше бы таких описаний для всех разделов статистики) и ответить человеку который даже ссылку предоставил на такое замечательное описание, несмотря на то, что оно действительно написано то ли дошколенком, то ли первоклассником (но это и хорошо), я не мог. Вот я и ответил о том, что теперь то все окончательно ясно и поблагодарил Irina_S. Вот, собственно, что могу сказать по тому что да как. Надеюсь данная тема дает исчерпывающие описания t-теста и z-теста и их отличий для новичков форума и начинающих статистиков. Постой, paravoz, не стучите колеса. Так какую гипотезу проверяют z-тестом? |
|
17.01.2014 - 01:50
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
|
|
17.01.2014 - 10:26
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Гипотезу о равенстве какого-либо значения числа среднему арифетическому генеральной совокупности. Ту же самую, что и одновыборочный t-тест, только при разных известных параметрах. А где вы это вычитали? Я о тексте дошколенка, который вы тут расхвалили. В нем даже слово "гипотеза" не употребляется. |
|
17.01.2014 - 10:49
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 79 Регистрация: 22.08.2013 Из: г. Красноярск Пользователь №: 25146 |
А где вы это вычитали? Я о тексте дошколенка, который вы тут расхвалили. В нем даже слово "гипотеза" не употребляется. Если вас в действительности интересует, какую гипотезу проверяет z-тест, то считайте, что гипотеза которую я написал в предыдущем моем посте и есть та гипотеза. Я ее верно вам написал. А если вы интересуетесь, где я это вычитал с целью почитать самому, то Google или Яндекс вам в помощь. На первой же странице куча источников, в которых есть гипотеза, которую проверяет z-тест. Ну это в случае если мне не доверяете или очень хотите почитать. А по поводу "дошколенка". Так он хотя бы понятно для начинающего пишет. А вам он чем-то не понравился? Сообщение отредактировал paravoz - 17.01.2014 - 10:54 |
|