Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Одновыборочный z-тест и одновыборочный t-тест

Автор: paravoz 23.12.2013 - 06:41

Уважаемые специалисты подскажите, пожалуйста, чем отличаются одновыборочные z-тест и t-тест.
Изучаю иностранную литературу, но знания английского средние. Так вот изучаю Rosner B. Fundamentals of Biostatistics. Seventh Edition. 2010 (эта книга как-то упоминалась здесь - на форуме), там рассматриваются оба этих теста и они имеют одну и ту же формулу, но в алгоритме
статистической обработки на стр. 258 написано, что если известно стандартное отклонение выборки, то нужно использовать z-тест, а если оно неизвестно - t-тест, но формулы то одинаковые.

Поясните, пожалуйста, в чем тут хитрость.

Автор: DoctorStat 23.12.2013 - 11:31

Цитата(paravoz @ 23.12.2013 - 07:41) *
Поясните, пожалуйста, в чем тут хитрость.
Я, конечно не гуру, но вот мои соображения. Формулы для одновыборочного теста с известной и неизвестной дисперсиями совокупности могут быть похожими (я не проверял). Но статистики (т.е. функции выборочных характеристик, которые вы подставляете в формулу) разные, их даже разными английскими буквами обозначают: Z (нормальное распределение) и T (распределение Стъюдента). Отличающиеся функции для одинаковых аргументов принимают РАЗНЫЕ значения, поэтому и результаты тестов будут отличаться.

Автор: paravoz 23.12.2013 - 14:40

Цитата(DoctorStat @ 23.12.2013 - 16:31) *
Я, конечно не гуру, но вот мои соображения. Формулы для одновыборочного теста с известной и неизвестной дисперсиями совокупности могут быть похожими (я не проверял). Но статистики (т.е. функции выборочных характеристик, которые вы подставляете в формулу) разные, их даже разными английскими буквами обозначают: Z (нормальное распределение) и T (распределение Стъюдента). Отличающиеся функции для одинаковых аргументов принимают РАЗНЫЕ значения, поэтому и результаты тестов будут отличаться.


Честно. Ничего не понял. Про распределения понял. А вот про тесты не понял.

Формула критерия z: z=(x-X)/(s*sqrt(n)), где x-выборочное среднее, X-значение показателя с которым мы сравниваем выборку, s-стандартное отклонение выборки, sqrt(n)-квадратный корень объема выборки.

Формула одновыборочного критерия t: t=(x-X)/(s*sqrt(n)), где x-выборочное среднее, X-значение показателя с которым мы сравниваем выборку, s-стандартное отклонение выборки, sqrt(n)-квадратный корень объема выборки.

Абсолютно одинаковые, во всяком случае по этой книге. Понятно, что критическое значение с которым в конце концов необходимо будет сравнивать результат будет не одинаковым (в первом случае оно берется на основе нормального распределения, а во втором на основе распределения Стьюдента).

По мнению автора книги, критерий z используется при известном стандартном отклонении, а критерий t при неизвестном стандартном отклонении. Мой главный вопрос: как так?

Автор: DoctorStat 23.12.2013 - 15:48

Цитата(paravoz @ 23.12.2013 - 15:40) *
Честно. Ничего не понял

ОШИБКА В ФОРМУЛАХ.
Для ответа на ваш вопрос это замечание не принципиально, но всегда полезно поработать над ошибками. В вашей формуле для Z вкралась ма-а-аленькая неточность: s - это стандартное отклонение генеральной совокупности, которая обычно обозначается через сигма, а не ее оценка для данной выборки, см. Википедию: http://ru.wikipedia.org/wiki/Z-%D1%82%D0%B5%D1%81%D1%82

КАКУЮ СТАТИСТИКУ ВЫБРАТЬ.
Теперь попробуем разобраться, почему используются разные статистики: Z и T, и чем они отличаются.
Случай 1. Пусть нам точно известна дисперсия совокупности сигма. По выборке считаем Z0, строим график нормальной функции (колокол), откладываем по оси x полученное значение Z0 и интегрируем нормальную функцию от Z0 до бесконечности (площадь хвоста нормального распределения), чтобы получить значимость p-value нулевой гипотезы. Вместо интегрирования можно использовать таблицы.
Случай 2. Пусть теперь дисперсия совокупности неизвестна и, следовательно, неопределенность ситуации возросла. Чтобы отвергнуть нулевую гипотезу, требуются более сильные аргументы по сравнению с предыдущим случаем. Грубо говоря, для того же вычисленного Z0 мы должны получить большее p-value. Как это сделать? А легко. Нужно просто слегка надавить на функцию нормального распределения сверху, чтобы "прижать, сплющить" ее колокол по направлению к оси абсцисс x. Вот мы и получили функцию распределения Стъюдента!

Автор: paravoz 23.12.2013 - 16:27

Цитата(DoctorStat @ 23.12.2013 - 20:48) *
ОШИБКА В ФОРМУЛАХ.
Для ответа на ваш вопрос это замечание не принципиально, но всегда полезно поработать над ошибками. В вашей формуле для Z вкралась ма-а-аленькая неточность: s - это стандартное отклонение генеральной совокупности, которая обычно обозначается через сигма, а не ее оценка для данной выборки, см. Википедию: http://ru.wikipedia.org/wiki/Z-%D1%82%D0%B5%D1%81%D1%82

КАКУЮ СТАТИСТИКУ ВЫБРАТЬ.
Теперь попробуем разобраться, почему используются разные статистики: Z и T, и чем они отличаются.
Случай 1. Пусть нам точно известна дисперсия совокупности сигма. По выборке считаем Z0, строим график нормальной функции (колокол), откладываем по оси x полученное значение Z0 и интегрируем нормальную функцию от Z0 до бесконечности (площадь хвоста нормального распределения), чтобы получить значимость p-value нулевой гипотезы. Вместо интегрирования можно использовать таблицы.
Случай 2. Пусть теперь дисперсия совокупности неизвестна и, следовательно, неопределенность ситуации возросла. Чтобы отвергнуть нулевую гипотезу, требуются более сильные аргументы по сравнению с предыдущим случаем. Грубо говоря, для того же вычисленного Z0 мы должны получить большее p-value. Как это сделать? А легко. Нужно просто слегка надавить на функцию нормального распределения сверху, чтобы "прижать, сплющить" ее колокол по направлению к оси абсцисс x. Вот мы и получили функцию распределения Стъюдента!


Ну вроде более ли менее понятно.
То есть z критерий используется для сравнения при известных генеральном среднем, генеральной дисперсии и выборочном среднем. А t критерий используется при известных генеральном среднем, выборочном среднем и выборочной дисперсии. Правильно я понимаю?

Автор: DoctorStat 23.12.2013 - 17:06

Цитата(paravoz @ 23.12.2013 - 17:27) *
Ну вроде более ли менее понятно.
То есть z критерий используется для сравнения при известных генеральном среднем, генеральной дисперсии и выборочном среднем. А t критерий используется при известных генеральном среднем, выборочном среднем и выборочной дисперсии. Правильно я понимаю?
Правильно. Можно сказать короче: если среднее и дисперсия совокупности известны, то применяем z-test, если среднее известно, а дисперсия - нет, то t-test. Только учтите, что я - не волшебник и могу ошибаться smile.gif

Автор: paravoz 23.12.2013 - 17:29

Цитата(DoctorStat @ 23.12.2013 - 22:06) *
Только учтите, что я - не волшебник и могу ошибаться smile.gif


Наверное так. Даже в книге генеральное стандартное отклонение и стандартное отклонение выборки обозначаются по разному (s и сигма). Это свидетельствует о том, что Вы говорите.

Но почему-то в книге оба этих теста демонстрируются на одном и том же примере, в котором одни и те же известные параметры, к сожалению книга так написана, что я не могу понять какие (да уровень знания английского языа видимо подводит). Вот это меня смущает.

Автор: Irina_S 14.01.2014 - 10:02

Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/

Автор: paravoz 14.01.2014 - 22:23

Цитата(Irina_S @ 14.01.2014 - 15:02) *
Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/


Ну теперь наконец понятно что к чему! Спасибо за ссылку, а за ссылку на русский источник огромное спасибо.

Автор: 100$ 15.01.2014 - 21:37

Цитата(paravoz @ 14.01.2014 - 23:23) *
Ну теперь наконец понятно что к чему! Спасибо за ссылку, а за ссылку на русский источник огромное спасибо.



Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник?
Вопрос без подвоха. Просто интересно.

Автор: paravoz 16.01.2014 - 01:45

Цитата(100$ @ 16.01.2014 - 02:37) *
Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник?
Вопрос без подвоха. Просто интересно.


Хорошо, резюмирую сию тему.

Тема заключется в отличии z-теста и t-теста. DoctotStat высказал свою точку зрения на данный вопрос, но при этом немного усомнился в этом:
Цитата(DoctorStat @ 23.12.2013 - 22:06) *
Если среднее и дисперсия совокупности известны, то применяем z-test, если среднее известно, а дисперсия - нет, то t-test. Только учтите, что я - не волшебник и могу ошибаться smile.gif


Я также немного сомневался в этом:
Цитата(paravoz @ 23.12.2013 - 22:29) *
Но почему-то в книге оба этих теста демонстрируются на одном и том же примере, в котором одни и те же известные параметры, к сожалению книга так написана, что я не могу понять какие (да уровень знания английского языа видимо подводит). Вот это меня смущает.


Но довольно простое описание на русском языке этих тестов поставило все на свои места.
Цитата(Irina_S @ 14.01.2014 - 15:02) *
Описание t-скора и z-скора (на русском): http://statistica.ru/local-portals/medicine/example/633/


Таким образом, t-тест используется в случае когда известны параметры выборочного распределения, такие как выборочное среднее и выборочное стандартное отклонение и среднее значение генеральной совокупности. А z-тест используется когда известны среднее и стандартное отклонение генеральной совокупности. Эти параметры известны довольно редко, потому z-тест очень редко и используется.

Цитата(100$ @ 16.01.2014 - 02:37) *
Интересно, что же вам стало понятно после прочтения этого текста (на statistica.ru), который писал то ли дошколенок, то ли первоклассник?
Вопрос без подвоха. Просто интересно.


По сути, пост Irina_S особо ничего серьезного не объясняет, но такого простецкого описания данных тестов я еще не встречал (кстати, побольше бы таких описаний для всех разделов статистики) и ответить человеку который даже ссылку предоставил на такое замечательное описание, несмотря на то, что оно действительно написано то ли дошколенком, то ли первоклассником (но это и хорошо), я не мог. Вот я и ответил о том, что теперь то все окончательно ясно и поблагодарил Irina_S.

Вот, собственно, что могу сказать по тому что да как. Надеюсь данная тема дает исчерпывающие описания t-теста и z-теста и их отличий для новичков форума и начинающих статистиков.

Автор: 100$ 16.01.2014 - 13:15

Цитата(paravoz @ 16.01.2014 - 02:45) *
Хорошо, резюмирую сию тему.

Тема заключется в отличии z-теста и t-теста. DoctotStat высказал свою точку зрения на данный вопрос, но при этом немного усомнился в этом:


Я также немного сомневался в этом:


Но довольно простое описание на русском языке этих тестов поставило все на свои места.


Таким образом, t-тест используется в случае когда известны параметры выборочного распределения, такие как выборочное среднее и выборочное стандартное отклонение и среднее значение генеральной совокупности. А z-тест используется когда известны среднее и стандартное отклонение генеральной совокупности. Эти параметры известны довольно редко, потому z-тест очень редко и используется.



По сути, пост Irina_S особо ничего серьезного не объясняет, но такого простецкого описания данных тестов я еще не встречал (кстати, побольше бы таких описаний для всех разделов статистики) и ответить человеку который даже ссылку предоставил на такое замечательное описание, несмотря на то, что оно действительно написано то ли дошколенком, то ли первоклассником (но это и хорошо), я не мог. Вот я и ответил о том, что теперь то все окончательно ясно и поблагодарил Irina_S.

Вот, собственно, что могу сказать по тому что да как. Надеюсь данная тема дает исчерпывающие описания t-теста и z-теста и их отличий для новичков форума и начинающих статистиков.


Постой, paravoz, не стучите колеса.

Так какую гипотезу проверяют z-тестом?

Автор: paravoz 17.01.2014 - 01:50

Цитата(100$ @ 16.01.2014 - 18:15) *
Постой, paravoz, не стучите колеса.

Так какую гипотезу проверяют z-тестом?


Гипотезу о равенстве какого-либо значения числа среднему арифетическому генеральной совокупности. Ту же самую, что и одновыборочный t-тест, только при разных известных параметрах.

Автор: 100$ 17.01.2014 - 10:26

Цитата(paravoz @ 17.01.2014 - 02:50) *
Гипотезу о равенстве какого-либо значения числа среднему арифетическому генеральной совокупности. Ту же самую, что и одновыборочный t-тест, только при разных известных параметрах.


А где вы это вычитали? Я о тексте дошколенка, который вы тут расхвалили. В нем даже слово "гипотеза" не употребляется.

Автор: paravoz 17.01.2014 - 10:49

Цитата(100$ @ 17.01.2014 - 15:26) *
А где вы это вычитали? Я о тексте дошколенка, который вы тут расхвалили. В нем даже слово "гипотеза" не употребляется.


Если вас в действительности интересует, какую гипотезу проверяет z-тест, то считайте, что гипотеза которую я написал в предыдущем моем посте и есть та гипотеза. Я ее верно вам написал.

А если вы интересуетесь, где я это вычитал с целью почитать самому, то Google или Яндекс вам в помощь. На первой же странице куча источников, в которых есть гипотеза, которую проверяет z-тест. Ну это в случае если мне не доверяете или очень хотите почитать.

А по поводу "дошколенка". Так он хотя бы понятно для начинающего пишет. А вам он чем-то не понравился?

Автор: DrgLena 17.01.2014 - 12:41

Не используйте рекламную продукцию в образовательный целях Z-test и Z-score это разные вещи.

Автор: 100$ 17.01.2014 - 20:40

Цитата(paravoz @ 17.01.2014 - 11:49) *
Если вас в действительности интересует, какую гипотезу проверяет z-тест, то считайте, что гипотеза которую я написал в предыдущем моем посте и есть та гипотеза. Я ее верно вам написал.

А если вы интересуетесь, где я это вычитал с целью почитать самому, то Google или Яндекс вам в помощь. На первой же странице куча источников, в которых есть гипотеза, которую проверяет z-тест. Ну это в случае если мне не доверяете или очень хотите почитать.

А по поводу "дошколенка". Так он хотя бы понятно для начинающего пишет. А вам он чем-то не понравился?


Читаю ваш пост, паравоз, и пребываю в подавленном состоянии. Объясню, почему.

Вас спросили, где в тексте дошколенка вы прочитали про нулевую гипотезу для z-теста.
Вы ответили "...то Google или Яндекс вам в помощь". (Про Рамблер почему-то забыли).

Возможные причины:
а) я на редкость неудачно выразился;
б) у вас очевидные проблемы с восприятием ясно написанного текста.

А что касается обсуждаемого текста, то
1. Надо быть очень начинающим статистиком, чтобы думать, будто в английском языке "Score" и "Test" - это синонимы.
2. Надо быть очень небрежным писателем, чтобы обсуждая статистичекий тест, не сообщить о том, какую гипотезу проверяют с его помощью
3. Надо быть очень невнимательным читателем, чтобы не обратить внимание на то, что словесное описание z-теста и z-скора в упомянутом тексте не соответствует
расшифровке формул, которые там приведены.
4. Все остальное DrgLena написала коротко и ясно.

Засим жду от вас ответа на пункты а) и б). Если затрудняетесь с ответом, тоже сообщите. Здесь все свои. Врачи к тому же.

Автор: paravoz 18.01.2014 - 07:44

Цитата(100$ @ 18.01.2014 - 01:40) *
Читаю ваш пост, паравоз, и пребываю в подавленном состоянии. Объясню, почему.

Вас спросили, где в тексте дошколенка вы прочитали про нулевую гипотезу для z-теста.
Вы ответили "...то Google или Яндекс вам в помощь". (Про Рамблер почему-то забыли).

Возможные причины:
а) я на редкость неудачно выразился;
б) у вас очевидные проблемы с восприятием ясно написанного текста.

А что касается обсуждаемого текста, то
1. Надо быть очень начинающим статистиком, чтобы думать, будто в английском языке "Score" и "Test" - это синонимы.
2. Надо быть очень небрежным писателем, чтобы обсуждая статистичекий тест, не сообщить о том, какую гипотезу проверяют с его помощью
3. Надо быть очень невнимательным читателем, чтобы не обратить внимание на то, что словесное описание z-теста и z-скора в упомянутом тексте не соответствует
расшифровке формул, которые там приведены.
4. Все остальное DrgLena написала коротко и ясно.

Засим жду от вас ответа на пункты а) и б). Если затрудняетесь с ответом, тоже сообщите. Здесь все свои. Врачи к тому же.


Мне не понятно, к чему вы все это пишите.
Тема называется "Одновыборочный z-тест и одновыборочный t-тест". В чем их отличия мы разобрались. Какую проверяют гипотезу тоже. Если у вас есть вопрос или замечание по теме, то пожалуйста. А на ваши а) и б), 1 и 2 и т.д. я отвечать не собираюсь. К медицинской статистике то, как вы там выразились или как я воспринимаю текст, отношения не имеет. Создавайте новую тему только на каком нибудь другом форуме и обсуждайте там почему-то очень волнующие вас вопросы.
Есть у вас что-нибудь по теме или нет? Чем короче вы ответите на этот вопрос тем, мне кажется, лучше.

Автор: DrgLena 18.01.2014 - 17:00

По сути, дело не в формулах, а в понимании того для чего они нужны, а отсюда и вопрос 100$, какую гипотезу хотите проверить.
1. Есть конкретное значение показателя у одного больного и вы хотите узнать отличается ли оно от значений, которые вы получили от группы больных (здоровых). Т.е. нужно провести сравнение одного значения с группой.
2. Есть антропометрическая программа физического развития европейских детей, в которую заложены данные веса и роста детей соответствующего возраста. Вы хотите сравнить выборку детей из чернобыльской зоны с европейскими стандартами. Для этого у каждого ребенка вашей выборки может быть расчитана степень сдвига относительно нормы.

Это мои фантазии на заданную тему, которые также не рекомендуется употреблять в образовательных целях.

Тему предлагаю удалить создавшему ее smile.gif , не дожидаясь, пока это сделает модератор. Тон дискуссии не корректный и не типичный для этого форума, в чем есть и мои 5 коп, но это даже не 5$

Автор: 100$ 18.01.2014 - 17:13

Цитата(paravoz @ 18.01.2014 - 16:49) *
Опять, бла бла бла. По теме у вас что-нибудь есть или нет? Проще вопроса помоему нет. Ответили бы уже.


Есть, паравоз, есть. Не горячитесь.

Если, набравшись терпения, сообщите, как специалист начинающему ответ на два элементарных вопроса:
1. что общего у критериев Манна-Уитни, критерия Пейджа, критерия серий Вальда-Вольфовица и критерия знаковых рангов Уилкоксона?
2. является ли стандартизация случайной величины статистическим тестом?

Это и будет моментом истины.

Автор: 100$ 18.01.2014 - 17:21

Цитата(DrgLena @ 18.01.2014 - 18:00) *
По сути, дело не в формулах, а в понимании того для чего они нужны, а отсюда и вопрос 100$, какую гипотезу хотите проверить.
1. Есть конкретное значение показателя у одного больного и вы хотите узнать отличается ли оно от значений, которые вы получили от группы больных (здоровых). Т.е. нужно провести сравнение одного значения с группой.
2. Есть антропометрическая программа физического развития европейских детей, в которую заложены данные веса и роста детей соответствующего возраста. Вы хотите сравнить выборку детей из чернобыльской зоны с европейскими стандартами. Для этого у каждого ребенка вашей выборки может быть расчитана степень сдвига относительно нормы.

Это мои фантазии на заданную тему, которые также не рекомендуется употреблять в образовательных целях.

Тему предлагаю удалить создавшему ее smile.gif , не дожидаясь, пока это сделает модератор. Тон дискуссии не корректный и не типичный для этого форума, в чем есть и мои 5 коп, но это даже не 5$


Ну, уж вы-то способны на большее, чем просто фантазии.
Поэтому к вам другой вопрос (строго по теме): а скакой целью вообще проводятся выборочные исследования?

Автор: Олег Кравец 18.01.2014 - 20:05

Горячие эстонские парни, чем желчь расходовать, лучше к сути вернитесь. Или не вернитесь.

Автор: paravoz 18.01.2014 - 21:49

Моя надежда на ответ не угасает.

Автор: anserovtv 20.02.2014 - 16:46

Одновыборочные z-тест и t-тест с формулами, критическими областями. вычислениями в Excel
с применением статистических функций и примерами хорошо изложены в учебнике Р. Вадзинского
Статистические вычисления в среде Excel. Питер 2008 стр.256 -264.

Автор: 100$ 20.02.2014 - 23:39

Цитата(anserovtv @ 20.02.2014 - 17:46) *
Одновыборочные z-тест и t-тест с формулами, критическими областями. вычислениями в Excel
с применением статистических функций и примерами хорошо изложены в учебнике Р. Вадзинского
Статистические вычисления в среде Excel. Питер 2008 стр.256 -264.


Да уж, учебник. Тогда справочная система Excel - это энциклопедия.

Автор: paravoz 21.02.2014 - 01:12

Цитата(anserovtv @ 20.02.2014 - 21:46) *
Одновыборочные z-тест и t-тест с формулами, критическими областями. вычислениями в Excel
с применением статистических функций и примерами хорошо изложены в учебнике Р. Вадзинского
Статистические вычисления в среде Excel. Питер 2008 стр.256 -264.


Отличная книжка, спасибо.

Автор: anserovtv 21.02.2014 - 08:16

Для понимания различий вполне достаточно и ее.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)