Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Статистическая значимость и достоверность
Usya
сообщение 8.11.2013 - 14:32
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 8.11.2013
Пользователь №: 25546



Люди добрые, подскажите, в чем отличие трех понятий: статистическая значимость, статистическая достоверность и ошибка первого рода?
Если можно, то на конкретных примерах - где правильно и где неправильно употреблять каждый из приведенных терминов? В том числе, правильно ли говорить об уровне ошибки первого рода либо об ошибке первого рода?

Только не переадрессовывайте меня на страницы http://forum.disser.ru/index.php?showtopic=924. Там хоть и есть информация по данному вопросу, но не совсем полная. Мне нужно знать в каких контекстах употребление этих фраз будет некорректно.
И тем более непонятно, как, например, согласуется данная ветка форму с http://www.tryphonov.ru/tryphonov3/terms3/cnflev.htm.

Заранее благодарен.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 8.11.2013 - 15:32
Сообщение #2





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Достоверное событие - событие вероятность возникновения которого равна 100%. В связи с этим статистическая достоверность - этот термин вобще в корне не правильный.
Статистический - это значит доказанный на основании какого либо статистического метода или вероятностного распределения и означает отсутствие или наличие элемента случайности в исследуемом процессе, элементе или их взаимосвязи. Достоверность не может быть статистической. Достоверность - это достоверность.
Ошибка первого рода - вероятность найти статистически значимые различия или связи там, где их на самом деле нет. Обычно обозначается символом "альфа" и обычно принимается равным 0,05, то есть вероятность найти статистически значимые различия или связи там, где их нет равна 5%.
Статистическая значимость - вероятность того, что вы нашли различия основанные не на случайности, а действительно там где они есть. Обычно статистическая значимость констатируется при уровне значимости меньше "альфа" (p<0,05).

Термин Ошибка первого рода обычно не используется в публикациях, помимо публикаций по статистике.
Чеще всего звучит термин "статистическая значимость" (например, у мужчин рост статистически значимо выше чем у женщин, p<0,05).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 8.11.2013 - 17:11
Сообщение #3





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Usya @ 8.11.2013 - 17:32) *
Люди добрые, подскажите, в чем отличие трех понятий: статистическая значимость, статистическая достоверность и ошибка первого рода?
Если можно, то на конкретных примерах - где правильно и где неправильно употреблять каждый из приведенных терминов? В том числе, правильно ли говорить об уровне ошибки первого рода либо об ошибке первого рода?

Только не переадрессовывайте меня на страницы http://forum.disser.ru/index.php?showtopic=924. Там хоть и есть информация по данному вопросу, но не совсем полная. Мне нужно знать в каких контекстах употребление этих фраз будет некорректно.
И тем более непонятно, как, например, согласуется данная ветка форму с http://www.tryphonov.ru/tryphonov3/terms3/cnflev.htm.

Заранее благодарен.

Посмотрите эту ветку и занудную, но полезную статью Зорина в ней: http://forum.disser.ru/index.php?showtopic=3265&st=0
Меня учили, что использование занятых теминов в науке недопустимо. В математике термин "достоверность" занят и употребляется вполне однозначно в теории вероятности, а математическая статистика базируется именно на теории вероятности. Поэтому когда я услышал о некорректности использования термина "достоверность" то быстро согласился и перестал употреблять его в своей работе, хотя раньше долгое время им пользовался. Это никак не согласуется с материалом на трифонов.ру и Слава Богу. Про ошибку первого рода много написано, читайте. Думаю корректнее просто "ошибка первого рода", а вот задаётся и контролируется она выбранным "уровнем значимости альфа". Хотя с самим термином тоже не всё хорошо. "Род" может быть мужским или женским, или восходить к какому-то родоначальнику... Зачем кому-то на заре 20-го века понадобилось перевести английский термин "type", как "род"? Хотя стараюсь придерживаться устоявшихся отечественных терминов и студентам-биологам рассказываю об ошибке первого РОДА, а также "квартилях" и "процентилях" женского рода (квартиль - это "она"), но говорю, что в современных материалах можно встретить другие перводы, в частности ошибка первого типа и квартили и процентили мужского рода.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Usya
сообщение 8.11.2013 - 22:08
Сообщение #4





Группа: Пользователи
Сообщений: 4
Регистрация: 8.11.2013
Пользователь №: 25546



В прошлом сообщении я немного перемудрил и не совсем правильно поставил вопрос.
Меня интересуют термины: статистическая значимость, уровень значимости, уровень достоверности и ошибка первого рода (либо уровень ошибки первого рода). В каком контексте эти фразы можно и нельзя употреблять?

paravoz
Цитата
Ошибка первого рода - вероятность найти статистически значимые различия или связи там, где их на самом деле нет. Обычно обозначается символом "альфа" и обычно принимается равным 0,05

Ошибка первого рода и вероятность ошибки первого рода - это разные понятия. Таким образом определение некорректно. Символом "альфа", как, например сказано, в ГОСТ Р 50779.10-2000 обозначают уровень значимости.
То же самое касается определения статистической значимости...

nokh
Цитата
Посмотрите эту ветку и занудную, но полезную статью Зорина в ней: http://forum.disser.ru/index.php?showtopic=3265&st=0

В статье говорится о том, что лучше говорить о значимости, хотя в http://forum.disser.ru/index.php?showtopic=924 модератор плав употребляет фразу "уровень достоверности 0.05" и поясняет, что это нормально.

Цитата
Про ошибку первого рода много написано, читайте. Думаю корректнее просто "ошибка первого рода", а вот задаётся и контролируется она выбранным "уровнем значимости альфа".

Определение я знаю. Просто плав, например, употребляет такую фразу, как "уровень ошибки "альфа"". И как к ней относиться?
Или как относиться к вашей фразе "ошибка первого рода контролируется уровнем значимости"? Не совсем корректно употреблены фразы.

paravoz и nokh, это не придирки. Вопрос как раз и состоит в том, как корректно употреблять эти фразы?!!

P.s.
То, что мы интуитивно понимаем под всеми этими фразами - это одно, а то, как фразы правильно употреблять - это другое.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
paravoz
сообщение 9.11.2013 - 04:25
Сообщение #5





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146



Такое ощущение что меня экзаменуют.
Увидев человека с одним сообщением на форуме, естественно я подумал, что надо разжевать человеку понятия нормальным человеческим языком, а то начнется: "я первый день на форуме, я ничего не понимаю, объясните еще раз".
А раз вы и так все знаете, то не понятно зачем спрашиваете. Хотите раз и навсегда разобраться в этой ситуации, чтобы потом споры выигрывать?! Так вот в этих терминах однозначно сейчас разобраться не удасться. Я однажды пытался. Каждый автор интерпретирует их по своему, отсюда и путаница. Обращаться к первоисточникам начала XX века тоже не совсем правильно, потому что придуманное и изобретенное тогда не факт что является верным сейчас. В общем по поводу этих терминов и по поводу того как выяснить что каждый значит можно будет спорить до потери пульса.
Таким образом цепляйтесь к какому-либо авторитетному статистику и держите его методологию.

Если вы приводите утверждения плава, ну тогда и спросите у него напрямую.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Usya
сообщение 9.11.2013 - 20:31
Сообщение #6





Группа: Пользователи
Сообщений: 4
Регистрация: 8.11.2013
Пользователь №: 25546



Цитата
Такое ощущение что меня экзаменуют... А раз вы и так все знаете, то не понятно зачем спрашиваете.

paravoz, без обид. Я и не собирался никого экзаменовать. А спрашиваю я потому, что несмотря на то, что перелопатил литературу по этой теме, так и не смог "воедино сложить мозаику" - в каком контексте можно употреблять эти термины, а в каком - нет.

Цитата
Увидев человека с одним сообщением на форуме...

Для того и зарегистрировался, чтобы узнать ответ на свой вопрос smile.gif . К тому же, аналогичная тема была ранее.

Цитата
Если вы приводите утверждения плава, ну тогда и спросите у него напрямую.

Сколько людей, столько и мнений. Я приводил не только его утверждения, но и другие. Тем более и в его ответах есть фразы, которые не совсем стыкуются, например, с тем же ГОСТ Р 50779.10-2000. В частности, то, что он называет, уровнем достоверности, в ГОСТ Р 50779.10-2000 это называют уровнем значимости. А "альфа" у него - это уровень ошибки первого рода, либо то же самое, что уровень достоверности. Кроме того, и у плава есть неточности в определениях - "Достоверность, на самом деле - это тот уровень, который мы принимаем для того, чтобы считать, что мы считаем "значимым", а что нет". Понятно, что он имел ввиду, и вместо слова "достоверность" должна была быть фраза "уровень достоверности", но меня как раз и интересует корректность употребления указанных выше фраз. Хотя интересно было бы услышать его комментарий со ссылкой на первоисточник по поводу того "что перепутаны две статистические теории - теория оценки значимости различий Фишера и теория планирования эксперимента Неймана и Пирсона".

Цитата
Таким образом цепляйтесь к какому-либо авторитетному статистику и держите его методологию.

Не у всех классиков даны определения этим терминам. Чаще встречаются фразы типа "различия значимы" и т.п. Кроме того, немалая часть изданий классиков - это переводная литература с вытекающими отсюда последствиями по вольности перевода. Хотя буду благодарен за любую ссылку на классика (желательно с указанием страницы), где встречаются эти термины!!!!!

P.s.
А столкнулся я с этим, т.к. нужно статейку в ВАК-овский журнал написать. Правда можно обойтись как-нибудь и без этих терминов, но не хочется ходить вокруг да около, а хочется разобраться в этом вопросе и называть вещи своими именами, тем более, что не в этой так другой статье придется эти термины употреблять.
Так, например, когда я учился, мой научный руководитель привел мне пример, что фразу "плотность вероятности" использовать не совсем грамотно (т.к. это равносильно фразе "плотность числа", что по сути бессмысленно), а грамотнее говорить "плотность распределения вероятностей", но в обиходе и в словарях такие фразы встречаются.

Сообщение отредактировал Usya - 9.11.2013 - 20:36
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 9.11.2013 - 20:53
Сообщение #7





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Рекомендую использовать учебники А.Д. Наследова /Санкт-Петербургский университет/.
Написаны достаточно грамотно. Имеются интерпретации результатов исследований.
Его Математические методы ... есть в интернете в PDF формате.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 10.11.2013 - 11:00
Сообщение #8





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Usya @ 9.11.2013 - 01:08) *
Или как относиться к вашей фразе "ошибка первого рода контролируется уровнем значимости"? Не совсем корректно употреблены фразы.

Неужели? Полагаю, что когда вы прочитаете достаточно, то сможете объяснить почему фраза вполне корректна. А про различие подходов Фишера и Неймана-Пирсона с указанием источников можно прочитать хотя бы в википедии: http://en.wikipedia.org/wiki/Statistical_hypothesis_testing . На ГОСТы ориентироваться нельзя, т.к. отчасти это - устаревший и безграмотный материал. Именно в ГОСТе я прочитал, что вопреки правилам русского языка знак % следует отделять от числа пробелом, сплошь и рядом написание сложных эпонимов через дефис, а не через тире и пр.
Цитата(anserovtv @ 9.11.2013 - 23:53) *
Рекомендую использовать учебники А.Д. Наследова /Санкт-Петербургский университет/.

Книга хорошая, но применительно конктретно к обсуждаемой теме Наследов - слабый источник. Он излагает только синтетический (гибридный подход), ошибочно называет р вероятностью нулевой гипотезы и судя по табл. 7.1 (Математические методы..., 2004, стр. 105) похоже не до конца понимает что такое "уровень значимости".

Сообщение отредактировал nokh - 10.11.2013 - 11:37
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 10.11.2013 - 11:33
Сообщение #9





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Цитата(nokh @ 10.11.2013 - 11:00) *
Неужели? Полагаю, что когда вы прочитаете достаточно, то сможете объяснить почему фраза вполне корректна.

Применительно конктретно к обсуждаемой теме Наследов - слабый источник. Он излагает только синтетический (гибридный подход), ошибочно называет р вероятностью нулевой гипотезы и судя по табл. 7.1 (Математические методы..., 2004, стр. 105) не до конца понимает что такое "уровень значимости".

Согласен с некоторыми замечаниями и сам А.Д.Наследов с ними согласен. Рецензент ,скорее всего, книгу не читал.
В других книгах. известных мне. еще больше неточностей.
Уверен , что для многих на этом форуме будет очень трудно освоить методы и лексику на очень правильном уровне.
В нашем вузе занятия по данному предмету с аспирантами даже не проводятся.
Чтобы освоить методы и лексику могут потребоваться годы.
Нужно годами изучать матстатистику,(а еще лучше годами преподавать).
Назрела необходимость издать современный справочник, на который бы все ссылались.
А что вы рекомендуете? Напишите.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 10.11.2013 - 12:32
Сообщение #10





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(anserovtv @ 10.11.2013 - 14:33) *
Назрела необходимость издать современный справочник, на который бы все ссылались.
А что вы рекомендуете? Напишите.

Рекомендовать сложно, одно лучшо дано в одних источниках, другое - в других. По обсужаемой теме информации много, есть даже совсем свежие публикации:
http://tap.sagepub.com/content/23/2/251.full.pdf+html
Из справочников иногда заглядываю в Everitt B.S. (2002) - The Cambridge Dictionary of Statistics (можно найти в сети в pdf). Но почему-то больше полюбился этот: http://www.mhhe.com/business/opsci/bstat/keyterm.mhtml . Хотя в нём бывает не хватает определений терминов, все статьи очень лаконичны и хорошо иллюстрированы.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 10.11.2013 - 15:29
Сообщение #11





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Цитата(nokh @ 10.11.2013 - 12:32) *
Рекомендовать сложно, одно лучшо дано в одних источниках, другое - в других. По обсужаемой теме информации много, есть даже совсем свежие публикации:
http://tap.sagepub.com/content/23/2/251.full.pdf+html
Из справочников иногда заглядываю в Everitt B.S. (2002) - The Cambridge Dictionary of Statistics (можно найти в сети в pdf). Но почему-то больше полюбился этот: http://www.mhhe.com/business/opsci/bstat/keyterm.mhtml . Хотя в нём бывает не хватает определений терминов, все статьи очень лаконичны и хорошо иллюстрированы.

А на русском языке ничего нет?
Достаточно грамотно написана книга Р.Вадзинского , хотя она уже устарела.
Статистические вычисления в среде Excel.2008.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Usya
сообщение 10.11.2013 - 20:09
Сообщение #12





Группа: Пользователи
Сообщений: 4
Регистрация: 8.11.2013
Пользователь №: 25546



Цитата
Или как относиться к вашей фразе "ошибка первого рода контролируется уровнем значимости"? Не совсем корректно употреблены фразы.
Цитата
Неужели? Полагаю, что когда вы прочитаете достаточно, то сможете объяснить почему фраза вполне корректна.

Уровень значимости - это вероятность ... получается, что ошибка первого рода контролируется вероятностью ... Слово контролируется (имхо) здесь не совсем удачно. Интуитивно понятно, что имелось ввиду, но мне как раз и нужны фразы либо определения, к которым формально придраться нельзя, чтобы избежать двусмысленности в дальнейшем.

Цитата
На ГОСТы ориентироваться нельзя, т.к. отчасти это - устаревший и безграмотный материал.

С этим я отчасти согласен. Поэтому ссылаюсь не только на ГОСТ. Ляпы везде есть.

Цитата
Достаточно грамотно написана книга Р.Вадзинского , хотя она уже устарела. Статистические вычисления в среде Excel.2008.

Не нашел. Встретил только старый вариант 2001, в котором нужных мне вещей не увидел.

Цитата
А про различие подходов Фишера и Неймана-Пирсона с указанием источников можно прочитать хотя бы в википедии: http://en.wikipedia.org/wiki/Statistical_hypothesis_testing

"Мы все учились понемногу чему-нибудь и как-нибудь...". К сожалению мой английский оставляет желать лучшего и скорее всего в ходе перевода возникнут свои вопросы по его правильности...

Если не сложно, можно дать строгие определения трем понятиям: уровень ошибки первого рода, уровень значимости и уровень достоверности, чтобы можно было понять их отличия?

Определение ошибки первого рода во всех первоисточниках почти однозначно:
Ошибка первого рода - это ошибка, состоящая в отбрасывании нулевой гипотезы, в то время как эта гипотеза верна.

Сообщение отредактировал Usya - 10.11.2013 - 20:09
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему