Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Критерий для проверки гипотезы, о сравнении выборочной доли с вероятностью
Диагностик
сообщение 9.10.2015 - 00:59
Сообщение #1





Группа: Пользователи
Сообщений: 147
Регистрация: 4.09.2012
Из: г.Дивногорск
Пользователь №: 24146



Здравствуйте, уважаемые! Помогите со следующим вопросом, в постановки задачи использую медицинскую трактовку.
Известно что вероятность выздоровления от некой болезни равна 0,17. Некто применив опытный препарат, добился выздоровления 4-х больных в группе из 10-ти человек. По какому критерию можно проверить гипотезу о реальном действии этого препарата? На самом деле получен эффект, или результат входит в зону статистического разброса? Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
p2004r
сообщение 9.10.2015 - 12:18
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Диагностик @ 9.10.2015 - 00:59) *
Здравствуйте, уважаемые! Помогите со следующим вопросом, в постановки задачи использую медицинскую трактовку.
Известно что вероятность выздоровления от некой болезни равна 0,17. Некто применив опытный препарат, добился выздоровления 4-х больных в группе из 10-ти человек. По какому критерию можно проверить гипотезу о реальном действии этого препарата? На самом деле получен эффект, или результат входит в зону статистического разброса? Спасибо.


Всегда полезно начать с бустрепа

Код
> cumsum(table(replicate(500000, 4-sum(sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)))))/500000)
      -5       -4       -3       -2       -1        0        1        2
0.000002 0.000032 0.000310 0.002680 0.016972 0.074242 0.233534 0.526848
       3        4
0.844584 1.000000


И тут действительно 0.074242

А вот превышение контроля над опытом будет достигнуто

Код
cumsum(table(replicate(500000, -sum(sample(d, replace=T))+sum(sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)))))/500000)
     -10       -9       -8       -7       -6       -5       -4       -3
0.000012 0.000260 0.002432 0.012868 0.046812 0.127544 0.270548 0.463350
      -2       -1        0        1        2        3        4        5
0.662684 0.823728 0.924762 0.974092 0.992732 0.998286 0.999692 0.999962
       6        7
0.999994 1.000000


в 0.924762 доле экспериментов "2 группы по 10"


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Диагностик
сообщение 9.10.2015 - 16:00
Сообщение #3





Группа: Пользователи
Сообщений: 147
Регистрация: 4.09.2012
Из: г.Дивногорск
Пользователь №: 24146



Цитата(p2004r @ 9.10.2015 - 17:18) *
Всегда полезно начать с бустрепа

Кому, и для чего?
Меня интересуют вполне адекватные критерии.

Сообщение отредактировал Диагностик - 9.10.2015 - 16:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 9.10.2015 - 17:29
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Диагностик @ 9.10.2015 - 16:00) *
Кому, и для чего?
Меня интересуют вполне адекватные критерии.


Для того кто не хочет всякий бред потом публиковать естественно.

Ну опубликуйте свое мнение что бутстреп "неадекватный критерий" "в печати", повеселите публику.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Диагностик
сообщение 9.10.2015 - 18:21
Сообщение #5





Группа: Пользователи
Сообщений: 147
Регистрация: 4.09.2012
Из: г.Дивногорск
Пользователь №: 24146



Цитата(p2004r @ 9.10.2015 - 22:29) *
Ну опубликуйте свое мнение что бутстреп "неадекватный критерий" "в печати", повеселите публику.

Вы уже публиковали обратное? Публика веселилась?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 9.10.2015 - 19:39
Сообщение #6





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Диагностик @ 9.10.2015 - 18:21) *
Вы уже публиковали обратное? Публика веселилась?



Это за меня опубликовали другие люди (и довольно давно, так что пора "вылазить из дупла" smile.gif, например Эфрон ( https://en.wikipedia.org/wiki/Bradley_Efron ) .

А учебный случай который вы предложили разобрать очень прост (если конечно считать не важным нечеткую формулировку).

Вы предлагаете как H0 генсовокупность с матожиданием 0.17 "выздоровления" против состояния "болезнь", из которой была извлечена выборка размером 10.

Это собственно и есть

Код
sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83))


как извлечение одной такой выборки.

Извлекая таких выборок много (500000) и подсчитывая сколько "выздоровлений" произошло, мы получаем распределение генсовокупности с матожиданием болезни 0.17 для размера выборки 10.

Код
plot(table(replicate(500000, sum(sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)))))/500000)


Некто получил 4 случая "выздоровления" из 10 и нам надо посчитать насколько это случайно. И тут задача сводиться к ситуации "какова вероятность получить 4 и более случаев при вероятность выздоровления 0.17"

Код
> cumsum(rev(table(replicate(500000, sum(sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)))))/500000))
       9        8        7        6        5        4        3        2
0.000002 0.000012 0.000276 0.002674 0.016582 0.073574 0.233256 0.527852
       1        0
0.845112 1.000000


И достижение 4 и более "выздоровевших" происходит с вероятностью 0.073574

Вот с мощностью вопрос. Её по определению считаем из бета ошибок распределения которое заявлено для H1.

Код
> d <- c(rep(1,4), rep(0, 10-4))
> d
[1] 1 1 1 1 0 0 0 0 0 0
> 1 - cumsum(table(replicate(500000, sum(sample(d, replace=T))))/500000)
       0        1        2        3        4        5        6        7
0.993854 0.953564 0.833100 0.618356 0.367922 0.166198 0.054828 0.012326
       8        9       10
0.001588 0.000110 0.000000
> 1 - cumsum(table(replicate(500000, sum(sample(d, replace=T))))/500000)
       0        1        2        3        4        5        6        7
0.993934 0.953680 0.833478 0.619520 0.368914 0.167292 0.055216 0.012122
       8        9       10
0.001616 0.000098 0.000000


никак не менее 0.36 мощность получается для подтверждения 4х случаев выздоровления для выборки размером 10. Но для 3 случаев "выздоровления" уже частота обнаружения (мощность) 0.61.

Эскизы прикрепленных изображений
Прикрепленное изображение
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему