Здравствуйте, гость ( Вход | Регистрация )
9.10.2015 - 00:59
Сообщение
#1
|
|
![]() Группа: Пользователи Сообщений: 147 Регистрация: 4.09.2012 Из: г.Дивногорск Пользователь №: 24146 |
Здравствуйте, уважаемые! Помогите со следующим вопросом, в постановки задачи использую медицинскую трактовку.
Известно что вероятность выздоровления от некой болезни равна 0,17. Некто применив опытный препарат, добился выздоровления 4-х больных в группе из 10-ти человек. По какому критерию можно проверить гипотезу о реальном действии этого препарата? На самом деле получен эффект, или результат входит в зону статистического разброса? Спасибо. |
|
|
![]() |
![]() |
![]() |
9.10.2015 - 12:18
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Здравствуйте, уважаемые! Помогите со следующим вопросом, в постановки задачи использую медицинскую трактовку. Известно что вероятность выздоровления от некой болезни равна 0,17. Некто применив опытный препарат, добился выздоровления 4-х больных в группе из 10-ти человек. По какому критерию можно проверить гипотезу о реальном действии этого препарата? На самом деле получен эффект, или результат входит в зону статистического разброса? Спасибо. Всегда полезно начать с бустрепа Код > cumsum(table(replicate(500000, 4-sum(sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)))))/500000) -5 -4 -3 -2 -1 0 1 2 0.000002 0.000032 0.000310 0.002680 0.016972 0.074242 0.233534 0.526848 3 4 0.844584 1.000000 И тут действительно 0.074242 А вот превышение контроля над опытом будет достигнуто Код cumsum(table(replicate(500000, -sum(sample(d, replace=T))+sum(sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)))))/500000) -10 -9 -8 -7 -6 -5 -4 -3 0.000012 0.000260 0.002432 0.012868 0.046812 0.127544 0.270548 0.463350 -2 -1 0 1 2 3 4 5 0.662684 0.823728 0.924762 0.974092 0.992732 0.998286 0.999692 0.999962 6 7 0.999994 1.000000 в 0.924762 доле экспериментов "2 группы по 10" ![]() |
|
|
![]() |
![]() |
9.10.2015 - 16:00
Сообщение
#3
|
|
![]() Группа: Пользователи Сообщений: 147 Регистрация: 4.09.2012 Из: г.Дивногорск Пользователь №: 24146 |
|
|
|
![]() |
![]() |
9.10.2015 - 17:29
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Кому, и для чего? Меня интересуют вполне адекватные критерии. Для того кто не хочет всякий бред потом публиковать естественно. Ну опубликуйте свое мнение что бутстреп "неадекватный критерий" "в печати", повеселите публику. ![]() |
|
|
![]() |
![]() |
9.10.2015 - 18:21
Сообщение
#5
|
|
![]() Группа: Пользователи Сообщений: 147 Регистрация: 4.09.2012 Из: г.Дивногорск Пользователь №: 24146 |
|
|
|
![]() |
![]() |
9.10.2015 - 19:39
Сообщение
#6
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Вы уже публиковали обратное? Публика веселилась? Это за меня опубликовали другие люди (и довольно давно, так что пора "вылазить из дупла" А учебный случай который вы предложили разобрать очень прост (если конечно считать не важным нечеткую формулировку). Вы предлагаете как H0 генсовокупность с матожиданием 0.17 "выздоровления" против состояния "болезнь", из которой была извлечена выборка размером 10. Это собственно и есть Код sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)) как извлечение одной такой выборки. Извлекая таких выборок много (500000) и подсчитывая сколько "выздоровлений" произошло, мы получаем распределение генсовокупности с матожиданием болезни 0.17 для размера выборки 10. Код plot(table(replicate(500000, sum(sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)))))/500000) Некто получил 4 случая "выздоровления" из 10 и нам надо посчитать насколько это случайно. И тут задача сводиться к ситуации "какова вероятность получить 4 и более случаев при вероятность выздоровления 0.17" Код > cumsum(rev(table(replicate(500000, sum(sample(c(1,0), 10, replace=T, prob=c(0.17, 0.83)))))/500000)) 9 8 7 6 5 4 3 2 0.000002 0.000012 0.000276 0.002674 0.016582 0.073574 0.233256 0.527852 1 0 0.845112 1.000000 И достижение 4 и более "выздоровевших" происходит с вероятностью 0.073574 Вот с мощностью вопрос. Её по определению считаем из бета ошибок распределения которое заявлено для H1. Код > d <- c(rep(1,4), rep(0, 10-4)) > d [1] 1 1 1 1 0 0 0 0 0 0 > 1 - cumsum(table(replicate(500000, sum(sample(d, replace=T))))/500000) 0 1 2 3 4 5 6 7 0.993854 0.953564 0.833100 0.618356 0.367922 0.166198 0.054828 0.012326 8 9 10 0.001588 0.000110 0.000000 > 1 - cumsum(table(replicate(500000, sum(sample(d, replace=T))))/500000) 0 1 2 3 4 5 6 7 0.993934 0.953680 0.833478 0.619520 0.368914 0.167292 0.055216 0.012122 8 9 10 0.001616 0.000098 0.000000 никак не менее 0.36 мощность получается для подтверждения 4х случаев выздоровления для выборки размером 10. Но для 3 случаев "выздоровления" уже частота обнаружения (мощность) 0.61. ![]() |
|
|
![]() |
![]() |
Диагностик Критерий для проверки гипотезы 9.10.2015 - 00:59
anserovtv Биномиальный критерий: значимость 0,074.
Мощность... 9.10.2015 - 09:30
Игорь Цитата(Диагностик @ 9.10.2015 - 00:5... 9.10.2015 - 16:17
Диагностик Цитата(Игорь @ 9.10.2015 - 21:17) Ес... 9.10.2015 - 16:31
Игорь Цитата(Диагностик @ 9.10.2015 - 16:3... 9.10.2015 - 22:47
Диагностик Цитата(Игорь @ 10.10.2015 - 03:47) А... 10.10.2015 - 08:35
Диагностик р2004r, вы так ловко оперируете мощностью критерия... 10.10.2015 - 08:33
p2004r Цитата(Диагностик @ 10.10.2015 - 08... 10.10.2015 - 08:54![]() ![]() |