Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V   1 2 >  
Добавить ответ в эту темуОткрыть тему
> Произведение частот
nironir
сообщение 24.08.2016 - 10:17
Сообщение #1





Группа: Пользователи
Сообщений: 8
Регистрация: 26.07.2016
Пользователь №: 28496



Друзья, подскажите у меня получается произведение частот как формула что произойдет и то и другое событие одновременно. Как в этом случае мне построить доверительный интервал для произведения? Не могу понять!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 24.08.2016 - 12:50
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(nironir @ 24.08.2016 - 10:17) *
Друзья, подскажите у меня получается произведение частот как формула что произойдет и то и другое событие одновременно. Как в этом случае мне построить доверительный интервал для произведения? Не могу понять!


Распределения исходные нужны (или одно общее если коррелированы события). Дальше монтекарло по ним.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nironir
сообщение 24.08.2016 - 17:13
Сообщение #3





Группа: Пользователи
Сообщений: 8
Регистрация: 26.07.2016
Пользователь №: 28496



Цитата(p2004r @ 24.08.2016 - 13:50) *
Распределения исходные нужны (или одно общее если коррелированы события). Дальше монтекарло по ним.


Ну я так мыслю, что они независимы и оба распределены биномиально. То есть произведение независимых биномиальных величин. А что значит монтекарло по ним? Как это связано с доверительным интервалом? Простите за тупость.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.08.2016 - 18:51
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nironir @ 24.08.2016 - 10:17) *
Друзья, подскажите у меня получается произведение частот как формула что произойдет и то и другое событие одновременно. Как в этом случае мне построить доверительный интервал для произведения? Не могу понять!


Для параметра биномиального распределения p*, оцененного по имеющейся выборке, можно построить как точный (на основе распределения Фишера), так и асимптотический интервал (на основе аппроксимации нормальным распределением), опосля чего представить частоты (понимаемые как эмпирические оценки вероятностей "успеха") в интервальном виде.
А уж в интервальной математике произведением интервальных величин [a,b] и [c,d] является интервал [ac,bd]. И никакой Монтекарлы.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nironir
сообщение 24.08.2016 - 19:37
Сообщение #5





Группа: Пользователи
Сообщений: 8
Регистрация: 26.07.2016
Пользователь №: 28496



Цитата(100$ @ 24.08.2016 - 19:51) *
Для параметра биномиального распределения p*, оцененного по имеющейся выборке, можно построить как точный (на основе распределения Фишера), так и асимптотический интервал (на основе аппроксимации нормальным распределением), опосля чего представить частоты (понимаемые как эмпирические оценки вероятностей "успеха") в интервальном виде.
А уж в интервальной математике произведением интервальных величин [a,b] и [c,d] является интервал [ac,bd]. И никакой Монтекарлы.

А не подскажите где про такой метод можно почитать впервые такое вижу? Разве так можно делать для доверительных интервалов?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.08.2016 - 20:11
Сообщение #6





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nironir @ 24.08.2016 - 19:37) *
А не подскажите где про такой метод можно почитать впервые такое вижу? Разве так можно делать для доверительных интервалов?


Ну, про доверительное оценивание параметра биномиального распределения вы нагуглите самостоятельно (в качестве подводящего упражнения), а про произведения интервалов - вот тут
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nironir
сообщение 24.08.2016 - 21:40
Сообщение #7





Группа: Пользователи
Сообщений: 8
Регистрация: 26.07.2016
Пользователь №: 28496



Цитата(100$ @ 24.08.2016 - 20:11) *
Ну, про доверительное оценивание параметра биномиального распределения вы нагуглите самостоятельно (в качестве подводящего упражнения), а про произведения интервалов - вот тут

Ну про дов интервалы для биномиального я понял это ясно. А вот про то как вы ловко обращаетесь с интервалами я не врубаю. Ну то что у орлова это ведь другое там не доверительные интервалы а просто интервалы. Хотя я что то начинаю понимать. Только доверительная вероятность меняется да? P1×p2. Ведь тут как бы одновременное выполнение обоих условий правильно?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 24.08.2016 - 22:17
Сообщение #8





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nironir @ 24.08.2016 - 21:40) *
Ну про дов интервалы для биномиального я понял это ясно. А вот про то как вы ловко обращаетесь с интервалами я не врубаю. Ну то что у орлова это ведь другое там не доверительные интервалы а просто интервалы. Хотя я что то начинаю понимать. Только доверительная вероятность меняется да? P1×p2. Ведь тут как бы одновременное выполнение обоих условий правильно?


Доверительная вероятность - это вероятность того, что истинное значение параметра, оцененного по выборке, будет находиться в этом интервале. Это - параметр, задаваемый вами (н-р, 95%). Если бы параметр биномиального распределения был известен точно (для обоих выборок), вероятность одновременного наступления двух "успехов" вычислялась бы точно безо всякого доверительного интервала. А мы в данном случае от точечной оценки переходим к интервальной, и просто перемножаем не два числа, а два интервала.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nironir
сообщение 25.08.2016 - 08:33
Сообщение #9





Группа: Пользователи
Сообщений: 8
Регистрация: 26.07.2016
Пользователь №: 28496



Цитата(100$ @ 24.08.2016 - 23:17) *
Доверительная вероятность - это вероятность того, что истинное значение параметра, оцененного по выборке, будет находиться в этом интервале. Это - параметр, задаваемый вами (н-р, 95%). Если бы параметр биномиального распределения был известен точно (для обоих выборок), вероятность одновременного наступления двух "успехов" вычислялась бы точно безо всякого доверительного интервала. А мы в данном случае от точечной оценки переходим к интервальной, и просто перемножаем не два числа, а два интервала.


Простите но насколько я мыслю немножко иначе получается. Первый интервал накроет истинное значение с вер. p1, а второй интервал накроет свое истинное значение с вероятностью p2. Значит интервал как вы написали "произведение интервалов" накроет истинное значение c вероятностью p1*p2 это и есть новая дов вероятность. Где ошибка в моих рассуждениях?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.08.2016 - 11:26
Сообщение #10





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nironir @ 25.08.2016 - 08:33) *
Простите но насколько я мыслю немножко иначе получается. Первый интервал накроет истинное значение с вер. p1, а второй интервал накроет свое истинное значение с вероятностью p2. Значит интервал как вы написали "произведение интервалов" накроет истинное значение c вероятностью p1*p2 это и есть новая дов вероятность. Где ошибка в моих рассуждениях?


Произведение частот - это не параметр распределения, оцениваемый по выборке. Ergo, у него никогда не было,нет и не предвидится никакого истинного значения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nironir
сообщение 25.08.2016 - 15:04
Сообщение #11





Группа: Пользователи
Сообщений: 8
Регистрация: 26.07.2016
Пользователь №: 28496



Цитата(100$ @ 25.08.2016 - 12:26) *
Произведение частот - это не параметр распределения, оцениваемый по выборке. Ergo, у него никогда не было,нет и не предвидится никакого истинного значения.

Произведение частот - это оценка произведения вероятностей а это параметр оцениваемый по выборкам. Он имеет истинное значение которое мы и ищем.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 25.08.2016 - 19:35
Сообщение #12





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(100$ @ 24.08.2016 - 18:51) *
И никакой Монтекарлы.


Вы свои мысли в массы о "сферическом в вакууме случае" несли бы с меньшим апломбом? smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 25.08.2016 - 20:10
Сообщение #13





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(nironir @ 24.08.2016 - 17:13) *
Ну я так мыслю, что они независимы и оба распределены биномиально. То есть произведение независимых биномиальных величин. А что значит монтекарло по ним? Как это связано с доверительным интервалом? Простите за тупость.


Ну раз интересует чисто теоретическое распределение + такой вырожденный случай, то наверное какой человек давно вывел "точную формулу своего имени". smile.gif

Но простой способ позволяет посчитать численно _без_ вполне вероятной ошибки выбора такой формулы (особенно для какого то более "заковыристого" случая).

Естественно основной параметр размер выборки и вероятности "выпадения 1".

для выборки из 10 "опытов" число исходов нужных и доверительный интервал

Код
> table(replicate(10000, sum(rbinom(10, 1, 0.5)*rbinom(10,1,0.5))))/10000

     0      1      2      3      4      5      6      7      8
0.0547 0.1864 0.2801 0.2469 0.1508 0.0606 0.0170 0.0031 0.0004

> quantile(replicate(10000, sum(rbinom(10, 1, 0.5)*rbinom(10,1,0.5))/10), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
  0.0   0.2   0.5


из 5ти

Код
> table(replicate(10000, sum(rbinom(5, 1, 0.5)*rbinom(5,1,0.5))))/10000

     0      1      2      3      4      5
0.2329 0.3938 0.2706 0.0890 0.0127 0.0010

> quantile(replicate(10000, sum(rbinom(5, 1, 0.5)*rbinom(5,1,0.5))/5), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
  0.0   0.2   0.6



из 500

Код
> quantile(replicate(10000, sum(rbinom(500, 1, 0.5)*rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.214 0.250 0.288
> quantile(replicate(100000, sum(rbinom(500, 1, 0.5)*rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.212 0.250 0.288
> quantile(replicate(1000000, sum(rbinom(500, 1, 0.5)*rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.212 0.250 0.288

# "исходный" ДА
> quantile(replicate(10000, sum(rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.456 0.500 0.544
> quantile(replicate(100000, sum(rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.456 0.500 0.544
> quantile(replicate(1000000, sum(rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.456 0.500 0.544



Так что самое "дурное дело" в статистике, это пыжиться инференцию выводить вручную. smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 25.08.2016 - 23:43
Сообщение #14





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(p2004r @ 25.08.2016 - 19:35) *
Вы свои мысли в массы о "сферическом в вакууме случае" несли бы с меньшим апломбом? smile.gif


Да в том-то и дело, что они не мои.
Кстати, вы же вроде публично клялись не реагировать на мои посты. Что случилось на этот раз?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nironir
сообщение 26.08.2016 - 08:51
Сообщение #15





Группа: Пользователи
Сообщений: 8
Регистрация: 26.07.2016
Пользователь №: 28496



Цитата(p2004r @ 25.08.2016 - 21:10) *
Ну раз интересует чисто теоретическое распределение + такой вырожденный случай, то наверное какой человек давно вывел "точную формулу своего имени". smile.gif

Но простой способ позволяет посчитать численно _без_ вполне вероятной ошибки выбора такой формулы (особенно для какого то более "заковыристого" случая).

Естественно основной параметр размер выборки и вероятности "выпадения 1".

для выборки из 10 "опытов" число исходов нужных и доверительный интервал

Код
> table(replicate(10000, sum(rbinom(10, 1, 0.5)*rbinom(10,1,0.5))))/10000

     0      1      2      3      4      5      6      7      8
0.0547 0.1864 0.2801 0.2469 0.1508 0.0606 0.0170 0.0031 0.0004

> quantile(replicate(10000, sum(rbinom(10, 1, 0.5)*rbinom(10,1,0.5))/10), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
  0.0   0.2   0.5


из 5ти

Код
> table(replicate(10000, sum(rbinom(5, 1, 0.5)*rbinom(5,1,0.5))))/10000

     0      1      2      3      4      5
0.2329 0.3938 0.2706 0.0890 0.0127 0.0010

> quantile(replicate(10000, sum(rbinom(5, 1, 0.5)*rbinom(5,1,0.5))/5), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
  0.0   0.2   0.6



из 500

Код
> quantile(replicate(10000, sum(rbinom(500, 1, 0.5)*rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.214 0.250 0.288
> quantile(replicate(100000, sum(rbinom(500, 1, 0.5)*rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.212 0.250 0.288
> quantile(replicate(1000000, sum(rbinom(500, 1, 0.5)*rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.212 0.250 0.288

# "исходный" ДА
> quantile(replicate(10000, sum(rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.456 0.500 0.544
> quantile(replicate(100000, sum(rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.456 0.500 0.544
> quantile(replicate(1000000, sum(rbinom(500,1,0.5))/500), c(0.025, 0.5, 0.975))
2.5%   50% 97.5%
0.456 0.500 0.544



Так что самое "дурное дело" в статистике, это пыжиться инференцию выводить вручную. smile.gif


Спасибо. А этот метод как называется где можно почитать? Это бутстреп? Я просто изучил классические вещи а такие штуки не изучал но очень хочется посоветуйте.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V   1 2 >
Добавить ответ в эту темуОткрыть тему