Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Дисперсия отношения двух переменных
Camel1000
сообщение 30.11.2021 - 17:37
Сообщение #1





Группа: Пользователи
Сообщений: 15
Регистрация: 3.02.2013
Пользователь №: 24599



Всем добрый день.

Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,

Спасибо заранее,
Camel1000
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 1.12.2021 - 00:04
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Camel1000 @ 30.11.2021 - 17:37) *
Всем добрый день.

Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,

Спасибо заранее,
Camel1000



Для конкретных параметров легче легкого

Код
> quantile(replicate(100000, mean(rnorm(10, mean=1,sd=2))/mean(rnorm(14, mean=2,sd=1))), probs=c(0.025,0.5,0.975))
      2.5%        50%      97.5%
-0.1213920  0.5002085  1.1963876
> quantile(replicate(100000, mean(rnorm(10, mean=10,sd=2))/mean(rnorm(14, mean=2,sd=1))), probs=c(0.025,0.5,0.975))
    2.5%      50%    97.5%
3.818239 4.996390 6.911531


Ну и видим 4 сигмы соответственно. Можно сразу писать sd() вместо quantile()

Сообщение отредактировал p2004r - 1.12.2021 - 00:08


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 1.12.2021 - 00:18
Сообщение #3





Группа: Пользователи
Сообщений: 1172
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



1) См формулу 3.31 на стр. 122 в Урбах "Биометрические методы"
2) См дискуссию здесь: https://www.researchgate.net/post/How-do-I-...ndent-variables
3) Если распределение отношения отличается от нормального или неизвестно, лучше рассчитать бутстрэпом: получить реплику для А и реплику для В, найти отношение. И так тысячи раз. Рассчитать для полученного массива дисперсию (хотя лучше рассчитать 95% Доверительный интервал - распределение может не быть в точности симметричным). Также бутстрэп позволит сделать поправку на смещение в оценке дисперсии по выборке, если интересует именно дисперсия.

Сообщение отредактировал nokh - 1.12.2021 - 07:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 1.12.2021 - 11:06
Сообщение #4





Группа: Пользователи
Сообщений: 978
Регистрация: 10.04.2007
Из: Россия
Пользователь №: 4040



Цитата(Camel1000 @ 30.11.2021 - 18:37) *
Всем добрый день.

Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,

Спасибо заранее,
Camel1000

Прошу прощения, что не пишу ответ здесь (не уверен, что движок форума позволит опубликовать формулы), а даю ссылку.

Вопрос интересный и непростой. Возникал у многих. Рассмотрен в разделе 3.2.13 описания библиотеки, доступного по ссылке https://sourceforge.net/projects/me-com/ В архиве исходников доступно в формате ODT, список источников в отдельном файле. Для практического употребления пользователями алгоритм реализован.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 3.12.2021 - 06:55
Сообщение #5





Группа: Пользователи
Сообщений: 1172
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Для описанного мной выше способа уже есть код R. Но тут подумал, что ресэмплинг можно организовать и по-другому. Брать одно случайное значение из выборки А и делить его на случайное значение из выборки В. И так десятки и сотни тысяч раз. Получится куча отношений по которым можно рассчитать и дисперсию и/или 95% ДИ. Тоже легко реализовать в R, но времени свободного вообще нет в конце года...

Также возможен вариант, который скорее всего будет вообще самым лучшим в этой ситуации - точное перестановочное (Exact permutation). Алгоритм такой. Из выборки А берётся первое значение и по очереди делится на все значения из выборки В. Затем из А берётся второе значение и тоже делятся на значения из В. И так пока не будут получены все возможные отношения. Кстати их будет меньше десятков и сотен тысяч, поэтому и алгоритм не ресурсоёмкий должен быть. Для этого набора отношений рассчитывается дисперсия и/или 95% ДИ. Не знаю как реализовать это в R, чтобы это не выглядело как BASIС))).

Выкладывайте свои реальные цифры, а то на симуляциях неинтересно...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Camel1000
сообщение 3.12.2021 - 15:34
Сообщение #6





Группа: Пользователи
Сообщений: 15
Регистрация: 3.02.2013
Пользователь №: 24599



Цитата(nokh @ 3.12.2021 - 06:55) *
Для описанного мной выше способа уже есть код R. Но тут подумал, что ресэмплинг можно организовать и по-другому. Брать одно случайное значение из выборки А и делить его на случайное значение из выборки В. И так десятки и сотни тысяч раз. Получится куча отношений по которым можно рассчитать и дисперсию и/или 95% ДИ. Тоже легко реализовать в R, но времени свободного вообще нет в конце года...

Также возможен вариант, который скорее всего будет вообще самым лучшим в этой ситуации - точное перестановочное (Exact permutation). Алгоритм такой. Из выборки А берётся первое значение и по очереди делится на все значения из выборки В. Затем из А берётся второе значение и тоже делятся на значения из В. И так пока не будут получены все возможные отношения. Кстати их будет меньше десятков и сотен тысяч, поэтому и алгоритм не ресурсоёмкий должен быть. Для этого набора отношений рассчитывается дисперсия и/или 95% ДИ. Не знаю как реализовать это в R, чтобы это не выглядело как BASIС))).

Выкладывайте свои реальные цифры, а то на симуляциях неинтересно...

Большое спасибо за обстоятельный разбор. Насколько я понял, математический смысл отношения случайных переменных не очень-то ясен (в отличие от их суммы или разности). Смущает и то, что при попытке использовать для расчетов приведенные выше формулы дисперсия получается все время существенно меньше, чем у исходных данных, хотя интуитивно кажется, что должно быть наоборот.
То есть все склоняется к разным видам ресемплинга\бустрепа, но для него нужно больше исходного материала... У меня пока еще выборки не набрались хоть сколько-нибудь приличного размера. В процессе накопления.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 3.12.2021 - 21:30
Сообщение #7





Группа: Пользователи
Сообщений: 785
Регистрация: 23.08.2010
Пользователь №: 22694



тут люди добрые уже все порешали

Сообщение отредактировал 100$ - 3.12.2021 - 21:33
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему