Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Дисперсия отношения двух переменных

Автор: Camel1000 30.11.2021 - 17:37

Всем добрый день.

Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,

Спасибо заранее,
Camel1000

Автор: p2004r 1.12.2021 - 00:04

Цитата(Camel1000 @ 30.11.2021 - 17:37) *
Всем добрый день.

Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,

Спасибо заранее,
Camel1000



Для конкретных параметров легче легкого

Код
> quantile(replicate(100000, mean(rnorm(10, mean=1,sd=2))/mean(rnorm(14, mean=2,sd=1))), probs=c(0.025,0.5,0.975))
      2.5%        50%      97.5%
-0.1213920  0.5002085  1.1963876
> quantile(replicate(100000, mean(rnorm(10, mean=10,sd=2))/mean(rnorm(14, mean=2,sd=1))), probs=c(0.025,0.5,0.975))
    2.5%      50%    97.5%
3.818239 4.996390 6.911531


Ну и видим 4 сигмы соответственно. Можно сразу писать sd() вместо quantile()

Автор: nokh 1.12.2021 - 00:18

1) См формулу 3.31 на стр. 122 в Урбах "Биометрические методы"
2) См дискуссию здесь: https://www.researchgate.net/post/How-do-I-calculate-the-variance-of-the-ratio-of-two-independent-variables
3) Если распределение отношения отличается от нормального или неизвестно, лучше рассчитать бутстрэпом: получить реплику для А и реплику для В, найти отношение. И так тысячи раз. Рассчитать для полученного массива дисперсию (хотя лучше рассчитать 95% Доверительный интервал - распределение может не быть в точности симметричным). Также бутстрэп позволит сделать поправку на смещение в оценке дисперсии по выборке, если интересует именно дисперсия.

Автор: Игорь 1.12.2021 - 11:06

Цитата(Camel1000 @ 30.11.2021 - 18:37) *
Всем добрый день.

Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,


Раздел 3.2.13 по ссылке https://sourceforge.net/projects/me-com/

Автор: nokh 3.12.2021 - 06:55

Для описанного мной выше способа уже есть код R. Но тут подумал, что ресэмплинг можно организовать и по-другому. Брать одно случайное значение из выборки А и делить его на случайное значение из выборки В. И так десятки и сотни тысяч раз. Получится куча отношений по которым можно рассчитать и дисперсию и/или 95% ДИ. Тоже легко реализовать в R, но времени свободного вообще нет в конце года...

Также возможен вариант, который скорее всего будет вообще самым лучшим в этой ситуации - точное перестановочное (Exact permutation). Алгоритм такой. Из выборки А берётся первое значение и по очереди делится на все значения из выборки В. Затем из А берётся второе значение и тоже делятся на значения из В. И так пока не будут получены все возможные отношения. Кстати их будет меньше десятков и сотен тысяч, поэтому и алгоритм не ресурсоёмкий должен быть. Для этого набора отношений рассчитывается дисперсия и/или 95% ДИ. Не знаю как реализовать это в R, чтобы это не выглядело как BASIС))).

Выкладывайте свои реальные цифры, а то на симуляциях неинтересно...

Автор: Camel1000 3.12.2021 - 15:34

Цитата(nokh @ 3.12.2021 - 06:55) *
Для описанного мной выше способа уже есть код R. Но тут подумал, что ресэмплинг можно организовать и по-другому. Брать одно случайное значение из выборки А и делить его на случайное значение из выборки В. И так десятки и сотни тысяч раз. Получится куча отношений по которым можно рассчитать и дисперсию и/или 95% ДИ. Тоже легко реализовать в R, но времени свободного вообще нет в конце года...

Также возможен вариант, который скорее всего будет вообще самым лучшим в этой ситуации - точное перестановочное (Exact permutation). Алгоритм такой. Из выборки А берётся первое значение и по очереди делится на все значения из выборки В. Затем из А берётся второе значение и тоже делятся на значения из В. И так пока не будут получены все возможные отношения. Кстати их будет меньше десятков и сотен тысяч, поэтому и алгоритм не ресурсоёмкий должен быть. Для этого набора отношений рассчитывается дисперсия и/или 95% ДИ. Не знаю как реализовать это в R, чтобы это не выглядело как BASIС))).

Выкладывайте свои реальные цифры, а то на симуляциях неинтересно...

Большое спасибо за обстоятельный разбор. Насколько я понял, математический смысл отношения случайных переменных не очень-то ясен (в отличие от их суммы или разности). Смущает и то, что при попытке использовать для расчетов приведенные выше формулы дисперсия получается все время существенно меньше, чем у исходных данных, хотя интуитивно кажется, что должно быть наоборот.
То есть все склоняется к разным видам ресемплинга\бустрепа, но для него нужно больше исходного материала... У меня пока еще выборки не набрались хоть сколько-нибудь приличного размера. В процессе накопления.

Автор: 100$ 3.12.2021 - 21:30

https://onlinelibrary.wiley.com/doi/epdf/10.1002/%28SICI%291097-0320%2820000401%2939%3A4%3C300%3A%3AAID-CYTO8%3E3.0.CO%3B2-O люди добрые уже все порешали

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)