Автор: Camel1000 30.11.2021 - 17:37
Всем добрый день.
Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,
Спасибо заранее,
Camel1000
Автор: p2004r 1.12.2021 - 00:04
Цитата(Camel1000 @ 30.11.2021 - 17:37)
Всем добрый день.
Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,
Спасибо заранее,
Camel1000
Для конкретных параметров легче легкого
Код
> quantile(replicate(100000, mean(rnorm(10, mean=1,sd=2))/mean(rnorm(14, mean=2,sd=1))), probs=c(0.025,0.5,0.975))
2.5% 50% 97.5%
-0.1213920 0.5002085 1.1963876
> quantile(replicate(100000, mean(rnorm(10, mean=10,sd=2))/mean(rnorm(14, mean=2,sd=1))), probs=c(0.025,0.5,0.975))
2.5% 50% 97.5%
3.818239 4.996390 6.911531
Ну и видим 4 сигмы соответственно. Можно сразу писать sd() вместо quantile()
Автор: nokh 1.12.2021 - 00:18
1) См формулу 3.31 на стр. 122 в Урбах "Биометрические методы"
2) См дискуссию здесь: https://www.researchgate.net/post/How-do-I-calculate-the-variance-of-the-ratio-of-two-independent-variables
3) Если распределение отношения отличается от нормального или неизвестно, лучше рассчитать бутстрэпом: получить реплику для А и реплику для В, найти отношение. И так тысячи раз. Рассчитать для полученного массива дисперсию (хотя лучше рассчитать 95% Доверительный интервал - распределение может не быть в точности симметричным). Также бутстрэп позволит сделать поправку на смещение в оценке дисперсии по выборке, если интересует именно дисперсия.
Автор: Игорь 1.12.2021 - 11:06
Цитата(Camel1000 @ 30.11.2021 - 18:37)
Всем добрый день.
Совершенно запутался в вопросе дисперсии отношений двух случайных величин. Если у нас есть выборка 1 (12 значений), описываемая средним арифметическим A (что, как я понимаю, является грубой оценкой матожидания) и дисперсией Sa, и выборка 2 (12 значений), описываемая средним арифметическим B и дисперсией Sb, то какова будет дисперсия S(a/b) отношения A и И,
Раздел 3.2.13 по ссылке https://sourceforge.net/projects/me-com/
Автор: nokh 3.12.2021 - 06:55
Для описанного мной выше способа уже есть код R. Но тут подумал, что ресэмплинг можно организовать и по-другому. Брать одно случайное значение из выборки А и делить его на случайное значение из выборки В. И так десятки и сотни тысяч раз. Получится куча отношений по которым можно рассчитать и дисперсию и/или 95% ДИ. Тоже легко реализовать в R, но времени свободного вообще нет в конце года...
Также возможен вариант, который скорее всего будет вообще самым лучшим в этой ситуации - точное перестановочное (Exact permutation). Алгоритм такой. Из выборки А берётся первое значение и по очереди делится на все значения из выборки В. Затем из А берётся второе значение и тоже делятся на значения из В. И так пока не будут получены все возможные отношения. Кстати их будет меньше десятков и сотен тысяч, поэтому и алгоритм не ресурсоёмкий должен быть. Для этого набора отношений рассчитывается дисперсия и/или 95% ДИ. Не знаю как реализовать это в R, чтобы это не выглядело как BASIС))).
Выкладывайте свои реальные цифры, а то на симуляциях неинтересно...
Автор: Camel1000 3.12.2021 - 15:34
Цитата(nokh @ 3.12.2021 - 06:55)
Для описанного мной выше способа уже есть код R. Но тут подумал, что ресэмплинг можно организовать и по-другому. Брать одно случайное значение из выборки А и делить его на случайное значение из выборки В. И так десятки и сотни тысяч раз. Получится куча отношений по которым можно рассчитать и дисперсию и/или 95% ДИ. Тоже легко реализовать в R, но времени свободного вообще нет в конце года...
Также возможен вариант, который скорее всего будет вообще самым лучшим в этой ситуации - точное перестановочное (Exact permutation). Алгоритм такой. Из выборки А берётся первое значение и по очереди делится на все значения из выборки В. Затем из А берётся второе значение и тоже делятся на значения из В. И так пока не будут получены все возможные отношения. Кстати их будет меньше десятков и сотен тысяч, поэтому и алгоритм не ресурсоёмкий должен быть. Для этого набора отношений рассчитывается дисперсия и/или 95% ДИ. Не знаю как реализовать это в R, чтобы это не выглядело как BASIС))).
Выкладывайте свои реальные цифры, а то на симуляциях неинтересно...
Большое спасибо за обстоятельный разбор. Насколько я понял, математический смысл отношения случайных переменных не очень-то ясен (в отличие от их суммы или разности). Смущает и то, что при попытке использовать для расчетов приведенные выше формулы дисперсия получается все время существенно меньше, чем у исходных данных, хотя интуитивно кажется, что должно быть наоборот.
То есть все склоняется к разным видам ресемплинга\бустрепа, но для него нужно больше исходного материала... У меня пока еще выборки не набрались хоть сколько-нибудь приличного размера. В процессе накопления.
Автор: 100$ 3.12.2021 - 21:30
https://onlinelibrary.wiley.com/doi/epdf/10.1002/%28SICI%291097-0320%2820000401%2939%3A4%3C300%3A%3AAID-CYTO8%3E3.0.CO%3B2-O люди добрые уже все порешали