Добрый день.
Прошу статистиков помочь мне со статистическим моделированием.
Имеется выборка экспериментальных результатов объёма N_эксп. Необходимо проверить гипотезу о принадлежности этой выборки заданному теоретическому распределению.
Согласно [1,с. 5] и [2,с.34] алгоритм следующий (для примера будем проверять на принадлежность экспериментальной выборки нормальному распределению ? гипотеза Н0).
1. По выборке объёмом N_эксп каким-либо методом определяем параметры теоретического распределения. В нашем примере это Mu_эксп и Sigma_эксп.
2. Вычисляется значение статистики критерия согласия S_эксп.
3. В соответствии с теоретическим распределением (нормальным с параметрами Mu_эксп и Sigma_эксп) генерируется выборка объёмом N_эксп (для этого применяется либо эмпитическая функция распределения[1], либо бутсреп [2]).
4. Для сгенерированной на шаге 3 выборки вычисляеютя оценки параметров распределения Mu_i и Sigma_i.
5. Для сгенерированной на шаге 3 выборки вычисляется значение статистики критерия S_i.
6. Повторяем шаги 3,4,5 N раз.
7. По массиву S_i (объём массива N) строим распределение статистики критерия S и, зная S_эксп, вычисляем достигнутый уровень значимости. Далее принимаем решение: какие основание дают экспериментальные данные, что бы отвергнуть гипотезу Н0.
ПРЕДЛАГАЮ ОБСУДИТЬ СЛЕДУЮЩИЙ ВОПРОС.
Для чего шаг 4? У Шитикова и Розенберга это называется ?двойной бутсреп? и ?внутренняя петля бутсрепа? (если я правильно понял, что написано на стр. 34 [2] !).
Моё мнение таково.
Имея массивы Mu_i и Sigma_i (объёмом N) можно построить функции распределения (или плотности) и по ним.
А) Определить ДИ для Mu_эксп и Sigma_эксп. Но что делать с этими ДИ дальше, как их использовать для повышения обоснованности вывода о гипотезе H0 ?
Б) можно сделать наше теоретическое распределение не ?детерминированным?, а ?случайным?. Поясню. Пусть гипотезу Н0 не отвергаем. Полученное теоретическое распределение с параметрами Mu_эксп и Sigma_эксп это не конечная цель нашей работы. Мы будем генерировать случайные величины в соответствии с этим теоретическим распределением и использовать их для последующих этапов моделирования. Может быть, прежде чем сгенирировать нормальное случайное число, мы сгенерируем Mu_j и Sigma_j в соответствии с их распределением. Но ни в [1], [2] и [3] про это ничего не говорится, и про такое я нигде не читал (прикладной статистикой, правда, занимаюсь не очень давно). И ещё не понятно, какую дополнительную информацию это даст.
Заранее благодарен за обсуждения.
Прошу меня извинить за:
1. Огромное количество ошибок. Пишу на планшете ? палец большой-большой, а символы маленькие-маленькие,
2. Отвечать сразу не могу, так как доступ к сети ограничен.
С уважением SergeyVM.
Литература.
1. Р.50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Ч.П. Непараметрические критерии. - М.: Изд-во стандартов, 2002.- 64 с.
2. Шитиков В.К., Розенберг Г.С. Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. - Тольятти: Кассандра, 2013.- 314 с.
3. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход: монография/ Б.Ю. Лемешко, С.Б. Лемешко, С.М. Постовалов, Е.В. Чимитова. ? Новосибирск : Изд-во НГТУ, 2011. ? 888 с.