Рассеяние для выборки с законом распределения, отличным от нормального |
Здравствуйте, гость ( Вход | Регистрация )
Рассеяние для выборки с законом распределения, отличным от нормального |
14.10.2013 - 18:11
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 21.02.2013 Пользователь №: 24650 |
Друзья, доброго времени суток!
Помогите определиться со следующим моментом. Предположим есть выборка, которая имеет нормальный закон распределения. Тогда для описания среднего и рассеяния этой выборки используют математическое ожидание и стандартное отклонение. Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния? |
|
14.10.2013 - 21:38
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 116 Регистрация: 20.02.2011 Пользователь №: 23251 |
Если не хочется поиграться с разными трансформациями, то для данных, которые не поддаются нормального закону распределения, используют величину диапазона (range), которая может быть представлена 3 (может больше найдете) значениями:
1) max & min - то есть максимальная и минимальная величины данных (часто называют full data range). 2) диапазон представляет собой межквартильный размах (IQR). 3) 5-95 - 10-90 процентиль, медиана как 50 процентиль. Чаще всего используется #2 (хотя на вкус и цвет...) Сообщение отредактировал TheThing - 14.10.2013 - 21:43 |
|
14.10.2013 - 23:47
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния? Медиана, это квантиль при 0.5, соответственно заказываем квантили при 0.025 и 0.975 например. А для похожести на стандартное можно взять например quantile(rnorm(100000), probs=c(0.1559,0.8415)) (или сколько там точно значение? |
|
15.10.2013 - 10:54
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Друзья, доброго времени суток! Помогите определиться со следующим моментом. Предположим есть выборка, которая имеет нормальный закон распределения. Тогда для описания среднего и рассеяния этой выборки используют математическое ожидание и стандартное отклонение. Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния? Дорогой Чебурашка! В сюжете с мат. ожиданием и средним первично мат. ожидание: не мат. ожидание используют для оценки среднего, а наоборот: средняя арифметическая - состоятельная оценка мат. ожидания по имеющейся выборке. И угостите, пож-ста, ссылочкой на бесценную рекомендацию не использовать второй момент распределения (ака дисперсию) при анализе случайных величин. А то из вашего сообщения вгорячах можно сделать вывод, что авторы ЦПТ (Линдеберг, Леви, Феллер и Ляпунов) чего-то сильно не понимали в статистике. |
|
15.10.2013 - 12:34
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Я сейчас как-раз после сытного обеда и хочется немного поболтать.
Предположим есть выборка, которая имеет нормальный закон распределения. Тогда для описания среднего и рассеяния этой выборки используют математическое ожидание и стандартное отклонение. Для нормальной выборки среднее, мода и медиана совпадают. Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния? Среднее значение случайной величины, оно и в Африке среднее. Т.е. сложили все значения и поделили на кол-во измерений. По определению среднее = матем.ожиданию. Но если вас не устраивает мат.ожидание (или его не существует), тогда, в зависимости от целей исследования, берут медиану, или моду, или придумывают что-то еще. Тоже самое можно сказать про рассеяние. В зависимости от целей можно взять дисперсию (если она существует) или разность перцентилей, или еще что-то. Просто включи мозги => http://doctorstat.narod.ru
|
|
18.10.2013 - 15:17
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 46 Регистрация: 19.07.2013 Из: Украина, Харьков Пользователь №: 25002 |
Предположим есть выборка, которая имеет нормальный закон распределения. Тогда для описания среднего и рассеяния этой выборки используют математическое ожидание и стандартное отклонение. Только наоборот, для описания матожидания используется среднее, рассчитанное по выборке Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния? В качестве среднего медиану не используют. Если закон не нормальный, то медиана и матожидание не совпадают, поэтому нельзя оценку одного параметра заменить оценкой другого. А с какой целью Вам нужен разброс? Если с целью простого описания выборки, то используют процентили. Если с целью применения статистических критериев, то тут надо учитывать следующее. Критерии можно разбить на параметрические (т.е. те, которые используют параметры закона распределения СВ) и непараметрические. Для каждого критерия есть условия его применения. Чаще всего одним из условий применения параметрических методов является требование соответствия выборочного закона нормальному. Если же закон не нормальный, то нужно применять непараметрические методы, а в этом случае не требуется знания параметров закона распределения. |
|
18.10.2013 - 20:51
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
В качестве среднего медиану не используют. Да неужели? А мужики-то (Коши, Колмогоров) и не знали! А то, что медиана является средней по Коши и еще структурной средней вас не смущает? Успехов в изучении матчасти! А то нас дети читают. Поощрите компетентностью любознательность подрастающего поколения. |
|
19.10.2013 - 17:12
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 46 Регистрация: 19.07.2013 Из: Украина, Харьков Пользователь №: 25002 |
|
|
19.10.2013 - 18:19
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|