Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Рассеяние для выборки с законом распределения, отличным от нормального
Cheburashka
сообщение 14.10.2013 - 18:11
Сообщение #1





Группа: Пользователи
Сообщений: 8
Регистрация: 21.02.2013
Пользователь №: 24650



Друзья, доброго времени суток!

Помогите определиться со следующим моментом.

Предположим есть выборка, которая имеет нормальный закон распределения. Тогда для описания среднего и рассеяния этой выборки используют математическое ожидание и стандартное отклонение.

Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
TheThing
сообщение 14.10.2013 - 21:38
Сообщение #2





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



Если не хочется поиграться с разными трансформациями, то для данных, которые не поддаются нормального закону распределения, используют величину диапазона (range), которая может быть представлена 3 (может больше найдете) значениями:
1) max & min - то есть максимальная и минимальная величины данных (часто называют full data range).
2) диапазон представляет собой межквартильный размах (IQR).
3) 5-95 - 10-90 процентиль, медиана как 50 процентиль.

Чаще всего используется #2 (хотя на вкус и цвет...)

Сообщение отредактировал TheThing - 14.10.2013 - 21:43
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 14.10.2013 - 23:47
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Cheburashka @ 14.10.2013 - 18:11) *
Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния?


Медиана, это квантиль при 0.5, соответственно заказываем квантили при 0.025 и 0.975 например. А для похожести на стандартное можно взять например quantile(rnorm(100000), probs=c(0.1559,0.8415)) (или сколько там точно значение? smile.gif


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 15.10.2013 - 10:54
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Cheburashka @ 14.10.2013 - 19:11) *
Друзья, доброго времени суток!

Помогите определиться со следующим моментом.

Предположим есть выборка, которая имеет нормальный закон распределения. Тогда для описания среднего и рассеяния этой выборки используют математическое ожидание и стандартное отклонение.

Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния?


Дорогой Чебурашка!

В сюжете с мат. ожиданием и средним первично мат. ожидание: не мат. ожидание используют для оценки среднего, а наоборот: средняя арифметическая - состоятельная оценка мат. ожидания по имеющейся выборке.

И угостите, пож-ста, ссылочкой на бесценную рекомендацию не использовать второй момент распределения (ака дисперсию) при анализе случайных величин. А то из вашего сообщения вгорячах можно сделать вывод, что авторы ЦПТ (Линдеберг, Леви, Феллер и Ляпунов) чего-то сильно не понимали в статистике.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 15.10.2013 - 12:34
Сообщение #5





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Я сейчас как-раз после сытного обеда и хочется немного поболтать.
Цитата(Cheburashka @ 14.10.2013 - 19:11) *
Предположим есть выборка, которая имеет нормальный закон распределения. Тогда для описания среднего и рассеяния этой выборки используют математическое ожидание и стандартное отклонение.

Для нормальной выборки среднее, мода и медиана совпадают.
Цитата(Cheburashka @ 14.10.2013 - 19:11) *
Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния?

Среднее значение случайной величины, оно и в Африке среднее. Т.е. сложили все значения и поделили на кол-во измерений. По определению среднее = матем.ожиданию. Но если вас не устраивает мат.ожидание (или его не существует), тогда, в зависимости от целей исследования, берут медиану, или моду, или придумывают что-то еще. Тоже самое можно сказать про рассеяние. В зависимости от целей можно взять дисперсию (если она существует) или разность перцентилей, или еще что-то.



Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Статистик
сообщение 18.10.2013 - 15:17
Сообщение #6





Группа: Пользователи
Сообщений: 46
Регистрация: 19.07.2013
Из: Украина, Харьков
Пользователь №: 25002



Цитата(Cheburashka @ 14.10.2013 - 18:11) *
Предположим есть выборка, которая имеет нормальный закон распределения. Тогда для описания среднего и рассеяния этой выборки используют математическое ожидание и стандартное отклонение.

Только наоборот, для описания матожидания используется среднее, рассчитанное по выборке

Цитата(Cheburashka @ 14.10.2013 - 18:11) *
Теперь пусть есть выборка, для которой не выполняются тесты о проверке нормальности. В этом случае в качестве среднего используют медиану. А что лучше использовать в качестве рассеяния?

В качестве среднего медиану не используют. Если закон не нормальный, то медиана и матожидание не совпадают, поэтому нельзя оценку одного параметра заменить оценкой другого.

А с какой целью Вам нужен разброс? Если с целью простого описания выборки, то используют процентили. Если с целью применения статистических критериев, то тут надо учитывать следующее.
Критерии можно разбить на параметрические (т.е. те, которые используют параметры закона распределения СВ) и непараметрические.
Для каждого критерия есть условия его применения.
Чаще всего одним из условий применения параметрических методов является требование соответствия выборочного закона нормальному. Если же закон не нормальный, то нужно применять непараметрические методы, а в этом случае не требуется знания параметров закона распределения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 18.10.2013 - 20:51
Сообщение #7





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Статистик @ 18.10.2013 - 16:17) *
В качестве среднего медиану не используют.



Да неужели? А мужики-то (Коши, Колмогоров) и не знали! А то, что медиана является средней по Коши и еще структурной средней вас не смущает?

Успехов в изучении матчасти! А то нас дети читают. Поощрите компетентностью любознательность подрастающего поколения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Статистик
сообщение 19.10.2013 - 17:12
Сообщение #8





Группа: Пользователи
Сообщений: 46
Регистрация: 19.07.2013
Из: Украина, Харьков
Пользователь №: 25002



Цитата(100$ @ 18.10.2013 - 20:51) *
Да неужели? А мужики-то (Коши, Колмогоров) и не знали! А то, что медиана является средней по Коши и еще структурной средней вас не смущает?


Блеснули знаниями. Молодец. А какое отношение это все имеет к вопросу первого поста?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 19.10.2013 - 18:19
Сообщение #9





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Статистик @ 19.10.2013 - 18:12) *
Блеснули знаниями. Молодец. А какое отношение это все имеет к вопросу первого поста?


К теме первого поста имеют отношение первые пять постов. Тут я с вами согласен. Остальное имеет отношение только к вам.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему