Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> выбросы в statistica
kont
сообщение 19.07.2015 - 18:55
Сообщение #1





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



Подскажите, пожалуйста, в программе Statistica выбросы помечаются кружком, а экстримально большие или низкие значения звездочкой (* )
Я не понял выбросы и экстримальные значения это разные вещи?

И такой вопрос, как бы он странно не звучал. До какого момента мне удалять выбросы? Объясняю. На графике вижу выбросы. В статистике есть инструмент кисть. можно нажать на кружок и значение удалится. Однако, как только удалил значение сразу обнаруживается другой выброс в сравнении со всем числовым рядом. Итак можно до бесконечности удалять. Помнится как в мультике, когда медважата пытались сделать кусок сыра ровным, откусывая по чуть-чуть, а кончилось тем что весь сыр съели. Тоже самое и тут. До какого момента мне выбросы удалять. Есть ли метод подсказывающий, что выбросы достаточно уже удалены?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
kont
сообщение 22.07.2015 - 11:13
Сообщение #2





Группа: Пользователи
Сообщений: 149
Регистрация: 11.02.2014
Пользователь №: 26005



Спасибо вам. Просто из курса мат.статистики, который нам вскользь читали, нам говорили ,что выбросы могут влиять на результат, особенно если пользоваться параметрическими методами. Но ведь есть непараметрика ,которой на выбросы все равно. Данные в основном финансовые. прибыли-убытки. Например, группирующая переменная регион(30 регионов, т.е. 30 групп) и прибыль(убытки организации)
вот и смотрятся средние по регионам. там прибыли могут быть 100 млн, или убытки тоже в млн и есть выбросы.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 22.07.2015 - 14:49
Сообщение #3





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(kont @ 22.07.2015 - 13:13) *
Спасибо вам. Просто из курса мат.статистики, который нам вскользь читали, нам говорили ,что выбросы могут влиять на результат, особенно если пользоваться параметрическими методами. Но ведь есть непараметрика ,которой на выбросы все равно. Данные в основном финансовые. прибыли-убытки. Например, группирующая переменная регион(30 регионов, т.е. 30 групп) и прибыль(убытки организации)
вот и смотрятся средние по регионам. там прибыли могут быть 100 млн, или убытки тоже в млн и есть выбросы.

Многие (если не большинство) экономических показателей имеют распределения близкие к логарифмически нормальному. Это - тоже определённая информация, которую можно использовать в анализе, тогда как уход в порядковую статистику сопряжён с потерей мощности. Биологи и медики почему-то с радостью готовы жертвовать мощностью в угоду простым методам и знакомым именам типа Манна - Уитни и Краскела - Уоллиса. Но вот в эконометрике люди предпочитают использовать сложные модели для исходных данных - по крайней мере у меня сложилось именно такое впечатление. Скажем, если не выполняется требование однородности дисперсий в регрессии - используют модели с учётом гетероскедастичности или используют преобразования исходных данных. Поэтому раз работа экономическая, думаю вам будет лучше (понятнее для коллег) работать параметрикой после предварительного преобразования данных по Боксу - Коксу (много информации на этом форуме). Может быть в правильной шкале и "выбросов" никаких не будет.
Также посмотрите сообщение Den-N в этой теме: http://molbiol.ru/forums/index.php?showtopic=551548
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему