выбросы в statistica - Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

выбросы в statistica

kont Просмотр профиля	19.07.2015 - 18:55 Сообщение #1
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005	Подскажите, пожалуйста, в программе Statistica выбросы помечаются кружком, а экстримально большие или низкие значения звездочкой (* ) Я не понял выбросы и экстримальные значения это разные вещи? И такой вопрос, как бы он странно не звучал. До какого момента мне удалять выбросы? Объясняю. На графике вижу выбросы. В статистике есть инструмент кисть. можно нажать на кружок и значение удалится. Однако, как только удалил значение сразу обнаруживается другой выброс в сравнении со всем числовым рядом. Итак можно до бесконечности удалять. Помнится как в мультике, когда медважата пытались сделать кусок сыра ровным, откусывая по чуть-чуть, а кончилось тем что весь сыр съели. Тоже самое и тут. До какого момента мне выбросы удалять. Есть ли метод подсказывающий, что выбросы достаточно уже удалены?

Ответов

kont Просмотр профиля	22.07.2015 - 15:43 Сообщение #2
Группа: Пользователи Сообщений: 149 Регистрация: 11.02.2014 Пользователь №: 26005	nokh, кстати спасибо Вам за мысль. Дело в том, что я думал неоднократно,а можно ли с данными, которые имеют очень большие значения свыше миллиона как- то их преобразовывать, либо через натуральный логарифм (LN) или через бокс кокса. Тем более у меня в данных может быть так, что сигма может быть больше чем среднее. Например, 1000 000+-2000 000 т.к. в одном столбце не только прибыль, но и убытки. За форум тоже спасибо, не видел такого, тут в основном по R, конечно, но можно почитать. В дисперсионном анализе какое количество групп возможно в группирующей переменной? Вроде на одну группу нужно минимум 5 наблюдений, но чтоб в целом по всем группам, общее число выборки было не менее 100. Мои данные согласно Шапиро-Уилкса ненормально распределены p<0,0001, в Statistica есть возможность работать с распределениями. Из всех ,которых я перепробовал почему - то статистика сочла нужным работать только c rectangular distribution Но возможно, я что-то не так делал, хотя скорее всего много отрицательных значений или нулевых , поэтому экспоненциальное распределение точно не подходило. Если в том же R есть функция определять тип распределения ,я бы мог и через R попробовать.

Сообщений в этой теме

kont выбросы в statistica 19.07.2015 - 18:55

nokh Цитата(kont @ 19.07.2015 - 20:55) По... 19.07.2015 - 20:06

p2004r Цитата(kont @ 19.07.2015 - 18:55) По... 20.07.2015 - 11:55

kont Спасибо вам. Просто из курса мат.статистики, котор... 22.07.2015 - 11:13

nokh Цитата(kont @ 22.07.2015 - 13:13) Сп... 22.07.2015 - 14:49

kont nokh, кстати спасибо Вам за мысль. Дело в том, что... 22.07.2015 - 15:43

nokh Цитата(kont @ 22.07.2015 - 17:43) В ... 26.07.2015 - 06:30

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум