Выбросы и влияющие наблюдения - Форум врачей-аспирантов

Выбросы и влияющие наблюдения

Pinus Просмотр профиля	11.11.2009 - 02:55 Сообщение #1
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Народ, где можно найти толковое описание процедуры проверки данных на выбросы (статистика Кука и расстояние Махаланобиса) и влияющие наблюдения? Сообщение отредактировал Pinus - 11.11.2009 - 02:56

Ответов

Pinus Просмотр профиля	3.12.2009 - 14:35 Сообщение #2
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Игорь, что-то совсем другие цифры у меня получаются. Вероятно не правильно ввожу интервалы. Что такое: интервал обучающей выборки, интервал номеров классов или оценок, интервал вывода результатов во вкладке Обучение?

Игорь Просмотр профиля	3.12.2009 - 18:44 Сообщение #3
Группа: Пользователи Сообщений: 1162 Регистрация: 10.04.2007 Пользователь №: 4040	Цитата(Pinus @ 3.12.2009 - 15:35) Игорь, что-то совсем другие цифры у меня получаются. Вероятно не правильно ввожу интервалы. Что такое: интервал обучающей выборки, интервал номеров классов или оценок, интервал вывода результатов во вкладке Обучение? Конечно, неправильно. Обучающая выборка - это матрица регрессоров. Интервал оценок - вектор зависимой переменной. Терминология немного необычна для регрессионного анализа. В модуле представлены методы распознавания. Множественную регрессию можно также рассматривать с этой точки зрения. Как-то нужно было ввод упорядочить для различных методов. Цитата(DrgLena @ 3.12.2009 - 16:37) Игорь, если готовите дополнение к AtteStat, посмотрите, что выдают две программы по классическому примеру ирисы, по той же модели, что у вас. У меня нет 6 статистики, сделано в 8 версии, стьюдентизированные остатки я там не нашла. NCSS дает наиболее подробный отчет по диагностике. В фале данных, который имеется в пакете поставки Statistica данные в другом порядке, но легко найти нужную строку. Безусловно, модель абсолютно сходится. Но стандартизированные остатки сходятся в Attestat и NCSS (первая строка в файле Игоря, это 64 строка файла iris.sta -0,1031), но не с Statistica8 (-0,1022). А стьюдентизированные в Attestat и NCSS не сходятся. Полезно, на мой взгляд иметь некоторые показатели из отчета NCSS, например, абс. процент ошибки, что обсуждалось на форуме или HAT Diagonal. Могут различаться по разным причинам. Во-первых, разные авторы имеют в виду не то же самое под одними и теми же терминами. Во-вторых, иногда не совсем понятно, как формулы вычислять. Так, к примеру, при вычислении стьюдентизтрованного остатка для вычисления MSE (в знаменателе) данное наблюдение исключается и модель ПОЛНОСТЬЮ строится без него, затем для него делается прогноз. А остаток (в числителе) как вычислять? В источниках (Колеников, Smith) - вроде бы не исключается наблюдение, берется из полной модели. НО! Разве это логично - брать остаток для полной модели? Обращаясь к Эфрону, исключать его надо! По идее бутстрепа. Хотя расхождения незначительны, честно говоря. Далее, важно не "переборщить" в выводе. Например, я могу понять необходимость в ДИ оценки наблюдения. Но ДИ для весовых коэффициентов регрессии - зачем? Кому уж сильно надо, легко посчитать - дисперсия-то имеется, функции распределения в Excel есть. Зато дополнительно - выбросы помечаются красным цветом, влияющие наблюдения (по Куку) - синим. В примере с ирисами Фишера, правда, влияющих наблюдений не обнаружилось, но можно одно из наблюдений для проверки программы установить, скажем, в значение 10 - сразу виден эффект. Сообщение отредактировал Игорь - 3.12.2009 - 19:14 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!

Pinus Просмотр профиля	4.12.2009 - 12:01 Сообщение #4
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286	Цитата(Игорь @ 4.12.2009 - 01:44) Конечно, неправильно. Обучающая выборка - это матрица регрессоров. Интервал оценок - вектор зависимой переменной. Игорь, давайте подробно разберем. Интервал обучающей выборки ? это матрица регрессоров (независимых переменных). Если регрессор один ? тоже можно (не матрица, а вектор). Интервал номеров классов или оценок ? это вектор зависимой переменной. Интервал вывода результатов ? просто обозначить место на листе (можно одну ячейку), относительно которого будут размещены результаты расчетов. Данные следует располагать в столбцах. Если делать так, то не сходятся ни предсказанные значения, ни остатки. В чем может быть ошибка?

Сообщений в этой теме

Pinus Выбросы и влияющие наблюдения 11.11.2009 - 02:55

DrgLena Я использую статистику критерия Граббса, если про... 11.11.2009 - 14:58

Pinus Мне для регрессии. В Statistica предлагается два к... 12.11.2009 - 02:14

avorotniak Выброс (outlier) определяется отдаленностью отдель... 12.11.2009 - 05:46

Pinus Цитата(avorotniak @ 12.11.2009 - 13... 14.11.2009 - 08:10

Pinus Цитата(avorotniak @ 12.11.2009 - 12... 16.11.2009 - 15:58

avorotniak Цитата(Pinus @ 16.11.2009 - 15:58) А... 16.11.2009 - 22:06

nokh > Pinus. Посмотрел в нескольких русскоязычных к... 12.11.2009 - 17:28

avorotniak Сразу хотелось бы уточнить, что дистанция Махалано... 12.11.2009 - 21:50

nokh Большое спасибо, посмотрю. Кому нужно: http://phot... 12.11.2009 - 22:24

Pinus Avorotniak, большое спасибо за ответ! Если не ... 13.11.2009 - 14:24

avorotniak Вопрос: Регрессия простая нелинейная (полином 2-го... 13.11.2009 - 17:37

Pinus nokh, не встречали ли где про Кука? При каких усло... 13.11.2009 - 14:42

avorotniak Извините, небольшая поправка к следующей фразе: О... 13.11.2009 - 18:16

DrgLena Цитата(Pinus @ 14.11.2009 - 08:10) Н... 14.11.2009 - 14:24

avorotniak Правильно по поводу перцентиля 50, однако поищите ... 14.11.2009 - 14:28

Pinus DrgLena, спасибо! Андрей, тоже спасибо! Ск... 15.11.2009 - 02:30

Pinus Андрей, получается, что статистика Кука и для выбр... 15.11.2009 - 14:04

Pinus Кто может подсказать, как правильно перевести Lint... 15.11.2009 - 16:55

avorotniak Интересный и глубокий вопрос. Хотелось бы еще раз ... 15.11.2009 - 17:10

Pinus Цитата(avorotniak @ 16.11.2009 - 00... 16.11.2009 - 05:44

avorotniak Абсолютно согласен. Извините за дезинформацию. 16.11.2009 - 07:34

Pinus Вообще книги на русском, в которых в той или иной ... 16.11.2009 - 15:53

Pinus Как понять Deleted Residual (удаленные остатки)? Э... 17.11.2009 - 17:09

nokh Цитата(Pinus @ 17.11.2009 - 20:09) К... 18.11.2009 - 18:15

avorotniak [quote name='nokh' date='18.11.2009 - ... 18.11.2009 - 22:18

Игорь Цитата(nokh @ 18.11.2009 - 19:15) Лу... 30.11.2009 - 10:13

Pinus Цитата(Игорь @ 30.11.2009 - 17:13) С... 30.11.2009 - 16:58

nokh Цитата(Игорь @ 30.11.2009 - 12:13) Н... 30.11.2009 - 19:11

Игорь Цитата(nokh @ 30.11.2009 - 20:11) ст... 30.11.2009 - 20:58

nokh Цитата(Игорь @ 30.11.2009 - 22:58) М... 30.11.2009 - 21:43

nokh Сегодня исправил описку в своём предыдущем посте -... 19.11.2009 - 15:06

Pinus Цитата(nokh @ 19.11.2009 - 22:06) В ... 23.11.2009 - 12:48

nokh Цитата(Pinus @ 23.11.2009 - 15:48) П... 25.11.2009 - 05:45

Green Leverage - видела перевод как "воздействие... 19.11.2009 - 15:20

DoctorStat Я не специалист по выбросам, но с точки зрения ста... 19.11.2009 - 16:16

avorotniak Пересчитал вручную стандартизированые остатки. Сог... 19.11.2009 - 16:50

avorotniak DoctorStat затронул очень интересную тему. Обрати... 19.11.2009 - 17:19

Pinus Цитата(avorotniak @ 20.11.2009 - 00... 19.11.2009 - 17:55

avorotniak Цитата(Pinus @ 19.11.2009 - 17:55) Я... 19.11.2009 - 19:05

Pinus Цитата(avorotniak @ 20.11.2009 - 02... 22.01.2010 - 05:43

Pinus Позвольте внести мой скромный вклад. Вчера тоже ра... 19.11.2009 - 17:36

Pinus nokh, развейте мои дилетантские соображения. Не по... 20.11.2009 - 13:58

nokh Пока не готов ответить, ещё почитаю. 20.11.2009 - 15:50

nokh Вот что по этому поводу есть в википедии: "..... 23.11.2009 - 08:08

Pinus Цитата(nokh @ 23.11.2009 - 15:08) Т.... 23.11.2009 - 12:44

Pinus Спасибо! 25.11.2009 - 13:14

Игорь По рассматриваемой теме очень рекомендую источник:... 29.11.2009 - 19:50

Игорь 1. В книге Дэйвида "Порядковые статистики... 1.12.2009 - 08:55

Pinus Цитата(Игорь @ 1.12.2009 - 15:55) Ка... 3.12.2009 - 07:57

Игорь Цитата(Pinus @ 3.12.2009 - 07:57) Иг... 3.12.2009 - 08:02

Pinus Игорь, я просчитал. С Вашим примером сошлось. Но п... 5.12.2009 - 01:36

Игорь Цитата(Pinus @ 5.12.2009 - 01:36) Иг... 5.12.2009 - 12:36

DrgLena Цитата(Игорь @ 1.12.2009 - 09:55) а ... 1.12.2009 - 12:29

Игорь Цитата(DrgLena @ 1.12.2009 - 13:29) ... 1.12.2009 - 12:55

Pinus Цитата(DrgLena @ 1.12.2009 - 19:29) ... 3.12.2009 - 08:50

Игорь Цитата(DrgLena @ 1.12.2009 - 13:29) ... 3.12.2009 - 10:48

DrgLena Игорь, за AtteStat ВАМ не просто большое спасибо, ... 1.12.2009 - 13:34

Pinus Игорь, спасибо за ссылки! 3.12.2009 - 12:21

Pinus Игорь, что-то совсем другие цифры у меня получаютс... 3.12.2009 - 14:35

Игорь Цитата(Pinus @ 3.12.2009 - 15:35) Иг... 3.12.2009 - 18:44

Pinus Цитата(Игорь @ 4.12.2009 - 01:44) Ко... 4.12.2009 - 12:01

Игорь Цитата(Pinus @ 4.12.2009 - 13:01) В ... 4.12.2009 - 13:27

DrgLena Игорь, если готовите дополнение к AtteStat, посмо... 3.12.2009 - 15:37

nokh Рассмотрение классического примера об ирисах Фишер... 3.12.2009 - 20:05

Pinus Игорь, если не трудно дайте ссылку откуда вы брали... 4.12.2009 - 14:47

Игорь Цитата(Pinus @ 4.12.2009 - 15:47) Иг... 4.12.2009 - 21:02

Pinus Nokh, попробуйте на своем софте (в программах, кот... 5.12.2009 - 02:06

nokh Ирисы считать не хочу: поскольку использовать OLS-... 5.12.2009 - 02:44

DrgLena Задачка имеет два решения относительно анализа ост... 5.12.2009 - 17:29

Игорь Цитата(DrgLena @ 5.12.2009 - 17:29) ... 5.12.2009 - 21:11

Pinus Цитата(DrgLena @ 6.12.2009 - 00:29) ... 6.12.2009 - 00:32

nokh Закончил вчерне свой труд, конструктивная критика ... 6.12.2009 - 11:31

DrgLena Nokh, спасибо большое, хорошая работа, многое стан... 7.12.2009 - 04:05

Игорь Цитата(nokh @ 6.12.2009 - 11:31) Зак... 7.12.2009 - 08:03

nokh Как показал анализ, необходимых и достаточных мер ... 7.12.2009 - 08:34

Игорь Цитата(nokh @ 7.12.2009 - 08:34) Все... 7.12.2009 - 08:45

nokh Цитата(Игорь @ 7.12.2009 - 10:45) Не... 7.12.2009 - 09:03

Игорь Мне очень понравились формулы nokh. Если считать п... 7.12.2009 - 18:33

Игорь Цитата(Игорь @ 7.12.2009 - 18:33) Вы... 8.12.2009 - 12:52

DrgLena Цитата(Игорь @ 7.12.2009 - 08:03) Уж... 7.12.2009 - 12:41

DrgLena Отличная работа, как говорят математики, что и сле... 7.12.2009 - 19:49

Pinus Не берусь утверждать, но может быть, когда берется... 8.12.2009 - 15:33

nokh >Игорь. Не знаю можно ли эти меры считать эквив... 8.12.2009 - 16:09

avorotniak Думаю, что одной из причин различий в формулах рас... 8.12.2009 - 19:57

DrgLena Мне удалось найти один из двух источников на котор... 8.12.2009 - 21:50

Игорь Цитата(DrgLena @ 8.12.2009 - 22:50) ... 9.12.2009 - 07:32

DrgLena Речь шла о диагностике, обязательно ли для получен... 9.12.2009 - 13:31

avorotniak [quote name='DrgLena' date='9.12.2009 ... 10.12.2009 - 02:20

Игорь Только факты. 1. Chattejee, Hadi, 1988. С. 117, ф... 10.12.2009 - 07:22

Pinus Возникла такая проблема. Простая линейная регресси... 2.02.2010 - 10:37

Игорь Цитата(Pinus @ 2.02.2010 - 11:37) Во... 2.02.2010 - 17:02

Pinus Цитата(Игорь @ 3.02.2010 - 00:02) А ... 3.02.2010 - 03:06

nokh Цитата(Pinus @ 2.02.2010 - 12:37) Во... 2.02.2010 - 18:17

Pinus Я вот вчера размышлял, по всей видимости тут в дру... 3.02.2010 - 03:11

Игорь Цитата(Pinus @ 3.02.2010 - 04:11) Ес... 3.02.2010 - 12:12

nokh Цитата(Pinus @ 3.02.2010 - 05:11) Мы... 3.02.2010 - 20:28

Pinus Цитата(nokh @ 4.02.2010 - 03:28) А з... 4.02.2010 - 01:59

Pinus Nokh, в Вашем конспекте по выбросам и влияющим наб... 4.03.2010 - 01:38

nokh В конспекте все основные ссылки были. Пока нет вре... 6.03.2010 - 19:49

2 страниц

1 2 >

« Предыдущая тема · Медицинская статистика · Следующая тема »