Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Критические значения для стандартной ошибки оценки регрессии (Std. Error of estimate)
Pinus
сообщение 30.11.2009 - 16:30
Сообщение #1





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Стандартная ошибка оценки регрессии (Std. Error of estimate) ? является показателем качества аппроксимации результатов наблюдений. Ее квадрат интерпретируется как дисперсия остатков, представляющая ошибку измерения, с которой любое измеренное значение Y предсказывается для данного значения X по известному уравнению (если уравнение регрессии оценивается из неопределенно большого числа наблюдений). При поиске лучшей модели стоит минимизировать Std. Error of estimate.
Вопрос: существуют ли какие-либо придержки удовлетворительных значений или критические точки для стандартной ошибки оценки регрессии? Как оценить полученное значение, много или мало?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Green
сообщение 30.11.2009 - 17:23
Сообщение #2





Группа: Пользователи
Сообщений: 120
Регистрация: 27.08.2009
Пользователь №: 6284



Аппроксимация результатов наблюдений может идти по разным моделям. Например: экспоненциальная, показательная, линейная.

Далее логика просит сравнить их.

По-видимому, наилучшей аппроксимацией является та, в которой минимально отклонение между моделью и реальными данными. Это в относительных значениях.

Для оценки качества модели и полноты набора объяснительных факторов обычно используют коэффициент детерминированности R^2. Его еще называют величиной достоверности аппроксимации, или уровнем надежности. Коэффициент детерминированности R^2 - это отношения дисперсии, которая поясняется регрессионным анализом, к общей дисперсии.

Он обычно исчисляется по формуле

R^2 = SSрег/(SSрег + SSост.) ,

где SSрег. = S (Y(Xi) - Yср.)^2- сумма квадратов отклонений уровней исходного ряда данных от его среднего значения;

SSост. - сумма квадратов уровней остаточной компоненты.

Коэффициент детерминации дает количественную оценку меры анализируемой связи. Он показывает часть вариации результативного признака, который находится под влиянием факторов, которые изучаются, то есть определяет, какая частица вариации признака Y учитывается в модели и обусловлена влиянием на нее независимых факторов.

Чем ближе R^2 к 1, тем в большей степени уравнения регрессии объясняет фактор, который изучается (при функциональной связи R2 равняется 1, а из-за отсутствия связи -0).

Если, например, R^2 равняется 0,9, то можно считать, что 90 % изменений (вариаций) в отклике обуславливается вариациями в учтенных факторах и лишь 10 % ? за счет влияния других факторов.


Ну вот как-то так...

=========
Std. Error of estimate - это в общем ошибка точечного оценивания параметров, а не регресии ( имхо).

Сообщение отредактировал Green - 30.11.2009 - 17:58


Signature
Это не кованализ :)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 30.11.2009 - 18:30
Сообщение #3





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Green @ 30.11.2009 - 19:23) *
...По-видимому, наилучшей аппроксимацией является та, в которой минимально отклонение между моделью и реальными данными. Это в относительных значениях...

Правильнее сказать между моделью и данными в генеральной совокупности. А т.к. они неизвестнтны - имеем главную задачу мат. статистики - охарактеризовать генеральную совокупность по выборке реальных данных. И здесь начинаются трудности. Вот что написано в: Хальд А. Математическая статистика с техническими приложениями. М.: Изд-во иностр. лит., 1956. 664 с.
"Кажется заманчивым использовать F-критерий для расположения гипотез в порядке их "доброкачественности", причём гипотеза приводящая к наименьшему значению F для отклонений от регрессии считалась бы "наилучшей". Однако это никоим образом не является правильным, т.к. значение F, соответствующее "верной" гипотезе есть случайная величина, вполне могущая принимать сравнительно большое значение при имеющихся данных".
Т.о. может быть такая ситуация, когда, например, зависимость в популяции степенная, но в выборке большую стат. значимость демонстрирует линейная. Поэтому будьте осторожны! При выборе форм зависимости опираться следует в первую очередь на теоретический анализ явления, предел мечтаний - вывести формулу из дифференциальных уравнений. К сожалению некоторые эконометристы-практики настолько заигрались с моделями, что рекомендуют прямо противоположное Хальду: сталкивался с такими высказываниями и даже экзаменационной задачей.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему