Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Условие независимости остатков, при сравнении регрессий
Pinus
сообщение 17.12.2010 - 07:25
Сообщение #1





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



В регрессионном анализе одной из предпосылок, выполнение которой следует проверять, является условие независимости остатков. Читал у Айвазяна, что на практике, если измерения проводятся на различных объектах, можно считать остатки некоррелированными, т.к. случайная составляющая, имеющая отношение к одному объекту, не может быть связана со случайной составляющей другого объекта.
Если рассмотреть, например такой случай: проводятся морфометрические исследования парных органов некоего организма (почки, легкие, уши, глаза и т.п.). Есть предположение, что например правый орган у данного организма меньше, чем левый. Как это доказать или опровергнуть статистически? Поскольку размеры органов зависят от возраста, то, при прочих равных условиях, имеем задачу сравнения двух регрессий. Понятно, что в пределах каждой регрессии (имеющей отношение или к правому, или к левому органу) остатки будут независимы, поскольку исследуются разные организмы. А вот как учесть (и нужно ли вообще это делать) возможные корреляционные связи между обоими органами (такие связи вполне могут быть, поскольку парные органы относятся к одному организму).
Возможно ли решение такой задачи с использованием тех же фиктивных переменных, ведь в этом случае обе регрессии объединяются в один регрессионный комплекс? Как будет вести себя F-критерий в пределах омнибусного теста? Как работает ковариационный анализ (если полагать, что рост органов линеен)?
Как вообще решаются подобные задачи (ведь они обязательно должны были решаться и в медицине, и в биологии)? Не встречал ли кто примеров в книгах?

Сообщение отредактировал Pinus - 17.12.2010 - 07:28
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Игорь
сообщение 20.12.2010 - 10:25
Сообщение #2





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Еще статистику Дарбина-Уотсона посмотрите.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 20.12.2010 - 12:29
Сообщение #3





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(Игорь @ 20.12.2010 - 17:25) *
Еще статистику Дарбина-Уотсона посмотрите.

Игорь, мы с Вами как-то ее обсуждали, но, признаться, глубоко я так в нее и не пошел. Насколько помню, критерий Дарбина-Уотсона можно применять только для временных рядов или когда в регрессии имеется строгая упорядоченность наблюдений. Или там вскрылись еще какие-то особенности?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.12.2010 - 15:49
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Pinus @ 20.12.2010 - 13:29) *
Игорь, мы с Вами как-то ее обсуждали, но, признаться, глубоко я так в нее и не пошел. Насколько помню, критерий Дарбина-Уотсона можно применять только для временных рядов или когда в регрессии имеется строгая упорядоченность наблюдений. Или там вскрылись еще какие-то особенности?


Pinus, позвольте и мне присоединиться к разговору.

При использовании статистики Durbin-Watson необходимо помнить, что:

1. Она не является статистическим тестом в общепринятом понимании, поскольку существуют ситуации, когда по значению теста нельзя сделать никаких статистических выводов (зоны неопределенности).
2. Служит только для определения автокорреляции первого прядка.
3. Регрессия обязательно должна содержать константу.
4. В регресии не должны присутствовать лагированные значения объясняемой переменной (отклик нельзя употреблять в качестве регрессора).

Все процитированные опасения из Вашего поста не имеют под собой никаких оснований.


Но, воообще-то, при наличии теста множителей Лагранжа (LM - Lagrange Multiplier test), который применительно к остаткам называется тестом Бройша-Годфри (Breusch-Godfrey test, 1978), статистика Дарбина-Уотсона - это даже не вчерашний день, это - 1951 год.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 21.12.2010 - 16:04
Сообщение #5





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(100$ @ 21.12.2010 - 22:49) *
Все процитированные опасения из Вашего поста не имеют под собой никаких оснований.

Мои основные опасения возникли, когда я всмотрелся в формулу статистики Дарбина-Уотсона, где в числителе стоит сумма квадратов разностей остатков в последовательности i = 2...n. Таким образом, если для обычной регрессии менять последовательность наблюдений в выборке, то получаются различные значения статистики. Как быть?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.12.2010 - 18:56
Сообщение #6





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Pinus @ 21.12.2010 - 17:04) *
Мои основные опасения возникли, когда я всмотрелся в формулу статистики Дарбина-Уотсона, где в числителе стоит сумма квадратов разностей остатков в последовательности i = 2...n. Таким образом, если для обычной регрессии менять последовательность наблюдений в выборке, то получаются различные значения статистики. Как быть?


Если Вы в последовательности откликов измените порядок их следования, то тогда аналогичные перестановки надо делать и в наборе регрессоров, иначе у Вас получится просто куча различных регрессий с разными коэффициентами, стд. ошибками, остаточной суммой квадратов RSS и, соответственно, с разными значениями статистики Дарбина-Уотсона.

Что касается ответа на вопрос "Как быть?", являющегося вариацией на вечно юную тему "Что делать?" и "Кто виноват?", то надо все-таки ориентироваться на численное значение статистики (оно для парной линейной регрессии в идеале должно находиться в районе 2), или при большем количестве объясняющих переменных чаще заглядывать в таблицы критических значений (первая ссылка в посте Игоря). Статистика DW табулируется в интервальном виде, так что даже при различных численных её значениях окончательные выводы могут остаться неизменными.

Сообщение отредактировал 100$ - 21.12.2010 - 18:58
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 22.12.2010 - 06:30
Сообщение #7





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(100$ @ 22.12.2010 - 01:56) *
Если Вы в последовательности откликов измените порядок их следования, то тогда аналогичные перестановки надо делать и в наборе регрессоров, иначе у Вас получится просто куча различных регрессий с разными коэффициентами, стд. ошибками, остаточной суммой квадратов RSS и, соответственно, с разными значениями статистики Дарбина-Уотсона.

Конечно, если менять последовательность откликов, то вместе с регрессорами. А проще сказать изменить последовательность остатков. При различной последовательности остатков все параметры регрессии остаются одними и теми же, а вот статистика Дарбина-Уотсона меняется.

Цитата(100$ @ 22.12.2010 - 01:56) *
Статистика DW табулируется в интервальном виде, так что даже при различных численных её значениях окончательные выводы могут остаться неизменными.

Так вот в том-то и вопрос, что неопределенность: могут остаться, а могут и не остаться. Где-нибудь можно прочитать, что при перестановке выводы в любом случае остаются неизменными?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 22.12.2010 - 10:51
Сообщение #8





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Pinus @ 22.12.2010 - 07:30) *
Так вот в том-то и вопрос, что неопределенность: могут остаться, а могут и не остаться. Где-нибудь можно прочитать, что при перестановке выводы в любом случае остаются неизменными?


При наличии константы в уравнении регрессии остатки имеют нулевое среднее, а метод наименьших квадратов, которым Вы скорее всего будете ее оценивать, минимизирует остаточную дисперсию, делая ряд остатков очень похожим на стационарный (т.е. белый шум).

При этом любая перестановка - это не просто иная последовательность регрессионных остаков, это - иная ситуация, для которой выбранная модель (т.е. вид регрессии) может оказаться неадекватным (ошибка спецификации модели). Тогда остатки перестанут проходить тесты на адекватность.

Кроме того, если уж сторить регрессию, то с мыслью о будущем: на основе имеющихся данных построить прогноз. А это- временная категория.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 22.12.2010 - 11:39
Сообщение #9





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(100$ @ 22.12.2010 - 17:51) *
При этом любая перестановка - это не просто иная последовательность регрессионных остаков, это - иная ситуация, для которой выбранная модель (т.е. вид регрессии) может оказаться неадекватным (ошибка спецификации модели). Тогда остатки перестанут проходить тесты на адекватность.

Если найдено уравнение регрессии, и если коэффициенты уравнения от перестановки порядка наблюдений не меняются, то как может меняться степень адекватности?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 22.12.2010 - 13:51
Сообщение #10





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Pinus @ 22.12.2010 - 12:39) *
Если найдено уравнение регрессии, и если коэффициенты уравнения от перестановки порядка наблюдений не меняются, то как может меняться степень адекватности?


Согласен, можно выразиться точнее: отправной точкой проверки адекватности модели является диагностика остатков. Тест Дарбина-Уотсона проверяет наличие автокорреляции остатков, а автокорреляция есть функция от времени. Поэтому любое изменение очередности следования остатков, связаное с перестановками в исходных данных, вызовет изменение статистики DW. Просто я хотел сказать, что тут возникает парадокс: с помощью перестановок в исходных данных мы можем искусственно внести в них автокорреляцию, которую и зафиксирует DW. Другое дело, насколько устойчивыми будут полученные статистические выводы.

Сообщение отредактировал 100$ - 22.12.2010 - 14:25
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 22.12.2010 - 15:18
Сообщение #11





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(100$ @ 22.12.2010 - 20:51) *
Просто я хотел сказать, что тут возникает парадокс: с помощью перестановок в исходных данных мы можем искусственно внести в них автокорреляцию, которую и зафиксирует DW.

Судя по всему, так оно и есть. Поэтому формула и предполагает наличие некой упорядоченности наблюдений, и поэтому применение DW для обычной регрессии остается под большим вопросом. Даже если с точки зрения проведения эксперимента посмотреть: мы можем получать значения отклика при постепенном увеличении значений регрессора, при уменьшении или в разнобой - регрессия получится в любом случае одна и та же, а значения DW разными.
Была такая мысль, что для обычной регрессии с помощью DW можно посмотреть, например, не создает ли автокорреляцию изменение регрессора, т.е. можно отсортировать наблюдения в порядке возрастания регрессора и посмотреть нет ли каких-нибудь серий, но как тогда быть с повторяющимися наблюдениями (несколько значений отклика для одинакового значения регрессора)? Наверно еще можно использовать DW для проверки того, не создает ли автокорреляцию порядок проведения эксперимента (тогда используется соответствующая сортировка).

Сообщение отредактировал Pinus - 22.12.2010 - 15:33
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 23.12.2010 - 14:55
Сообщение #12





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Во всех рассуждениях выше есть одна проблема - предполагается, что наблюдения можно переставить. Однако это не так. Порядок остатков зависит от "независимой" переменной, которой в эконометрических исследованиях обычно является время. Поэтому и пишут остаток во время t минус остаток во время t-1. Но это просто дань методике. Если Вы предсказываете охват от роста, то рост, как независимая переменная определяет порядок остатков и переставить их не получится. Некая уопрядоченность в тесте DW обязательная и определяется она независимой (незаивисмыми) переменной (-ными)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 24.12.2010 - 02:55
Сообщение #13





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(плав @ 23.12.2010 - 21:55) *
Во всех рассуждениях выше есть одна проблема - предполагается, что наблюдения можно переставить. Однако это не так. Порядок остатков зависит от "независимой" переменной, которой в эконометрических исследованиях обычно является время. Поэтому и пишут остаток во время t минус остаток во время t-1. Но это просто дань методике. Если Вы предсказываете охват от роста, то рост, как независимая переменная определяет порядок остатков и переставить их не получится. Некая уопрядоченность в тесте DW обязательная и определяется она независимой (независимыми) переменной (-ными)

Там, где присутствует время, там, видимо, заканчивается обычная регрессия. Процесс роста, как биологический процесс, строго говоря, это временной ряд со всеми вытекающими последствиями. Но можно просто, исследовать, например, возрастную динамику средних размеров органа не на одном, а на многих особях, и тогда в регрессии будет не время (роста), а возраст разных организмов. Конечно, можно и здесь расположить наблюдения с увеличением возраста, но как быть, если имеется несколько наблюдений для одного значения возраста (что для временного ряда невозможно)? Как их расположить? А если независимых переменных несколько, и расположение значений одного регрессора по возрастанию далеко не всегда будет соответствовать возрастанию значений другого регрессора?
Если же отойти от изучения роста, а посмотреть на обычную регрессию вообще. В программах (SPSS, Statistica) в модуле обычной линейной регрессии предлагается статистика DW. В книгах тоже. И народ (особливо из гвардии аспирантов, а встречаются и методички преподавателей), по всей видимости, поступает как в песне: "нажми на кнопку - получишь результат, и твоя мечта осуществится!". А в действительности получается "...ну что же ты не рад?" - результат не верный.
Вот, передо мной книга Вуколова Э.А. "Основы статистического анализа. Практикум ... с использованием пакетов Statistica и Excel", рекомендованная УМО вузов РФ в качестве учебного пособия, где в главе 6 "Регрессионный анализ" (Анализ временных рядов - отдельная глава) предлагается для анализа корреляции остатков (стр. 172) использовать статистику DW. В примере расчета исходные данные по возрастанию независимой переменной не расположены (стр. 176), а расчет статистики ведется в соответствии с порядком исходных данных (стр. 188).
В учебном пособии Халафяна А.А. "Statistica 6. Статистический анализ данных", допущенного Минобрнауки для студентов вузов по спец. "Статистика", приводится пример линейного регрессионного анализа (изучается зависимость объема продаж от розничной цены, расходов на рекламу и количества работ). Значения регрессоров в порядке возрастания не расположены (стр. 156), однако предлагается: "...нажмите на кнопку Durbin-Watson statistic..." (стр. 161).

Сообщение отредактировал Pinus - 24.12.2010 - 04:50
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Pinus   Условие независимости остатков   17.12.2010 - 07:25
- - nokh   Я бы решал такую задачу вообще без регрессии. Поск...   18.12.2010 - 23:44
|- - Pinus   Цитата(nokh @ 19.12.2010 - 07:44) Я ...   19.12.2010 - 00:32
- - nokh   Тогда пример неудачен: мои парные органы (почки, л...   19.12.2010 - 00:45
- - DrgLena   Я вообще не поняла, приведена цитата из Айвазяна ...   19.12.2010 - 01:06
- - Игорь   При расчете регрессии в AtteStat (модуль "Апп...   19.12.2010 - 14:40
- - Pinus   Цитата(nokh @ 19.12.2010 - 08:45) То...   19.12.2010 - 15:07
- - DrgLena   Айвазян дает в рамках КЛММР простейшую версию треб...   19.12.2010 - 20:39
|- - плав   Вообще-то следует говорить не о коррелированности ...   19.12.2010 - 22:38
||- - Pinus   Цитата(плав @ 20.12.2010 - 05:38) Во...   20.12.2010 - 09:54
|- - Pinus   Цитата(DrgLena @ 20.12.2010 - 03:39)...   20.12.2010 - 09:15
- - Игорь   Еще статистику Дарбина-Уотсона посмотрите.   20.12.2010 - 10:25
|- - Pinus   Цитата(Игорь @ 20.12.2010 - 17:25) Е...   20.12.2010 - 12:29
|- - Игорь   Цитата(Pinus @ 20.12.2010 - 12:29) И...   20.12.2010 - 13:35
|- - 100$   Цитата(Pinus @ 20.12.2010 - 13:29) И...   21.12.2010 - 15:49
|- - Pinus   Цитата(100$ @ 21.12.2010 - 22:4...   21.12.2010 - 16:04
|- - 100$   Цитата(Pinus @ 21.12.2010 - 17:04) М...   21.12.2010 - 18:56
|- - Pinus   Цитата(100$ @ 22.12.2010 - 01:5...   22.12.2010 - 06:30
|- - Игорь   Цитата(Pinus @ 22.12.2010 - 06:30) Т...   22.12.2010 - 07:50
|- - 100$   Цитата(Pinus @ 22.12.2010 - 07:30) Т...   22.12.2010 - 10:51
|- - Pinus   Цитата(100$ @ 22.12.2010 - 17:5...   22.12.2010 - 11:39
|- - 100$   Цитата(Pinus @ 22.12.2010 - 12:39) Е...   22.12.2010 - 13:51
|- - Pinus   Цитата(100$ @ 22.12.2010 - 20:5...   22.12.2010 - 15:18
|- - 100$   Цитата(Pinus @ 22.12.2010 - 16:18) ....   22.12.2010 - 16:27
||- - Pinus   Цитата(100$ @ 22.12.2010 - 23:2...   23.12.2010 - 00:52
|- - плав   Во всех рассуждениях выше есть одна проблема - пре...   23.12.2010 - 14:55
|- - 100$   Цитата(плав @ 23.12.2010 - 15:55) Во...   23.12.2010 - 20:31
||- - плав   Цитата(100$ @ 23.12.2010 - 20:3...   24.12.2010 - 21:25
||- - 100$   Цитата(плав @ 24.12.2010 - 22:25) ни...   24.12.2010 - 23:25
||- - Pinus   Цитата(100$ @ 25.12.2010 - 06:2...   25.12.2010 - 01:58
|||- - 100$   Цитата(Pinus @ 25.12.2010 - 02:58) К...   25.12.2010 - 22:37
||- - плав   Цитата(100$ @ 24.12.2010 - 23:2...   25.12.2010 - 13:00
|- - Pinus   Цитата(плав @ 23.12.2010 - 21:55) Во...   24.12.2010 - 02:55
|- - Pinus   Цитата(100$ @ 24.12.2010 - 03:3...   24.12.2010 - 03:02
|- - 100$   Цитата(Pinus @ 24.12.2010 - 03:55) Т...   24.12.2010 - 11:21
- - Pinus   Спасибо, гляну.   20.12.2010 - 14:37
- - DrgLena   Наблюдая столь острую дискуссию, переходящую на ли...   26.12.2010 - 23:01
- - Игорь   А было бы интересно посмотреть, как именно меняетс...   27.12.2010 - 08:28
|- - плав   Цитата(Игорь @ 27.12.2010 - 08:28) А...   28.12.2010 - 18:07
- - DrgLena   Одно число посчитано не верно, я его зачеркнула, д...   27.12.2010 - 13:15
- - 100$   Уважаемым собеседникам, привыкшим обсуждать письмо...   27.12.2010 - 18:28
- - DrgLena   100$, Вы как раз и обсуждаете почтальонов ( ...   27.12.2010 - 19:04
- - DrgLena   Цитата(100$ @ 27.12.2010 - 19:2...   27.12.2010 - 19:08
- - alexeysmirnov20@mail.ru   Об этом можно почитать в статье СМЕШАННАЯ РЕГРЕССИ...   28.06.2015 - 17:38


Добавить ответ в эту темуОткрыть тему