![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286 ![]() |
А что там их разбирать-то? В принципе Фиктивные переменные - несложная тема, в целом все понятно. Но вот какие у меня, например, возникли вопросы и мысли. В сети нашел следующее представление уравнения с фиктивными переменными (вариант влияния одной фиктивной переменной (Z) на свободный член и коэффициент регрессии): y = b0 + b1X + δZ + λZX или y = (b0 + δZ) + (b1 + λZ)X. Т.е. при Z = 0, y = b0 + b1X, а при Z = 1, b0 изменяется на величину δ, а b1 - на величину λ. В таком представлении переменная Z выступает в роли простого "переключателя" с одной регрессии на другую (имеются ввиду регрессии подсовокупностей). Тогда возникает резонный вопрос: имеет ли значение корреляция Z и X (угроза мультиколлинеарности)? Ведь вектор Z не содержит в себе никакой прямой информации о качественном признаке (нет наблюдений этой качественной переменной, нет дисперсии и ничего другого кроме нулей и единиц). Значит и нет коллинеарности между столбцами в матрице регрессоров (если фиктивные переменные выбраны правильно и нет возможности появления "ловушки"). Может быть тогда можно включать в уравнение переменную Z как манекен переменной, которая реально находится в тесной корреляционной связи с регрессором? Сообщение отредактировал Pinus - 1.03.2010 - 14:44 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
![]() Группа: Пользователи Сообщений: 1141 Регистрация: 10.04.2007 Пользователь №: 4040 ![]() |
... в целом все понятно ... В сети нашел следующее представление уравнения с фиктивными переменными (вариант влияния одной фиктивной переменной (Z) на свободный член и коэффициент регрессии): y = b0 + b1X + δZ + λZX или y = (b0 + δZ) + (b1 + λZ)X. Тут нелинейное уравнение, очевидно? Сообщение отредактировал Игорь - 2.03.2010 - 06:34 ![]() Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286 ![]() |
Тут нелинейное уравнение, очевидно? Почему нелинейное? Линейное. y = b0 + b1X + δZ + λZX рассматривается как линейная множественная регрессия с предикторами X, Z и ZX. Z - бинарная фиктивная переменная, принимающая значения 0 и 1. При Z = 0, y = b0 + b1X. При Z = 1, y = (b0 + δ) + (b1 + λ)X, где δ и λ - изменения коэффициентов b0 и b1 при воздействии некоего качественного признака, который представлен фиктивной переменной Z. Т.е. происходит скачкообразное переключение с одной регрессии на другую. Значимость δ или λ говорит о значимости влияния Z соответственно на свободный член или на коэффициент регрессии. Вообще этот метод является хорошей альтернативой ANCOVA для второго типа задач (выявление различий между регрессиями и значимости влияния качественного(ых) признака(ов)). Если не ошибаюсь, то это тот самый stratified method, о котором так загадочно писала DrgLena, когда обсуждали ковариационный анализ. Сообщение отредактировал Pinus - 2.03.2010 - 10:32 |
|
![]() |
![]() |
![]() ![]() |