![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286 ![]() |
Предлагаю обсудить эффект взаимодействия переменных в регрессии. Думается, что не так здесь все просто, прежде всего в задании функции этого эффекта. Возьмем такой пример: предполагается, что на переменную Y влияют два фактора X и Z. Предполагается квадратичная зависимость Y от X и линейная от Z. Все переменные количественные и непрерывные.
Общее уравнение запишем: Y = b0 + b1*X + b2*X^2 + b3*Z + b4*Z*X. Возникает вопрос, почему мультипликативный эффект обязательно b4*Z*X? Почему он не может быть, например: b4*Z*X^2 или b4*Z*(X + X^2). Да и вообще, в принципе взаимное действие X и Z на Y здесь наверно может быть каким угодно, хоть b4*Z^3*[1-EXP(X^2)]. Если это так, то возникает вопрос: а как узнать какая функция у эффекта взаимодействия? Если, например для X и Z мы можем предполагать вид функции из теоретических соображений, предыдущих исследований или скажем по категоризованным графикам, то как быть с X*Z? Сообщение отредактировал Pinus - 26.07.2010 - 16:02 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
![]() Группа: Пользователи Сообщений: 1141 Регистрация: 10.04.2007 Пользователь №: 4040 ![]() |
... может быть каким угодно ... Не может. Вид функции должен быть установлен из математической (не статистической!) модели. Например, как решение обыкновенного дифференциального уравнения. К примеру, уравнение роста берется таким не потому, что автору хотелось бы , чтобы функция напоминала некоторый набор опытных данных, а потому, что было составлено дифференциальное уравнение роста, затем уравнение аналитически решено (с точностью до параметров). После чего на основе опытных данных вычисляются неизвестные коэффициенты модели (модель была построена с точностью до коэффициентов) - данный процесс называется идентификацией модели. Все остальные предлагаемые пути (в этой и смежной темах) к науке не имеют отношения, а напоминают шаманские танцы с бубном. Предлагаю посмотреть источники по математическому моделированию в биологии. Есть немало хороших книг. Дополнительный плюс - вам не нужно будет гадать, как интерпретировать параметры модели. Все параметры математической модели имеют вполне четкую физическую интерпретацию. Сообщение отредактировал Игорь - 26.07.2010 - 16:52 ![]() Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 244 Регистрация: 28.08.2009 Пользователь №: 6286 ![]() |
Не может. Игорь, "каким угодно" - я имел ввиду с точки зрения нашего незнания. Мы не знаем, какое оно, поэтому в данной ситуации для нас оно может быть любым. А вообще, конечно, оно будет каким-то определенным, сформированным действием биологических причин. Не оспоримо. Вопрос, как выяснить форму этой зависимости? Я смотрел литературу с обзорами функций роста. Высказываются мнения, что поскольку рост биологических организмов в естественной среде - это очень сложный и многофакторный процесс, получение функций роста путем решения дифуров часто бывает очень сложно, а иногда и невозможно. Поэтому я пока в эту область даже не рыпаюсь. Мне бы сейчас что-нибудь такое, чтобы "малой кровью"... Все параметры математической модели имеют вполне четкую физическую интерпретацию. Да, для той модели, которую я приводил в качестве примера, биологическая интерпретация параметров существует. |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Высказываются мнения, что поскольку рост биологических организмов в естественной среде - это очень сложный и многофакторный процесс, получение функций роста путем решения дифуров часто бывает очень сложно, а иногда и невозможно. Поэтому я пока в эту область даже не рыпаюсь. Мне бы сейчас что-нибудь такое, чтобы "малой кровью"... Но тогда описать рост невозможно и, соответственно, нельзя использовать нелинейную регрессию. "Малой кровью" тут не обойтись, поскольку нелинейная регрессия - это большая помойка откуда на основании знаний выуживается необходимая формула. На всякий случай скажу - строить модель путем подгонки под имеющиеся данные нельзя, ибо количество "нелинейных уравнений" по определению бесконечно и всегда найдется одно, которое прекрасно описывает эти и ТОЛЬКО ЭТИ данные. Двигаться можно только от теории к модели и затем проверять модель данными. В случае использования "нелинейного" подхода методика данные-модель-данные является порочной (это уже data mining, там другие правила и объемы данных). А вообще я думаю, что просто проблема в специфичности Вашей задачи - функции роста, если я правильно понял. Вы смотрели работу Дрейпера и Смита "Прикладной регрессионный анализ" (2007)? Там есть целый раздел по функциям роста и рекомендации по выбору параметров. Однако авторы даже не предлагают анализировать такие модели как многомерные (с вмешивающимися переменными), скорее всего ввиду их сложности. Соответственно, лучше всего и не пытаться ввести все параметры в одну модель - попробовать оценить функцию роста для каждой группы в отдельности, затем суммарно для всех групп и проанализировать различия (улучшение предсказания). Единственно, что Дрейпер и Смит отмечают, что SS не является несмещенной и F-критерием пользоваться нельзя, но двумя строчками ниже рекомендуют использовать F-критерий для приблизительной оценки. |
|
![]() |
![]() |
![]() ![]() |