Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

7 страниц V  « < 3 4 5 6 7 >  
Добавить ответ в эту темуОткрыть тему
> Нелинейная регрессия
DrgLena
сообщение 3.12.2010 - 17:49
Сообщение #61





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(Pinus @ 3.12.2010 - 14:31) *
Statistica 6 в модуле Nonlinear Estimation в разделе User-specified regression, least squares выдает некую Proportion of variance accounted for, а R^2 нет.

Это и есть коэффициент детерминации. И если параметры модели в ручном и машинном расчете совпадают, то и R^2 должно совпасть.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 4.12.2010 - 02:28
Сообщение #62





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(DrgLena @ 4.12.2010 - 01:49) *
Это и есть коэффициент детерминации. И если параметры модели в ручном и машинном расчете совпадают, то и R^2 должно совпасть.

Нелинейное оценивание - это итерационные процедуры, в ручную посчитать коэффициенты не получится.
Думал, что может это скорректированный коэффициент детерминации - тоже не сходится.
DrgLena, если есть у Вас время, посчитайте, какой R-квадрат выдает Statistica (девятка) методом Маркуардта вот по этим, например, данным.
Уравнение Y=exp(b0-(b1/X)).

Сообщение отредактировал Pinus - 4.12.2010 - 02:30
Прикрепленные файлы
Прикрепленный файл  Пример.rar ( 6,93 килобайт ) Кол-во скачиваний: 357
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 4.12.2010 - 02:50
Сообщение #63





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(Игорь @ 3.12.2010 - 23:57) *
Стандартная ошибка регрессии (регрессионной модели) считается одинаково для любых моделей.

Спасибо, Игорь!
Ее то в любом случае в Excel считать придется. Statistica при нелинейном оценивании не выдает. Но не проблема.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 4.12.2010 - 17:54
Сообщение #64





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 3.12.2010 - 11:19) *
И мне так показалось.

Вне зависимости от модели всегда можно оценить полную дисперсию (SST), долю дисперсии приходящуюся на остатки (SSE), и долю дисперсии относительно регрессионной модели (SSR=SST-SSE). Отношение SSR/SST - объясненная доля дисперсии в регрессионной модели. Эта доля эквивалентна R-квадрат. Даже если распределение зависимой переменной не является нормальным, это отношение помогает оценить насколько хорошо подобранная модель согласуется с исходными данными.


И как у Вас получится сумма квадратов (SST) при оценке методом максимального правдоподобия? (итерационном, на нелинейной модели). Если нет аналитического решения (OLS), то и все оценки приблизительные, разные методы дают разные результаты.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 4.12.2010 - 18:58
Сообщение #65





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



В данном примере коэффициенты МНК совпадают с полученными квази-ньютоновским (могу привести, но таблицы не удобно приводить), а значит совпадет и сумма квадратов отклонения от регрессии. Если выставить Loss: (OBS-PRED)**2 , то сразу ее и получите 658,6613. Другие методы оценки (1,5,7 в списке выбора) сочетают квази-ньютоновский с другими и дают для этого примера те же коэффициенты, в основе методов ? приближенное вычисление второй производной функции потерь), другие методы дадут незначительные различия, но в третьем знаке после запятой, что приведет к некоторому повышению выбранной функции потерь в четвертом знаке после запятой. Поэтому квази-ньютон более предпочтителен для данной модели.

Коэффициент детерминации по программе Statistica 85,84% (в том числе и по Маркуардту), ручной расчет основан на предыдущем моем сообщении с которым плав, очевидно не согласен:
R^2=1-658,6613/4651,915=0,858411

Ничто не мешает посчитать SST (4651,915), для этого вообще модель не нужна, а только среднее значение Y. И посчитанная сумма квадратов отклонений от своего собственного среднего естественно совпадает с SST, которая выдается при создании линейной модели.

У Афифи (стр. 210)сказано, что мерой качества подгонки нелинейных моделей является сумма квадратов отклонений от регрессии S (что и выводит программа), а величину s^2=S/n-m иногда называют среднеквадратической ошибкой.
s^2=658,6613/58
Я думаю, что ничего больше и не нужно считать. Но картинку можно нарисовать, и еще показать, что коэффициент детерминации линейной модели ниже.

Могу ошибаться, поскольку чувствую, что нахожусь под влиянием линейных моделей и программы Statistica.

Интересно, а каков коэффициент детерминации для этого примера в других программах?

Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 4.12.2010 - 20:40
Сообщение #66





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(Pinus @ 4.12.2010 - 03:28) *
Уравнение Y=exp(b0-(b1/X)).

Цитата(DrgLena @ 4.12.2010 - 19:58) *
Интересно, а каков коэффициент детерминации для этого примера в других программах?

Такой же. Прилагаю результаты, полученные для данных и уравнения Pinus методом "Пользовательская функция" модуля "Аппроксимация зависимостей и регрессионный анализ" программы AtteStat. Теория и подробный пример использования метода имеются в Справочной системе модуля. В примере не показано - начальные значения коэффициентов модели взяты нулевыми.

Если минимизируемый функционал тот же самый (в данном случае МНК), то любой метод оптимизации (если он сойдется) даст аналогичный результат.

Сообщение отредактировал Игорь - 4.12.2010 - 21:05
Прикрепленные файлы
Прикрепленный файл  APX.zip ( 59,57 килобайт ) Кол-во скачиваний: 320
 


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 4.12.2010 - 22:12
Сообщение #67





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Нужно сохранить AtteStat для широкой виндовской общественности smile.gif , многие будут скучать, если винд уже куплен.
Картинки прилагаются для pinus, но есть уже и 10 версия, может ошибку выдадут, Attestat в примере справки ее выдает, а для обсуждаемого примера нет?
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 5.12.2010 - 08:31
Сообщение #68





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Авторы книги (Ферстер, Ренц) приводят две формулы для R-квадрат: формула (3.6) на с. 102 и формула (3.11) на с. 104 (см. вырезку из книги). Если в формулу (3.11) подставить выражение (3.10), то получится формула, которую привела DrgLena: R^2=1-(SSE/SST). Эти же формулы авторы приводят для нелинейных регрессий (и корреляций) на с. 155-156.
Так вот, если считать R-квадрат для предложенного примера при линейной форме модели Y=b0+b1*X по формуле (3.6) и по формуле (3.11)+(3.10), то результаты совпадают:
(3.6) R^2=3928,13765/4651,915254=0,844413
(3.11)+(3.10) R^2=1-(723,77645/4651,915254)=0,844413
(то же и в Statistica 6).
Если же считать (на том же листе с формулами в Excel) для нелинейной модели Y=exp(b0-(b1/X)), то
(3.6) R^2=3938,325052/4651,915254=0,846603
(3.11)+(3.10) R^2=1-(658,66134/4651,915254)=0,858411.
Statistica 6 здесь выдает 0,858411.
С формулой (3.6) для нелинейных моделей что ли какая-то заковыка? Только в чем она, никак не пойму.

Прикрепленные файлы
Прикрепленный файл  Ферстер__вырезка_.rar ( 1,81 мегабайт ) Кол-во скачиваний: 364
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 5.12.2010 - 13:33
Сообщение #69





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



В том, что 3938,337+658,66=4596,997 , а не равно 4651,915
Читаем плава или плаваем дальше?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 5.12.2010 - 16:32
Сообщение #70





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(DrgLena @ 5.12.2010 - 21:33) *
В том, что 3938,337+658,66=4596,997 , а не равно 4651,915
Читаем плава или плаваем дальше?

А Вы не спешите с выводами. Посчитайте в Excel в выражении SST=SSR+SSE каждое слагаемое отдельно (через наблюдаемые и предсказанные значения Y) и увидите, что для рассматриваемой и подобных ей моделей SSR=CУММ[Y(pred)-Y(mean)]^2 не равно SSR=SST-SSE. Почему, я не знаю.

Сообщение отредактировал Pinus - 9.12.2010 - 15:26
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 5.12.2010 - 16:41
Сообщение #71





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Исправлена неточность в AtteStat - неверно брались t-статистики для коэффициентов (сейчас совпадает с примером из другой программы). Также добавлен вывод некоторых параметров расчета.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 5.12.2010 - 16:49
Сообщение #72





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



pinus, Вы просили меня посчитать в статистике коэфициент детерминации, я посчитала и выложила результат и очень обрадовалась, что и Attestat дал тот же коэффициент и благодаря этому AtteStat скорректировал неточности. А в ответ - я резкая дама. При этом потратила день для того чтобы сумма долей дисперсии дали SST. Я считала их не в экселе, а в статистике, которая сохраняет предсказанные значения и остатки в виде переменных в том же файле, и получила те же доли,которые вы привели, значит две программы суммируют с складывают верно. Какой же вывод?

Сообщение отредактировал DrgLena - 5.12.2010 - 16:52
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 5.12.2010 - 17:25
Сообщение #73





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Цитата(DrgLena @ 6.12.2010 - 00:49) *
... и получила те же доли, которые вы привели, ...

SSR не совпадает. У Вас она 3993,2537 (SST минус SSE), а если считать как сумму квадратов отклонений предсказанных значений от среднего (как следует из определения SSR), то будет 3938,3251. Вот и выходит, что значение R-квадрат будет отличаться.
DrgLena, я Вам очень благодарен за помощь, но все ж таки для нелинейных моделей есть какая-то проблема с SSR, что я и предлагаю выяснить (если конечно Вам и другим участникам дискуссии это интересно).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Pinus
сообщение 5.12.2010 - 18:13
Сообщение #74





Группа: Пользователи
Сообщений: 244
Регистрация: 28.08.2009
Пользователь №: 6286



Еще раз посмотрел ссылку, которую привел Плав.
Следует, что не во всех случаях SST=SSR+SSE (для меня это новость). Значит выходит, что не всегда R^2=1-(SSE/SST)=SSR/SST. Вот в чем причина. Поэтому формула (3.6) у Ферстера, Ренца для нелинейных регрессий и не работает (хотя они ее предлагают).
Так что выходит, что Плав был прав.

Сообщение отредактировал Pinus - 5.12.2010 - 18:14
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 5.12.2010 - 18:26
Сообщение #75





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Так и я вам именно это пытаюсь объяснить, поскольку, 3938,337 - это моя расчетная по регрессии SSR.

Сообщение отредактировал DrgLena - 5.12.2010 - 18:29
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

7 страниц V  « < 3 4 5 6 7 >
Добавить ответ в эту темуОткрыть тему