![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 20 Регистрация: 13.03.2016 Пользователь №: 28066 ![]() |
Добрый день.
Задача заключается в поиске зависимости (по сути формулы) для оценки и прогнозирования (сколько нужно раз сделать то-то и то-то, чтобы получился такой-то результат). Я так понимаю, что можно использовать регрессионный анализ, верно? Или нужно выбирать другие методы? Спасибо. |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
<passant
есть 2 комментария:) 1) Про разные результаты с разными стартовыми значениями. Подозреваю, что здесь просто используемый пакет алгоритмически слабоват, поскольку для двухпараметрических зависимостей обычно проблем не возникает. Проблемы со стартовыми значениями бывают когда 3 или даже 4 параметра. Но посмотрим, что автор темы ответит. Кстати, интересно было бы и название этого пакета узнать. 2) Про линеаризацию зависимостей с помощью преобразований. Не знаю, специально вы упростили ответ или нет, но на всякий случай напишу, что результаты расчёта параметров (а) итерационно и (б) через линеаризацию с последующей ретрансформацией в исходную шкалу будут немного отличаться. Дело в том, что при итерационной подгонке экспоненциальной зависимости методом наименьших квадратов нормально распределена будет ошибка исходных данных. В случае линеаризации логарифмированием нормально будет распределена ошибка логарифмов исходных данных. В итоге, при ретрансформации параметров их значения будут несколько иными. До эпохи компьютеров линеаризировали всё что можно было и радовались простоте не задумываясь. Но с появлением компов более грамотной и точной стала считаться именно итерационная подгонка. Поэтому сейчас так же радостно фитят нелинейные модели и радуются не задумываясь. Но дело в том, что в некоторых случаях просто нелогично предполагать нормальность ошибки для исходных данных. В частности это относится и к экспоненциальному, и к степенному росту. Например, если клеточная культура растёт по экспоненте - откуда взяться нормальной ошибке? Она будет распределена асимметрично, а вот её логарифм - куда скорее симметрично. Когда данных много в этом можно убедиться построив распределения на отдельных срезах регрессии. Получается, что дедовский способ с линеаризующим преобразованием и ретрансформацией чисто теоретически здесь подходит лучше современного итерационного подхода. К сожалению, не встречал нигде рекомендаций как выбирать между (а) и (б). Если вы или другие частники форума встречали обсуждение обозначенной проблемы - буду признателен за ссылку. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 20 Регистрация: 13.03.2016 Пользователь №: 28066 ![]() |
<passant есть 2 комментария:) 1) Про разные результаты с разными стартовыми значениями. Подозреваю, что здесь просто используемый пакет алгоритмически слабоват, поскольку для двухпараметрических зависимостей обычно проблем не возникает. Проблемы со стартовыми значениями бывают когда 3 или даже 4 параметра. Но посмотрим, что автор темы ответит. Кстати, интересно было бы и название этого пакета узнать. 2) Про линеаризацию зависимостей с помощью преобразований. Не знаю, специально вы упростили ответ или нет, но на всякий случай напишу, что результаты расчёта параметров (а) итерационно и (б) через линеаризацию с последующей ретрансформацией в исходную шкалу будут немного отличаться. Дело в том, что при итерационной подгонке экспоненциальной зависимости методом наименьших квадратов нормально распределена будет ошибка исходных данных. В случае линеаризации логарифмированием нормально будет распределена ошибка логарифмов исходных данных. В итоге, при ретрансформации параметров их значения будут несколько иными. До эпохи компьютеров линеаризировали всё что можно было и радовались простоте не задумываясь. Но с появлением компов более грамотной и точной стала считаться именно итерационная подгонка. Поэтому сейчас так же радостно фитят нелинейные модели и радуются не задумываясь. Но дело в том, что в некоторых случаях просто нелогично предполагать нормальность ошибки для исходных данных. В частности это относится и к экспоненциальному, и к степенному росту. Например, если клеточная культура растёт по экспоненте - откуда взяться нормальной ошибке? Она будет распределена асимметрично, а вот её логарифм - куда скорее симметрично. Когда данных много в этом можно убедиться построив распределения на отдельных срезах регрессии. Получается, что дедовский способ с линеаризующим преобразованием и ретрансформацией чисто теоретически здесь подходит лучше современного итерационного подхода. К сожалению, не встречал нигде рекомендаций как выбирать между (а) и (б). Если вы или другие частники форума встречали обсуждение обозначенной проблемы - буду признателен за ссылку. nokh, спасибо за вдумчивый ответ, использую spss. Про выбор в пользу линеаризации читала здесь: http://lib.qrz.ru/book/export/html/11304 Цитата Возможность перевода в линейную модель нужно использовать всегда, так как в этом случае параметры регресии вычисляются непосредственно, а не определяются с помощью итераций.
Сообщение отредактировал anna78 - 27.04.2017 - 10:08 |
|
![]() |
![]() |
![]() ![]() |