![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 262 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 ![]() |
Задача в том, чтобы обучить модель линейной регрессии (см. тему соседнюю) на одних данных, а потом применить к другим, при этом не меняя коэффициентов. Извлечь коэффициенты из объекта класса "lm" легко, но как правильно передать другой модели? С некоторым удивлением не обнаружил в синтаксисе функции lm() возможности задачи пользовательских коэффициентов для каждого члена уравнения. На буржуйских формах что-то пишут о применении служебной функции offset(), но я так и не понял как ее запрограммировать в случае множественной регрессии со взаимодействиями категориальных переменных с числовыми. Поэтому возникла идея тупой "пересадки органов". Логика подсказывает, что помимо $coefficients требуется пересадить еще и $fitted.values (в моем случае все наблюдения во модели-реципиенте являются подмножеством наблюдений на которых построена модель-донор, так что можно просто выкинуть лишние значения). Если бы это было не так, можно было бы подогнать новые, применив к модели-донору функцию predict() с наблюдениями, используемыми в модели-реципиенте, в качестве аргумента newdata. Далее следует поменять остатки ($residuals). Их можно не пересаживать, а вычислить, вычтя пересаженные $fitted.values из родных для реципиента $model$имя_зависимой_переменной. Достаточно ли перечисленных операций для того, чтобы модель-реципиент стала вести себя так, будто была построена на априорно заданных коэффициентах в таких задачах как построение доверительных интервалов, вычисление F-статистики и R2? Или надо пересаживать что-то еще? Просто внутри объекта "lm", помимо вышеназванного, напихано много всякого, что недоступно моему разумению. Быть может, без редактирования чего-нибудь из этого в дополнение к проделанным трансплантациям органов, чье назначение мне ясно, организм донора будет функционировать не совcем правильно, выдавая вместо ожидаемых от него результатов погоду на Луне?
Сообщение отредактировал ИНО - 28.04.2025 - 19:05 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 262 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 ![]() |
Но постойте, predict() не принимает новые данные по зависимой переменной, а лишь предсказывает их! Это будет предсказание модели-донора. А мне требуется получить предсказание модели-реципиента после пересадки уравнения. Да, регрессионная кривая в обоих случаях будет одинаковой, но вот ошибки и, соответственно, ДИ, F-статистика, R-квадрат и т. д. - совсем разными. Вот мне нужно это все иметь, основанное на остатках модели-реципиента от уравнения модели-донора. Да, это уже будет не подгонка по методу наименьших квадратов, а сравнение наблюдений с неким априори заданным нерушимым законом, но в том и суть задачи.
К сожалению статью по ссылке не смог прочесть - Гуль-переводчик не захотел этот сайт кушать. Завтра попробую Яндекс. Но таки, Вы, вероятно, правы в том, что примочки кросс-валидаторов потенциально могут помочь в моей задаче, хотя она и немного иного рода. Вопрос только в том, реализована ли там полноценная переработка модели, чтобы ее можно было потом использовать как обычную lm, в частности, скармливать anova(), экстрагировать R2, строить ДИ и т. д. Обычно ведь при проверке на новых данных достаточно получить одно число в качестве усредненного показателя ошибки, и на том успокоиться. Еще вопрос, связанный с препарированием: как узнать внутреннее устройство функции predict() из конкретного пакета? Сообщение отредактировал ИНО - 1.05.2025 - 12:50 |
|
![]() |
![]() |
![]() ![]() |