![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 ![]() |
Уважаемые коллеги. Поскольку сегодня последний день лета, хотелось бы немного встряхнуть наш форум и вывести его из "дрёмы". За одно - и попросить помощи, потому как задача вроде-бы и не суперсложная, и тема сто раз рассмотренная, а вот как-то у меня ускользает и ее решения и пазл не складывается.
Итак. Есть некоторый процесс и нам абсолютно точно известна его теоретическая модель (ну или точнее - "ожидаемая" модель, т.е. как согласно нашим предположениям должен себя вести наш процесс). Более того - известно, что эта модель линейна, т.е. y=b0+b1*x. Оба теоретических значений коэффициентов нам тоже известны. Набираем экспериментальные данные, строим модель - самым простым и очевидным способом. В виде линейной регрессии. Понимаем, что эта модель имеет право несколько отличаться от теоретической. А вот теперь вопрос: а можем-ли мы считать(при заданном уровне значимости, разумеется или еще лучше - на основе полученного p_value некоторого критерия), что наши экспериментальные данные действительно есть данные, сгенерированные нашей теоретической моделью с соответствующими шумовыми отклонениями? Как ответить на этот вопрос? Первая идея, которая пришла в голову - строить доверительные интервалы для коэффициентов регрессии и смотреть, входят ли коэффициенты теоретической модели в эти интервалы. Похоже (?) что этот подход не катит, хотя-бы потому, что точечные оценки регрессионной модели нельзя считать независимыми случайным величинами. Кроме того, если прикинуть, то получается, что построенные таким образом две прямые (теоретическая и регрессионная) даже при сколь угодно малых различиях в коэффициенте b1, рано или поздно разойдутся на плоскости сколь угодно далеко, и следовательно оценку можно проводить только при четко оговоренных ограничениях на значения х. Вторая идея - посчитать Стандартную ошибку регрессии, отложить ее параллельно регрессионной прямой и посмотреть, не пересекает-ли теоретическая прямая эти границы - но снова, внутри некоторого интервала значений оси Х. И если наши экспериментальные данные все (?) лежат внутри этого интервала - удовлетвориться. Ну а если не все? Считать это выбросом? А на каком количестве таких "выбросов" отклонить исходную гипотезу? В общем- тут много неясностей. Третья идея - строить доверительную область для регрессии (ввиду разной встречающейся терминологии - ту область, границы которой имеют форму сужающейся-расширяющейся "трубки" вокруг линии регрессии). Вот тут возможна ситуация, когда теоретическая прямая будет всегда располагаться внутри этой "трубки" (за счет указанной ее формы). Но для этого оба коэффициента (и именно их комбинация, а не по отдельности каждый) должны удовлетворять некоторым требованиям. И проверять именно этот факт, т.е. гипотезу "теоретическая прямая не пересекает границы доверительной области линии регрессии". Возможно, существуют варианты решения без построения модели регрессии, а просто по сравнению теоретической прямой и экспериментальных данных. Просто ошибку эксперимента относительно теоретической модели считать? Ну так посчитать-то можно, и она всегда будет не минимальной. А как принять решение об отклонении или принятии гипотезы? Что-то в голову не приходит, а каким критерием тут можно было бы воспользоваться? В общем, задача заключается в том, что-бы ответить не вопрос - а могли-ли (в статистическом смысле) экспериментальные данные представлять собой зашумленную реализацию теоретической модели? Буду благодарен уважаемому сообществу если вы покритикуете представленные пути решения и/или предложите другие. Сообщение отредактировал passant - 31.08.2022 - 20:44 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
Рыба утку спросила: - Вернется ль вода,
Что вчера утекла? Если да, то когда? Утка ей отвечала: - Когда нас зажарят, Разрешит все вопросы сковорода! (с) Хайям. А в эконометрике на все вопросы отвечает тщательный анализ остатков. И счастлив тот изыскатель, чья модель удовлетворяет вполне определенному набору тестов. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 ![]() |
Рыба утку спросила: - Вернется ль вода, Что вчера утекла? Если да, то когда? Утка ей отвечала: - Когда нас зажарят, Разрешит все вопросы сковорода! (с) Хайям. А в эконометрике на все вопросы отвечает тщательный анализ остатков. И счастлив тот изыскатель, чья модель удовлетворяет вполне определенному набору тестов. Так нет у меня остатков. Вернее есть остатки относительно построенной регрессионной модели. И они могут быть хороши. Т.е. удовлетворять всему набору тестов. Но вот что мне дадут остатки от теоретической модели? Ну да, они будут "больше" остатков от регрессионной, и может быть несколько хуже по всяким тестам. Как понять, что они "больше/хуже", но не на столько, что-бы отклонять гипотезу? P.S. Подумал - получается, что мне регрессионная модель в этом случае вообще не нужна? Надо подумать, как работать с остатками относительно заведомо не лучшей (с точки зрения МНК хотя бы) моделью. Спасибо за "направление" размышления. Сообщение отредактировал passant - 31.08.2022 - 23:13 |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
![]() Группа: Пользователи Сообщений: 147 Регистрация: 4.09.2012 Из: г.Дивногорск Пользователь №: 24146 ![]() |
|
|
![]() |
![]() |
![]()
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 ![]() |
Спасибо всем участников слегка оживившегося форума :-) за интересные идеи и советы.
Конечно, не нужна. .... А дальше возитесь с остатками, аки котенок с клубком. Задать критическое значение уровня значимости критерия. Попробовал. Узнал много нового :-). Ну например, сравнение модели с помощью коэффициента детерминации R2 (это конечно было известно и раньше), но вот как строить его доверительный интервал - никогда ранее не встречался. По крайней мере - нашел интересный материал, а по ходу - и методы аппроксимации и R2 и разности этого коэффициента для двух линейных регрессий. К сожалению, попытка применить приобретённые знания к моей конкретной задаче успеха не принесли. Оказалось, что данный критерий обладает очень высоким уровнем ошибок II типа. Это конечно требует дополнительных исследований, на который сейчас времени нет. Так что сейчас эта задача отложена в сторону, буду пробовать принципиально другие подходы. Вообще, применительно именно к Вашей задачи что-то мне вспомнился Байесовский подход. Я, правда, так в него и не смог въехать,.... Касательно Байесовского подхода - у меня абсолютно та-же ситуация. Несколько попыток "въехать" в него серьезным успехом не увенчались. Теперь тешусь, что я не один такой :-) В общем, еще раз спасибо всем за идеи, подсказки и участие ![]() |
|
![]() |
![]() |
![]()
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 ![]() |
|
|
![]() |
![]() |
![]() ![]() |