Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Гомоскедастичность остатков в линейных смешанных моделях

Автор: Anna_V 18.08.2021 - 13:01

Добрый день. Если я не ошибаюсь, корректное применение линейных смешанных моделей требует гомоскедастичности остатков. Вопрос: как её проверить (кроме визуального анализа)? Где-то читала, не могу найти, что критерий Ливиня не рекомендуют применять из-за его излишней консервативности в данном случае. В Prism гомоскедастичность остатков предлагается проверять расчетом корреляции Спирмена между предсказанными значениями и абсолютными значениями остатков, на сколько оправдан такой подход?

Автор: passant 18.08.2021 - 21:19

Цитата(Anna_V @ 18.08.2021 - 13:01) *
Добрый день. Если я не ошибаюсь, корректное применение линейных смешанных моделей требует гомоскедастичности остатков. Вопрос: как её проверить (кроме визуального анализа)? Где-то читала, не могу найти, что критерий Ливиня не рекомендуют применять из-за его излишней консервативности в данном случае. В Prism гомоскедастичность остатков предлагается проверять расчетом корреляции Спирмена между предсказанными значениями и абсолютными значениями остатков, на сколько оправдан такой подход?

Методы проверки гомоскедастичности остатков:
- Коэффициент ранговой кореляции Спирмана.
- Тест Голдфелда-Квандта. (На основе критерия Фишера)
- Тест Уайта - построение регрессионной модели зависимости квадратов ошибок от Х.
- Тест Глейзера.
- Тест Бройша — Пагана (Тоже, по сути, на основе критерия Фишера)

Смотрите, изучайте что вам больше подходит, применяйте.

Автор: salm 26.06.2022 - 23:31

А подскажите пожалуйста: возможно ли игнорируя допущения для модели линейной регрессии (с несколькими факторами), не используя коэффициентов и само уравнение, а сказать следующее: для такого то параметра... (количественного) независимым предиктром было то то...(значимое р для коэффициента) Мне надо разобраться что конкретно имени в виду в одной статье, и именно это, видимо, и имели... Подскажите, такой вывод хоть как то может быть правомерен?

Автор: passant 27.06.2022 - 07:04

Цитата(salm @ 26.06.2022 - 23:31) *
возможно ли...... не используя коэффициентов ..... сказать следующее.....значимое р для коэффициента


Это как? Коэффициент не считаем, но p_value для него знаем? Каким чудом?

Автор: ИНО 27.06.2022 - 16:45

Линейная регрессия без уравнения? shok.gif
Вы б лучше эту статью показали, а то испорченный телефон какой-то получается.

Автор: salm 29.06.2022 - 15:06

Ой спасибо, что откликнулись... Ну вот статья... В ней результирующая переменная это MPR - значение резерва. Они указывают р-значимостьи коэффициент корреляции. На основании этого, делают вывод. Если правильно понимаю...

Автор: salm 29.06.2022 - 15:08

ой вот... это я случайно трижды загрузила, не знаю как исправить

 франц_офэкт.pdf ( 474,25 килобайт ) : 134
 франц_офэкт.pdf ( 474,25 килобайт ) : 274
 франц_офэкт.pdf ( 474,25 килобайт ) : 122
 

Автор: ИНО 29.06.2022 - 16:28

Прочитал подраздел "Statistical Analysis". Обычная линейная регрессия с селекцией "оптимальнй модели" основе p-значений коэффициентов. Не совсем понятно, что такое "entry criterion P < 0.1"? Могу лишь предположить, что на первом шаге подгоняли полную модель, а затем исключали все предикторы, коэффициенты-которых, имели p>0,1. А вот дальнейшее вполне ясно: пошагово исключали предикторы с p>0,05 (видимо, начиная с того, у которого оно было самым большим, хотя из текста и не очевидно). На каждом шаге модель переоценивали, пока не остались только предикторы с p<0,05. Вот эту последнюю модель и интерпретировали. Не самый мудрый способ селекции предикторов, но на практике используется часто. Также не поясняется, что делали с результатами вушеупомянутого корреляционного анализа (по идее, могли использовать для исключения сильно скоррелированных предикторов, но об этом - не слова) и зачем вообще применяли критерий Манна-Уитни. В целом, очень скупое и мутное описание статанализа по принципу "догадайся мол сама". Но никаких чудес, описанных Вами в стартовом, оно не содержит.

Что же касается предыдущих подразделов, то хотя там и упоминаются местами отдельные статистические термины, но оценивать это должен не статистик общего профиля, а специалист-биофизик в паре с физиологом. Потому что относится оно, насколько я понял, к обработки сигнала, полученного от некоего диагностичесокого прибора и реконструкции на его основе неких процессов в сердце больного.

Автор: ИНО 29.06.2022 - 16:48

Еще рисунки глянул - недоумеваю unknw.gif Четыре диаграммы рассеяния с подогнанными прямыми (сиречь однофаторная линейная регрессия) и коэффициентами корреляции Пирсона и некими "adjusted p" Почему и как adjusted? Тупо по Бонферрони, исходя из количества полученных r? Сомнительно, что они были бы столь малы. Четыре пары усатых ящиков с некими p, наверное вот он, где Манн-Уитни нашелся, хотя неплохо было бы это прямым текстом написать. Пять штук ROC-кривых. Эти-то вообще откуда взялись? В материале и методах ни слова о них. И ни одного рисунка или таблицы, посвященной обсуждаемой нами и описанной в "Statistical Analysis" множественной линейной регрессии. Возможно, там в тексте что-то об этом пописано, но после увиденного копаться желания нет. В общем, в качестве примера описания статистического анализа (об остальном судить не могу) статья весьма дурна.

Автор: salm 30.06.2022 - 10:43

Цитата(ИНО @ 29.06.2022 - 16:28) *
Прочитал подраздел "Statistical Analysis". Обычная линейная регрессия с селекцией "оптимальнй модели" основе p-значений коэффициентов. Не совсем понятно, что такое "entry criterion P < 0.1"? Могу лишь предположить, что на первом шаге подгоняли полную модель, а затем исключали все предикторы, коэффициенты-которых, имели p>0,1. А вот дальнейшее вполне ясно: пошагово исключали предикторы с p>0,05 (видимо, начиная с того, у которого оно было самым большим, хотя из текста и не очевидно). На каждом шаге модель переоценивали, пока не остались только предикторы с p<0,05. Вот эту последнюю модель и интерпретировали. Не самый мудрый способ селекции предикторов, но на практике используется часто. Также не поясняется, что делали с результатами вушеупомянутого корреляционного анализа (по идее, могли использовать для исключения сильно скоррелированных предикторов, но об этом - не слова) и зачем вообще применяли критерий Манна-Уитни. В целом, очень скупое и мутное описание статанализа по принципу "догадайся мол сама". Но никаких чудес, описанных Вами в стартовом, оно не содержит.

Что же касается предыдущих подразделов, то хотя там и упоминаются местами отдельные статистические термины, но оценивать это должен не статистик общего профиля, а специалист-биофизик в паре с физиологом. Потому что относится оно, насколько я понял, к обработки сигнала, полученного от некоего диагностичесокого прибора и реконструкции на его основе неких процессов в сердце больного.



Спасибо огромное еще раз. Я имела ввиду, они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов регрессии (ну бэта которые), без направления связи предикторов со значением переменной исхода, без формулы, без константы... Так можно что ли? коэффициенты корреляции то я вижу... ну меня бы это устроило)))
Про сравнение- ну по крайней мере мне понятно что они хотели сказать... я не про грамотность с точки зрения статистики

Автор: salm 30.06.2022 - 10:48

Цитата(ИНО @ 29.06.2022 - 16:48) *
Еще рисунки глянул - недоумеваю unknw.gif Четыре диаграммы рассеяния с подогнанными прямыми (сиречь однофаторная линейная регрессия) и коэффициентами корреляции Пирсона и некими "adjusted p" Почему и как adjusted? Тупо по Бонферрони, исходя из количества полученных r? Сомнительно, что они были бы столь малы. Четыре пары усатых ящиков с некими p, наверное вот он, где Манн-Уитни нашелся, хотя неплохо было бы это прямым текстом написать. Пять штук ROC-кривых. Эти-то вообще откуда взялись? В материале и методах ни слова о них. И ни одного рисунка или таблицы, посвященной обсуждаемой нами и описанной в "Statistical Analysis" множественной линейной регрессии. Возможно, там в тексте что-то об этом пописано, но после увиденного копаться желания нет. В общем, в качестве примера описания статистического анализа (об остальном судить не могу) статья весьма дурна.


С adjusted это они перепутали.. С остальными графиками, и прочему могу предположить, что это в плане ограничения по объему, они пожертвовали. ну помимо недостатков самого описания...

Автор: passant 30.06.2022 - 12:57

Цитата(salm @ 30.06.2022 - 10:43) *
они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов, без направления связи предикторов со значением переменной исхода, без формулы, без константы...


Нет, так нельзя. Но они так сделали. С формальной точки зрения - т.е. отрешившись от прикладной задачи - такой работе доверия быть не может. Т.е. текст есть, а достоверной информации в нем - нет. Зачем они так сделали - это совсем другой вопрос. Если с медицинской точки зрения эта работа интересная (я об этом судит не могу) - напишите авторам и попросите объяснений.

Автор: ИНО 30.06.2022 - 16:45

Цитата
Я имела ввиду, они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов регрессии (ну бэта которые), без направления связи предикторов со значением переменной исхода, без формулы, без константы... Так можно что ли?

Ну, вывод о статистической значимости делать можно (если допущения выполнены, о проверке чего также никаких сведений нет). Однако хотелось бы видеть еще и медицинскую значимость, а тут уж без коэффициентов трудно будет. Ведь даже непонятны направления эффектов. Я вообще не увидел там описания результатов регрессионного анализа.

Автор: salm 30.06.2022 - 21:11

Цитата(passant @ 30.06.2022 - 12:57) *
Нет, так нельзя. Но они так сделали. С формальной точки зрения - т.е. отрешившись от прикладной задачи - такой работе доверия быть не может. Т.е. текст есть, а достоверной информации в нем - нет. Зачем они так сделали - это совсем другой вопрос. Если с медицинской точки зрения эта работа интересная (я об этом судит не могу) - напишите авторам и попросите объяснений.


Спасибо Вам!!! Писать им не могу так ка практически все работы по моей смежным темам, практически одинообразны в плане подхода к сттатанализу. Да и это довольно старая работа, они бы проигнорировали меня. С точки зрения медицинского подхода, для врача это должно означать следующее: в составе модели с включением возраста, пола и нескольких клинических переменных и числа пораженных сосудов, только последнее было значимым... вот что они говорят. я вижу следующее, как клиницист: для меня величина коронарного резерва практически всегда определяется числом пораженных сосудов (без направления связи), а возраст, пол, несколько функциональных параметров значимо не влияют на величину этого коронарного резерва. . При этом предсказывающие параметры и бинарные и категориальные и никаких проверок соответственно там не было...
Я все понимаю)
Но это не работа вот такая негодная, я ее выудила и Вам отправила... они плюс/минус все очень похожи в плане выводов и то как эти выводы получаются... описание стат анализа всегда куцее.. требуемые допущения редко проверяются, и как правило об этом умалчивается... Ну вот так...
Спасибо, что отвечаете!!

Цитата(ИНО @ 30.06.2022 - 16:45) *
Ну, вывод о статистической значимости делать можно (если допущения выполнены, о проверке чего также никаких сведений нет). Однако хотелось бы видеть еще и медицинскую значимость, а тут уж без коэффициентов трудно будет. Ведь даже непонятны направления эффектов. Я вообще не увидел там описания результатов регрессионного анализа.


Спасибо еще раз!!!

Автор: comisora 30.06.2022 - 23:43

Цитата(salm @ 30.06.2022 - 21:11) *
я вижу следующее, как клиницист: для меня величина коронарного резерва практически всегда определяется числом пораженных сосудов (без направления связи), а возраст, пол, несколько функциональных параметров значимо не влияют на величину этого коронарного резерва.


Величина резерва коронарного кровотока должна быть обратно связана с количеством поражённых сосудов. Если пораженных сосудов нет, то этот резерв максимальный, если все сосуды поражены, то резерв минимальный. Или это не так?

Автор: salm 1.07.2022 - 09:09

Цитата(comisora @ 30.06.2022 - 23:43) *
Величина резерва коронарного кровотока должна быть обратно связана с количеством поражённых сосудов. Если пораженных сосудов нет, то этот резерв максимальный, если все сосуды поражены, то резерв минимальный. Или это не так?


Здраствуйте. Да, обратно пропорциональна. Это я так трактую статью: буквально следующее:многофакторная линейная регрессия показала что при включении в модель пола, возраста, индекса массы тела, числа сосудов, числа традиционных факторов риска, и еще трех функциональных параметров) только число сосудов оказалось значимым при прогнозировании величины резерва. Указано р-value для модели и коэффициент для модели , из которого можно вычесть коэффициент детерминации. Направления связи значимого предиктора здесь нет... или я неправильно понимаю... мы его для этого же используем?... для направления связи предиктора нам же нужен его коэффициент из многофакторный модели?...

Автор: ИНО 1.07.2022 - 23:05

Нет во множественной регрессии никакого одного "коэффициента для модели", их там, как минимум, столько же, сколько предикторов. А вот одно глобальное p таки можно посчитать.

Автор: salm 2.07.2022 - 16:41

Цитата(ИНО @ 1.07.2022 - 23:05) *
Нет во множественной регрессии никакого одного "коэффициента для модели", их там, как минимум, столько же, сколько предикторов. А вот одно глобальное p таки можно посчитать.


А что такое R для модели, из которой % дисперсии вычислить?

Автор: ИНО 2.07.2022 - 19:16

Может, таки R-квадрат? Насколько я знаю, он однозначно определен только в МНК-регрессии. Для всех прочих, включая смешанные модели, существуют только всякие "псевдо-R2", и несть им числа (причем все разные).

P.S. Даже забыл уже, что R2 тоже коэффициентом (детерминации) кличут, и не подумал, что речь может идти о нем. С коэффициентами предикторов общего там только слово "коэффициент".

Автор: salm 3.07.2022 - 01:17

Цитата(ИНО @ 2.07.2022 - 19:16) *
Может, таки R-квадрат? Насколько я знаю, он однозначно определен только в МНК-регрессии. Для всех прочих, включая смешанные модели, существуют только всякие "псевдо-R2", и несть им числа (причем все разные).

P.S. Даже забыл уже, что R2 тоже коэффициентом (детерминации) кличут, и не подумал, что речь может идти о нем. С коэффициентами предикторов общего там только слово "коэффициент".

Ну речь шла о статье, там для модели указан R, не в квадрате даже. Дословно из конкретной статьи.
Спасибо

Автор: ИНО 3.07.2022 - 02:01

Так то коэффициент корреляции Пирсона, причем парной. Если его возвести в квадрат и получится коэффициент детерминации для однофакторной линейной МНК-регрессии. Но в случае с многофакторной регрессией, а тем более не МНК, все о сложнее. Однако в статье там для обещанного регрессионного моделирования вообще так и не дошли, по крайней мере на рисунках, а ограничились парными корреляциями.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)