Версия для печати темы
Форум врачей-аспирантов _ Медицинская статистика _ Гомоскедастичность остатков в линейных смешанных моделях
Автор: Anna_V 18.08.2021 - 13:01
Добрый день. Если я не ошибаюсь, корректное применение линейных смешанных моделей требует гомоскедастичности остатков. Вопрос: как её проверить (кроме визуального анализа)? Где-то читала, не могу найти, что критерий Ливиня не рекомендуют применять из-за его излишней консервативности в данном случае. В Prism гомоскедастичность остатков предлагается проверять расчетом корреляции Спирмена между предсказанными значениями и абсолютными значениями остатков, на сколько оправдан такой подход?
Автор: passant 18.08.2021 - 21:19
Цитата(Anna_V @ 18.08.2021 - 13:01)
Добрый день. Если я не ошибаюсь, корректное применение линейных смешанных моделей требует гомоскедастичности остатков. Вопрос: как её проверить (кроме визуального анализа)? Где-то читала, не могу найти, что критерий Ливиня не рекомендуют применять из-за его излишней консервативности в данном случае. В Prism гомоскедастичность остатков предлагается проверять расчетом корреляции Спирмена между предсказанными значениями и абсолютными значениями остатков, на сколько оправдан такой подход?
Методы проверки гомоскедастичности остатков:
- Коэффициент ранговой кореляции Спирмана.
- Тест Голдфелда-Квандта. (На основе критерия Фишера)
- Тест Уайта - построение регрессионной модели зависимости квадратов ошибок от Х.
- Тест Глейзера.
- Тест Бройша — Пагана (Тоже, по сути, на основе критерия Фишера)
Смотрите, изучайте что вам больше подходит, применяйте.
Автор: salm 26.06.2022 - 23:31
А подскажите пожалуйста: возможно ли игнорируя допущения для модели линейной регрессии (с несколькими факторами), не используя коэффициентов и само уравнение, а сказать следующее: для такого то параметра... (количественного) независимым предиктром было то то...(значимое р для коэффициента) Мне надо разобраться что конкретно имени в виду в одной статье, и именно это, видимо, и имели... Подскажите, такой вывод хоть как то может быть правомерен?
Автор: passant 27.06.2022 - 07:04
Цитата(salm @ 26.06.2022 - 23:31)
возможно ли...... не используя коэффициентов ..... сказать следующее.....значимое р для коэффициента
Это как? Коэффициент не считаем, но p_value для него знаем? Каким чудом?
Автор: ИНО 27.06.2022 - 16:45
Линейная регрессия без уравнения?
Вы б лучше эту статью показали, а то испорченный телефон какой-то получается.
Автор: salm 29.06.2022 - 15:06
Ой спасибо, что откликнулись... Ну вот статья... В ней результирующая переменная это MPR - значение резерва. Они указывают р-значимостьи коэффициент корреляции. На основании этого, делают вывод. Если правильно понимаю...
Автор: salm 29.06.2022 - 15:08
ой вот... это я случайно трижды загрузила, не знаю как исправить
Автор: ИНО 29.06.2022 - 16:28
Прочитал подраздел "Statistical Analysis". Обычная линейная регрессия с селекцией "оптимальнй модели" основе p-значений коэффициентов. Не совсем понятно, что такое "entry criterion P < 0.1"? Могу лишь предположить, что на первом шаге подгоняли полную модель, а затем исключали все предикторы, коэффициенты-которых, имели p>0,1. А вот дальнейшее вполне ясно: пошагово исключали предикторы с p>0,05 (видимо, начиная с того, у которого оно было самым большим, хотя из текста и не очевидно). На каждом шаге модель переоценивали, пока не остались только предикторы с p<0,05. Вот эту последнюю модель и интерпретировали. Не самый мудрый способ селекции предикторов, но на практике используется часто. Также не поясняется, что делали с результатами вушеупомянутого корреляционного анализа (по идее, могли использовать для исключения сильно скоррелированных предикторов, но об этом - не слова) и зачем вообще применяли критерий Манна-Уитни. В целом, очень скупое и мутное описание статанализа по принципу "догадайся мол сама". Но никаких чудес, описанных Вами в стартовом, оно не содержит.
Что же касается предыдущих подразделов, то хотя там и упоминаются местами отдельные статистические термины, но оценивать это должен не статистик общего профиля, а специалист-биофизик в паре с физиологом. Потому что относится оно, насколько я понял, к обработки сигнала, полученного от некоего диагностичесокого прибора и реконструкции на его основе неких процессов в сердце больного.
Автор: ИНО 29.06.2022 - 16:48
Еще рисунки глянул - недоумеваю Четыре диаграммы рассеяния с подогнанными прямыми (сиречь однофаторная линейная регрессия) и коэффициентами корреляции Пирсона и некими "adjusted p" Почему и как adjusted? Тупо по Бонферрони, исходя из количества полученных r? Сомнительно, что они были бы столь малы. Четыре пары усатых ящиков с некими p, наверное вот он, где Манн-Уитни нашелся, хотя неплохо было бы это прямым текстом написать. Пять штук ROC-кривых. Эти-то вообще откуда взялись? В материале и методах ни слова о них. И ни одного рисунка или таблицы, посвященной обсуждаемой нами и описанной в "Statistical Analysis" множественной линейной регрессии. Возможно, там в тексте что-то об этом пописано, но после увиденного копаться желания нет. В общем, в качестве примера описания статистического анализа (об остальном судить не могу) статья весьма дурна.
Автор: salm 30.06.2022 - 10:43
Цитата(ИНО @ 29.06.2022 - 16:28)
Прочитал подраздел "Statistical Analysis". Обычная линейная регрессия с селекцией "оптимальнй модели" основе p-значений коэффициентов. Не совсем понятно, что такое "entry criterion P < 0.1"? Могу лишь предположить, что на первом шаге подгоняли полную модель, а затем исключали все предикторы, коэффициенты-которых, имели p>0,1. А вот дальнейшее вполне ясно: пошагово исключали предикторы с p>0,05 (видимо, начиная с того, у которого оно было самым большим, хотя из текста и не очевидно). На каждом шаге модель переоценивали, пока не остались только предикторы с p<0,05. Вот эту последнюю модель и интерпретировали. Не самый мудрый способ селекции предикторов, но на практике используется часто. Также не поясняется, что делали с результатами вушеупомянутого корреляционного анализа (по идее, могли использовать для исключения сильно скоррелированных предикторов, но об этом - не слова) и зачем вообще применяли критерий Манна-Уитни. В целом, очень скупое и мутное описание статанализа по принципу "догадайся мол сама". Но никаких чудес, описанных Вами в стартовом, оно не содержит.
Что же касается предыдущих подразделов, то хотя там и упоминаются местами отдельные статистические термины, но оценивать это должен не статистик общего профиля, а специалист-биофизик в паре с физиологом. Потому что относится оно, насколько я понял, к обработки сигнала, полученного от некоего диагностичесокого прибора и реконструкции на его основе неких процессов в сердце больного.
Спасибо огромное еще раз. Я имела ввиду, они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов регрессии (ну бэта которые), без направления связи предикторов со значением переменной исхода, без формулы, без константы... Так можно что ли? коэффициенты корреляции то я вижу... ну меня бы это устроило)))
Про сравнение- ну по крайней мере мне понятно что они хотели сказать... я не про грамотность с точки зрения статистики
Автор: salm 30.06.2022 - 10:48
Цитата(ИНО @ 29.06.2022 - 16:48)
Еще рисунки глянул - недоумеваю
Четыре диаграммы рассеяния с подогнанными прямыми (сиречь однофаторная линейная регрессия) и коэффициентами корреляции Пирсона и некими "adjusted p" Почему и как adjusted? Тупо по Бонферрони, исходя из количества полученных r? Сомнительно, что они были бы столь малы. Четыре пары усатых ящиков с некими p, наверное вот он, где Манн-Уитни нашелся, хотя неплохо было бы это прямым текстом написать. Пять штук ROC-кривых. Эти-то вообще откуда взялись? В материале и методах ни слова о них. И ни одного рисунка или таблицы, посвященной обсуждаемой нами и описанной в "Statistical Analysis" множественной линейной регрессии. Возможно, там в тексте что-то об этом пописано, но после увиденного копаться желания нет. В общем, в качестве примера описания статистического анализа (об остальном судить не могу) статья весьма дурна.
С adjusted это они перепутали.. С остальными графиками, и прочему могу предположить, что это в плане ограничения по объему, они пожертвовали. ну помимо недостатков самого описания...
Автор: passant 30.06.2022 - 12:57
Цитата(salm @ 30.06.2022 - 10:43)
они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов, без направления связи предикторов со значением переменной исхода, без формулы, без константы...
Нет, так нельзя. Но они так сделали. С формальной точки зрения - т.е. отрешившись от прикладной задачи - такой работе доверия быть не может. Т.е. текст есть, а достоверной информации в нем - нет. Зачем они так сделали - это совсем другой вопрос. Если с медицинской точки зрения эта работа интересная (я об этом судит не могу) - напишите авторам и попросите объяснений.
Автор: ИНО 30.06.2022 - 16:45
Цитата
Я имела ввиду, они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов регрессии (ну бэта которые), без направления связи предикторов со значением переменной исхода, без формулы, без константы... Так можно что ли?
Ну, вывод о статистической значимости делать можно (если допущения выполнены, о проверке чего также никаких сведений нет). Однако хотелось бы видеть еще и медицинскую значимость, а тут уж без коэффициентов трудно будет. Ведь даже непонятны направления эффектов. Я вообще не увидел там описания результатов регрессионного анализа.
Автор: salm 30.06.2022 - 21:11
Цитата(passant @ 30.06.2022 - 12:57)
Нет, так нельзя. Но они так сделали. С формальной точки зрения - т.е. отрешившись от прикладной задачи - такой работе доверия быть не может. Т.е. текст есть, а достоверной информации в нем - нет. Зачем они так сделали - это совсем другой вопрос. Если с медицинской точки зрения эта работа интересная (я об этом судит не могу) - напишите авторам и попросите объяснений.
Спасибо Вам!!! Писать им не могу так ка практически все работы по моей смежным темам, практически одинообразны в плане подхода к сттатанализу. Да и это довольно старая работа, они бы проигнорировали меня. С точки зрения медицинского подхода, для врача это должно означать следующее: в составе модели с включением возраста, пола и нескольких клинических переменных и числа пораженных сосудов, только последнее было значимым... вот что они говорят. я вижу следующее, как клиницист: для меня величина коронарного резерва практически всегда определяется числом пораженных сосудов (без направления связи), а возраст, пол, несколько функциональных параметров значимо не влияют на величину этого коронарного резерва. . При этом предсказывающие параметры и бинарные и категориальные и никаких проверок соответственно там не было...
Я все понимаю)
Но это не работа вот такая негодная, я ее выудила и Вам отправила... они плюс/минус все очень похожи в плане выводов и то как эти выводы получаются... описание стат анализа всегда куцее.. требуемые допущения редко проверяются, и как правило об этом умалчивается... Ну вот так...
Спасибо, что отвечаете!!
Цитата(ИНО @ 30.06.2022 - 16:45)
Ну, вывод о статистической значимости делать можно (если допущения выполнены, о проверке чего также никаких сведений нет). Однако хотелось бы видеть еще и медицинскую значимость, а тут уж без коэффициентов трудно будет. Ведь даже непонятны направления эффектов. Я вообще не увидел там описания результатов регрессионного анализа.
Спасибо еще раз!!!
Автор: comisora 30.06.2022 - 23:43
Цитата(salm @ 30.06.2022 - 21:11)
я вижу следующее, как клиницист: для меня величина коронарного резерва практически всегда определяется числом пораженных сосудов (без направления связи), а возраст, пол, несколько функциональных параметров значимо не влияют на величину этого коронарного резерва.
Величина резерва коронарного кровотока должна быть обратно связана с количеством поражённых сосудов. Если пораженных сосудов нет, то этот резерв максимальный, если все сосуды поражены, то резерв минимальный. Или это не так?
Автор: salm 1.07.2022 - 09:09
Цитата(comisora @ 30.06.2022 - 23:43)
Величина резерва коронарного кровотока должна быть обратно связана с количеством поражённых сосудов. Если пораженных сосудов нет, то этот резерв максимальный, если все сосуды поражены, то резерв минимальный. Или это не так?
Здраствуйте. Да, обратно пропорциональна. Это я так трактую статью: буквально следующее:многофакторная линейная регрессия показала что при включении в модель пола, возраста, индекса массы тела, числа сосудов, числа традиционных факторов риска, и еще трех функциональных параметров) только число сосудов оказалось значимым при прогнозировании величины резерва. Указано р-value
для модели и коэффициент для модели , из которого можно вычесть коэффициент детерминации. Направления связи значимого предиктора здесь нет... или я неправильно понимаю... мы его для этого же используем?... для направления связи предиктора нам же нужен его коэффициент из многофакторный модели?...
Автор: ИНО 1.07.2022 - 23:05
Нет во множественной регрессии никакого одного "коэффициента для модели", их там, как минимум, столько же, сколько предикторов. А вот одно глобальное p таки можно посчитать.
Автор: salm 2.07.2022 - 16:41
Цитата(ИНО @ 1.07.2022 - 23:05)
Нет во множественной регрессии никакого одного "коэффициента для модели", их там, как минимум, столько же, сколько предикторов. А вот одно глобальное p таки можно посчитать.
А что такое R для модели, из которой % дисперсии вычислить?
Автор: ИНО 2.07.2022 - 19:16
Может, таки R-квадрат? Насколько я знаю, он однозначно определен только в МНК-регрессии. Для всех прочих, включая смешанные модели, существуют только всякие "псевдо-R2", и несть им числа (причем все разные).
P.S. Даже забыл уже, что R2 тоже коэффициентом (детерминации) кличут, и не подумал, что речь может идти о нем. С коэффициентами предикторов общего там только слово "коэффициент".
Автор: salm 3.07.2022 - 01:17
Цитата(ИНО @ 2.07.2022 - 19:16)
Может, таки R-квадрат? Насколько я знаю, он однозначно определен только в МНК-регрессии. Для всех прочих, включая смешанные модели, существуют только всякие "псевдо-R2", и несть им числа (причем все разные).
P.S. Даже забыл уже, что R2 тоже коэффициентом (детерминации) кличут, и не подумал, что речь может идти о нем. С коэффициентами предикторов общего там только слово "коэффициент".
Ну речь шла о статье, там для модели указан R, не в квадрате даже. Дословно из конкретной статьи.
Спасибо
Автор: ИНО 3.07.2022 - 02:01
Так то коэффициент корреляции Пирсона, причем парной. Если его возвести в квадрат и получится коэффициент детерминации для однофакторной линейной МНК-регрессии. Но в случае с многофакторной регрессией, а тем более не МНК, все о сложнее. Однако в статье там для обещанного регрессионного моделирования вообще так и не дошли, по крайней мере на рисунках, а ограничились парными корреляциями.
Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)