Anna_V
18.08.2021 - 13:01
Добрый день. Если я не ошибаюсь, корректное применение линейных смешанных моделей требует гомоскедастичности остатков. Вопрос: как её проверить (кроме визуального анализа)? Где-то читала, не могу найти, что критерий Ливиня не рекомендуют применять из-за его излишней консервативности в данном случае. В Prism гомоскедастичность остатков предлагается проверять расчетом корреляции Спирмена между предсказанными значениями и абсолютными значениями остатков, на сколько оправдан такой подход?
passant
18.08.2021 - 21:19
Цитата(Anna_V @ 18.08.2021 - 13:01)

Добрый день. Если я не ошибаюсь, корректное применение линейных смешанных моделей требует гомоскедастичности остатков. Вопрос: как её проверить (кроме визуального анализа)? Где-то читала, не могу найти, что критерий Ливиня не рекомендуют применять из-за его излишней консервативности в данном случае. В Prism гомоскедастичность остатков предлагается проверять расчетом корреляции Спирмена между предсказанными значениями и абсолютными значениями остатков, на сколько оправдан такой подход?
Методы проверки гомоскедастичности остатков:
- Коэффициент ранговой кореляции Спирмана.
- Тест Голдфелда-Квандта. (На основе критерия Фишера)
- Тест Уайта - построение регрессионной модели зависимости квадратов ошибок от Х.
- Тест Глейзера.
- Тест Бройша — Пагана (Тоже, по сути, на основе критерия Фишера)
Смотрите, изучайте что вам больше подходит, применяйте.
А подскажите пожалуйста: возможно ли игнорируя допущения для модели линейной регрессии (с несколькими факторами), не используя коэффициентов и само уравнение, а сказать следующее: для такого то параметра... (количественного) независимым предиктром было то то...(значимое р для коэффициента) Мне надо разобраться что конкретно имени в виду в одной статье, и именно это, видимо, и имели... Подскажите, такой вывод хоть как то может быть правомерен?
passant
27.06.2022 - 07:04
Цитата(salm @ 26.06.2022 - 23:31)

возможно ли...... не используя коэффициентов ..... сказать следующее.....значимое р для коэффициента
Это как? Коэффициент не считаем, но p_value для него знаем? Каким чудом?
Линейная регрессия без уравнения?
Вы б лучше эту статью показали, а то испорченный телефон какой-то получается.
Ой спасибо, что откликнулись... Ну вот статья... В ней результирующая переменная это MPR - значение резерва. Они указывают р-значимостьи коэффициент корреляции. На основании этого, делают вывод. Если правильно понимаю...
ой вот... это я случайно трижды загрузила, не знаю как исправить
Прочитал подраздел "Statistical Analysis". Обычная линейная регрессия с селекцией "оптимальнй модели" основе p-значений коэффициентов. Не совсем понятно, что такое "entry criterion P < 0.1"? Могу лишь предположить, что на первом шаге подгоняли полную модель, а затем исключали все предикторы, коэффициенты-которых, имели p>0,1. А вот дальнейшее вполне ясно: пошагово исключали предикторы с p>0,05 (видимо, начиная с того, у которого оно было самым большим, хотя из текста и не очевидно). На каждом шаге модель переоценивали, пока не остались только предикторы с p<0,05. Вот эту последнюю модель и интерпретировали. Не самый мудрый способ селекции предикторов, но на практике используется часто. Также не поясняется, что делали с результатами вушеупомянутого корреляционного анализа (по идее, могли использовать для исключения сильно скоррелированных предикторов, но об этом - не слова) и зачем вообще применяли критерий Манна-Уитни. В целом, очень скупое и мутное описание статанализа по принципу "догадайся мол сама". Но никаких чудес, описанных Вами в стартовом, оно не содержит.
Что же касается предыдущих подразделов, то хотя там и упоминаются местами отдельные статистические термины, но оценивать это должен не статистик общего профиля, а специалист-биофизик в паре с физиологом. Потому что относится оно, насколько я понял, к обработки сигнала, полученного от некоего диагностичесокого прибора и реконструкции на его основе неких процессов в сердце больного.
Еще рисунки глянул - недоумеваю

Четыре диаграммы рассеяния с подогнанными прямыми (сиречь однофаторная линейная регрессия) и коэффициентами корреляции Пирсона и некими "adjusted p" Почему и как adjusted? Тупо по Бонферрони, исходя из количества полученных r? Сомнительно, что они были бы столь малы. Четыре пары усатых ящиков с некими p, наверное вот он, где Манн-Уитни нашелся, хотя неплохо было бы это прямым текстом написать. Пять штук ROC-кривых. Эти-то вообще откуда взялись? В материале и методах ни слова о них. И ни одного рисунка или таблицы, посвященной обсуждаемой нами и описанной в "Statistical Analysis" множественной линейной регрессии. Возможно, там в тексте что-то об этом пописано, но после увиденного копаться желания нет. В общем, в качестве примера описания статистического анализа (об остальном судить не могу) статья весьма дурна.
Цитата(ИНО @ 29.06.2022 - 16:28)

Прочитал подраздел "Statistical Analysis". Обычная линейная регрессия с селекцией "оптимальнй модели" основе p-значений коэффициентов. Не совсем понятно, что такое "entry criterion P < 0.1"? Могу лишь предположить, что на первом шаге подгоняли полную модель, а затем исключали все предикторы, коэффициенты-которых, имели p>0,1. А вот дальнейшее вполне ясно: пошагово исключали предикторы с p>0,05 (видимо, начиная с того, у которого оно было самым большим, хотя из текста и не очевидно). На каждом шаге модель переоценивали, пока не остались только предикторы с p<0,05. Вот эту последнюю модель и интерпретировали. Не самый мудрый способ селекции предикторов, но на практике используется часто. Также не поясняется, что делали с результатами вушеупомянутого корреляционного анализа (по идее, могли использовать для исключения сильно скоррелированных предикторов, но об этом - не слова) и зачем вообще применяли критерий Манна-Уитни. В целом, очень скупое и мутное описание статанализа по принципу "догадайся мол сама". Но никаких чудес, описанных Вами в стартовом, оно не содержит.
Что же касается предыдущих подразделов, то хотя там и упоминаются местами отдельные статистические термины, но оценивать это должен не статистик общего профиля, а специалист-биофизик в паре с физиологом. Потому что относится оно, насколько я понял, к обработки сигнала, полученного от некоего диагностичесокого прибора и реконструкции на его основе неких процессов в сердце больного.
Спасибо огромное еще раз. Я имела ввиду, они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов регрессии (ну бэта которые), без направления связи предикторов со значением переменной исхода, без формулы, без константы... Так можно что ли? коэффициенты корреляции то я вижу... ну меня бы это устроило)))
Про сравнение- ну по крайней мере мне понятно что они хотели сказать... я не про грамотность с точки зрения статистики
Цитата(ИНО @ 29.06.2022 - 16:48)

Еще рисунки глянул - недоумеваю

Четыре диаграммы рассеяния с подогнанными прямыми (сиречь однофаторная линейная регрессия) и коэффициентами корреляции Пирсона и некими "adjusted p" Почему и как adjusted? Тупо по Бонферрони, исходя из количества полученных r? Сомнительно, что они были бы столь малы. Четыре пары усатых ящиков с некими p, наверное вот он, где Манн-Уитни нашелся, хотя неплохо было бы это прямым текстом написать. Пять штук ROC-кривых. Эти-то вообще откуда взялись? В материале и методах ни слова о них. И ни одного рисунка или таблицы, посвященной обсуждаемой нами и описанной в "Statistical Analysis" множественной линейной регрессии. Возможно, там в тексте что-то об этом пописано, но после увиденного копаться желания нет. В общем, в качестве примера описания статистического анализа (об остальном судить не могу) статья весьма дурна.
С adjusted это они перепутали.. С остальными графиками, и прочему могу предположить, что это в плане ограничения по объему, они пожертвовали. ну помимо недостатков самого описания...
passant
30.06.2022 - 12:57
Цитата(salm @ 30.06.2022 - 10:43)

они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов, без направления связи предикторов со значением переменной исхода, без формулы, без константы...
Нет, так нельзя. Но они так сделали. С формальной точки зрения - т.е. отрешившись от прикладной задачи - такой работе доверия быть не может. Т.е. текст есть, а достоверной информации в нем - нет. Зачем они так сделали - это совсем другой вопрос. Если с медицинской точки зрения эта работа интересная (я об этом судит не могу) - напишите авторам и попросите объяснений.
Цитата
Я имела ввиду, они сделали вывод о значимости влияния на значение переменной исхода предикторов на основании их р-значений, без указания самих коэффициентов регрессии (ну бэта которые), без направления связи предикторов со значением переменной исхода, без формулы, без константы... Так можно что ли?
Ну, вывод о статистической значимости делать можно (если допущения выполнены, о проверке чего также никаких сведений нет). Однако хотелось бы видеть еще и медицинскую значимость, а тут уж без коэффициентов трудно будет. Ведь даже непонятны направления эффектов. Я вообще не увидел там описания результатов регрессионного анализа.
Цитата(passant @ 30.06.2022 - 12:57)

Нет, так нельзя. Но они так сделали. С формальной точки зрения - т.е. отрешившись от прикладной задачи - такой работе доверия быть не может. Т.е. текст есть, а достоверной информации в нем - нет. Зачем они так сделали - это совсем другой вопрос. Если с медицинской точки зрения эта работа интересная (я об этом судит не могу) - напишите авторам и попросите объяснений.
Спасибо Вам!!! Писать им не могу так ка практически все работы по моей смежным темам, практически одинообразны в плане подхода к сттатанализу. Да и это довольно старая работа, они бы проигнорировали меня. С точки зрения медицинского подхода, для врача это должно означать следующее: в составе модели с включением возраста, пола и нескольких клинических переменных и числа пораженных сосудов, только последнее было значимым... вот что они говорят. я вижу следующее, как клиницист: для меня величина коронарного резерва практически всегда определяется числом пораженных сосудов (без направления связи), а возраст, пол, несколько функциональных параметров значимо не влияют на величину этого коронарного резерва. . При этом предсказывающие параметры и бинарные и категориальные и никаких проверок соответственно там не было...
Я все понимаю)
Но это не работа вот такая негодная, я ее выудила и Вам отправила... они плюс/минус все очень похожи в плане выводов и то как эти выводы получаются... описание стат анализа всегда куцее.. требуемые допущения редко проверяются, и как правило об этом умалчивается... Ну вот так...
Спасибо, что отвечаете!!
Цитата(ИНО @ 30.06.2022 - 16:45)

Ну, вывод о статистической значимости делать можно (если допущения выполнены, о проверке чего также никаких сведений нет). Однако хотелось бы видеть еще и медицинскую значимость, а тут уж без коэффициентов трудно будет. Ведь даже непонятны направления эффектов. Я вообще не увидел там описания результатов регрессионного анализа.
Спасибо еще раз!!!
comisora
30.06.2022 - 23:43
Цитата(salm @ 30.06.2022 - 21:11)

я вижу следующее, как клиницист: для меня величина коронарного резерва практически всегда определяется числом пораженных сосудов (без направления связи), а возраст, пол, несколько функциональных параметров значимо не влияют на величину этого коронарного резерва.
Величина резерва коронарного кровотока должна быть обратно связана с количеством поражённых сосудов. Если пораженных сосудов нет, то этот резерв максимальный, если все сосуды поражены, то резерв минимальный. Или это не так?
Цитата(comisora @ 30.06.2022 - 23:43)

Величина резерва коронарного кровотока должна быть обратно связана с количеством поражённых сосудов. Если пораженных сосудов нет, то этот резерв максимальный, если все сосуды поражены, то резерв минимальный. Или это не так?
Здраствуйте. Да, обратно пропорциональна. Это я так трактую статью: буквально следующее:многофакторная линейная регрессия показала что при включении в модель пола, возраста, индекса массы тела, числа сосудов, числа традиционных факторов риска, и еще трех функциональных параметров) только число сосудов оказалось значимым при прогнозировании величины резерва. Указано р-value
для модели и коэффициент для модели , из которого можно вычесть коэффициент детерминации. Направления связи значимого предиктора здесь нет... или я неправильно понимаю... мы его для этого же используем?... для направления связи предиктора нам же нужен его коэффициент из многофакторный модели?...
Нет во множественной регрессии никакого одного "коэффициента для модели", их там, как минимум, столько же, сколько предикторов. А вот одно глобальное p таки можно посчитать.
Цитата(ИНО @ 1.07.2022 - 23:05)

Нет во множественной регрессии никакого одного "коэффициента для модели", их там, как минимум, столько же, сколько предикторов. А вот одно глобальное p таки можно посчитать.
А что такое R для модели, из которой % дисперсии вычислить?
Может, таки R-квадрат? Насколько я знаю, он однозначно определен только в МНК-регрессии. Для всех прочих, включая смешанные модели, существуют только всякие "псевдо-R2", и несть им числа (причем все разные).
P.S. Даже забыл уже, что R2 тоже коэффициентом (детерминации) кличут, и не подумал, что речь может идти о нем. С коэффициентами предикторов общего там только слово "коэффициент".
Цитата(ИНО @ 2.07.2022 - 19:16)

Может, таки R-квадрат? Насколько я знаю, он однозначно определен только в МНК-регрессии. Для всех прочих, включая смешанные модели, существуют только всякие "псевдо-R2", и несть им числа (причем все разные).
P.S. Даже забыл уже, что R2 тоже коэффициентом (детерминации) кличут, и не подумал, что речь может идти о нем. С коэффициентами предикторов общего там только слово "коэффициент".
Ну речь шла о статье, там для модели указан R, не в квадрате даже. Дословно из конкретной статьи.
Спасибо
Так то коэффициент корреляции Пирсона, причем парной. Если его возвести в квадрат и получится коэффициент детерминации для однофакторной линейной МНК-регрессии. Но в случае с многофакторной регрессией, а тем более не МНК, все о сложнее. Однако в статье там для обещанного регрессионного моделирования вообще так и не дошли, по крайней мере на рисунках, а ограничились парными корреляциями.
Для просмотра полной версии этой страницы, пожалуйста,
пройдите по ссылке.