Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

7 страниц V  < 1 2 3 4 > »   
Добавить ответ в эту темуОткрыть тему
> Логистическая регрессия, помогите понять
salm
сообщение 30.03.2022 - 18:57
Сообщение #16





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



Цитата(nokh @ 21.03.2022 - 22:33) *
Полагаю, что в диссертации смысла нет. В диссертацию выносятся положения, зависимости и т.д, которые должны выглядеть как бесспорные. Дополнительные указания на то, что ваша модель не работает или не изучена при значении показателя меньше минимального и больше максимального добавляет конкретики, но снижает общность вывода, т.е. вы как бы говорите "вот здесь я изучила, а вот здесь и здесь - нет", хотя вас об этом ещё никто не спрашивал (и вряд ли спросит). Поэтому для себя эти границы держать стоит, особенно если вы будете использовать модель для прогноза, а излишне детализировать при описании в работе - не стоит.

Любой ряд количественных показателей в шкале отношений или интервалов можно переклассифицировать в порядковую шкалу, а все эти шкалы - в качественную бинарную. Ошибки в этом нет, но при огрублении шкалы происходит потеря части информации. Применительно к логистической регрессии количественный показатель будет "работать" во всём диапазоне и без привлечения сторонних данных, а результат работы огрублённого до бинарного показателя будет работать хуже или лучше в зависимости от того, насколько хорошо ваши данные совпали с чьим-то мнением из литературы. Т.е. во-первых идёт огрубление данных, во-вторых - вы вкладываете в свои самодостаточные данные чьё-то левое мнение. Короче, технически сделать бинарный из количественно можно, статистически всё будет корректно, но методологически - будет хуже.

Лень думать...



Спасибо) все понятно!!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
salm
сообщение 6.04.2022 - 23:54
Сообщение #17





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



Не подскажете: как диссертации грамотнообьяснить с какой целью я представляю непрерывнуюпеременную (возраст) как бинарную (до 65 лет и больше). Так делают, но в статьях не вижу никаких пояснений. Мне это необходимосцелью улучшения моделиснесъолькими факторами.
Или просто может, просто статпакет сам отобрал при включении обоих вариантов...?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 7.04.2022 - 10:37
Сообщение #18





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(salm @ 6.04.2022 - 23:54) *
Не подскажете: как диссертации грамотнообьяснить с какой целью я представляю непрерывнуюпеременную (возраст) как бинарную (до 65 лет и больше). Так делают, но в статьях не вижу никаких пояснений. Мне это необходимосцелью улучшения моделиснесъолькими факторами.
Или просто может, просто статпакет сам отобрал при включении обоих вариантов...?


Ну вам же уже все детально разъяснили выше. Вроде бы вам было все понятно. Хотите по третьему кругу пройти?

Если у вас на руках данные, где по каждому больному указан его реальный возраст, а вы почему-то решили перейти к бинарной переменной - то НИКАК вы это не объясните, тем более "грамотно". Тем более, если вы сами этого не понимаете. А если это надо в вашей диссертации объяснять - у вас же медицинская диссертация - то объясняйте это так, как вы будете объяснять пациенту: почему ему, которому 65 лет, вы назначаете одно лечение, а его соседу, которому 64 года - другое. Сможете? Вот так и объясняйте в диссертации.
P.S. "Улучшение" модели с несколькими факторами за счет перехода от количественной шкалы представления данных к номинальной - это вообще бред. Просто другими методами вы пользоваться не умеете (вас не учили, вы сами не научились). Вот так тоже можете объяснить.
А то, что "в статьях" нет объяснений - то учиться надо по учебникам, а не по статьям. Особенно если их писали такие-же "специалисты".

Сообщение отредактировал passant - 7.04.2022 - 10:43
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
salm
сообщение 7.04.2022 - 11:59
Сообщение #19





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



Цитата(passant @ 7.04.2022 - 10:37) *
Ну вам же уже все детально разъяснили выше. Вроде бы вам было все понятно. Хотите по третьему кругу пройти?

Если у вас на руках данные, где по каждому больному указан его реальный возраст, а вы почему-то решили перейти к бинарной переменной - то НИКАК вы это не объясните, тем более "грамотно". Тем более, если вы сами этого не понимаете. А если это надо в вашей диссертации объяснять - у вас же медицинская диссертация - то объясняйте это так, как вы будете объяснять пациенту: почему ему, которому 65 лет, вы назначаете одно лечение, а его соседу, которому 64 года - другое. Сможете? Вот так и объясняйте в диссертации.
P.S. "Улучшение" модели с несколькими факторами за счет перехода от количественной шкалы представления данных к номинальной - это вообще бред. Просто другими методами вы пользоваться не умеете (вас не учили, вы сами не научились). Вот так тоже можете объяснить.
А то, что "в статьях" нет объяснений - то учиться надо по учебникам, а не по статьям. Особенно если их писали такие-же "специалисты".


Специально для Вас: как вы судите по тому какой я "специалист", если даже не знаете чтоу меня за специальность, я этого не озвучивала... форум вроде бы для подобных вопросов, нет?... Кому прям все понятно по специализированной стат литературе вряд ли вообще зайдут на эту ветку...
В любом случае, спасибо,

Сообщение отредактировал salm - 7.04.2022 - 12:00
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 14.04.2022 - 09:47
Сообщение #20





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(salm @ 6.04.2022 - 23:54) *
Не подскажете: как диссертации грамотнообьяснить с какой целью я представляю непрерывнуюпеременную (возраст) как бинарную (до 65 лет и больше). Так делают, но в статьях не вижу никаких пояснений. Мне это необходимосцелью улучшения моделиснесъолькими факторами.
Или просто может, просто статпакет сам отобрал при включении обоих вариантов...?
Предположим - вы исследуете зависимость какого-то заболевания от разных факторов. И вдруг оказалось, что в вашей группе все больные пациенты старше 65 лет и зависимость тяжести (или другой изучаемой характеристики) заболевания от возраста после 65 лет отсутствует или пренебрежимо мала. В этом случае вы можете ограничить диапазон возрастов только двумя значениями: 0 - до 65, 1 - после 65 лет.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
salm
сообщение 10.05.2022 - 17:05
Сообщение #21





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



Доброго времени суток. Подскажите пожалуйста, могу ли я поступить следующим образом...Мне нужно сравнить диагностическую эффективность непрерывных переменных (их 4) с референтным методом (он у меня бинарный) при прогнозировании вероятности некоего исхода (соответственно бинарного) Для этого в рамках построения бинарных прогностических регрессионных моделей сравниваю AUC площади методом Делонга... Мне надо показать что они (количественные) параметры всяко лучше референтного метода (который имеет только два значения).
В итоге у меня 5 однофакторных прогностичсеких моделей для сравнения между собой: различия найдены. Я делаю вывод, что там где они значимые, диагностическая эффективность выше (под эффективностью я подразумеваю большую долю правильных ответов). Могу ли я таким образом доказать большую эффективность диагностического параметра?

Сообщение отредактировал salm - 10.05.2022 - 17:44
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
salm
сообщение 10.05.2022 - 17:45
Сообщение #22





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



Цитата(DoctorStat @ 14.04.2022 - 09:47) *
Предположим - вы исследуете зависимость какого-то заболевания от разных факторов. И вдруг оказалось, что в вашей группе все больные пациенты старше 65 лет и зависимость тяжести (или другой изучаемой характеристики) заболевания от возраста после 65 лет отсутствует или пренебрежимо мала. В этом случае вы можете ограничить диапазон возрастов только двумя значениями: 0 - до 65, 1 - после 65 лет.

Спасибо
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 11.05.2022 - 11:37
Сообщение #23





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(salm @ 10.05.2022 - 18:05) *
в рамках построения бинарных прогностических регрессионных моделей сравниваю AUC площади методом Делонга...

Нет такого метода. Есть предложение группы соавторов сравнивать AUC критерием Манна-Уитни. Данной проблемой занимались многие авторы, а не только процитированные, в том числе есть информация в монографиях В.В. Власова. Кстати, в работе соавторов неверно изображены ROC-кривые.

Сообщение отредактировал Игорь - 11.05.2022 - 11:38


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nzbr
сообщение 13.05.2022 - 15:25
Сообщение #24





Группа: Пользователи
Сообщений: 8
Регистрация: 14.11.2019
Пользователь №: 36891



Цитата(salm @ 6.04.2022 - 23:54) *
Не подскажете: как диссертации грамотнообьяснить с какой целью я представляю непрерывнуюпеременную (возраст) как бинарную (до 65 лет и больше). Так делают, но в статьях не вижу никаких пояснений. Мне это необходимосцелью улучшения моделиснесъолькими факторами.
Или просто может, просто статпакет сам отобрал при включении обоих вариантов...?

Я сталкивался с подобным. Для возраста группы ВОЗ или какую-то возрастную отсечку с круглым числом 40-50-60-65-70 лет. Но возраст как раз проще всего. А вот с другими вещами бывает сложнее. Обычно ориентируются на какие-либо уже предложенные критерии в статьях других авторов. Не случайно "стоим на плечах гигантов".
Возможно вариантом было бы делить по медиане. Может кто-то ответит, подходит ли такой наивный способ.
В любом случае, статистика - это всего лишь инструмент. Мне кажется, главное представить модель в таком виде, что бы коллеги могли понять и использовать.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
salm
сообщение 16.05.2022 - 22:01
Сообщение #25





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



Цитата(Игорь @ 11.05.2022 - 11:37) *
Нет такого метода. Есть предложение группы соавторов сравнивать AUC критерием Манна-Уитни. Данной проблемой занимались многие авторы, а не только процитированные, в том числе есть информация в монографиях В.В. Власова. Кстати, в работе соавторов неверно изображены ROC-кривые.

Ну так поняла, когда залезла в оригинальную работу Делона, это одно и то же.. Ну при сравнении критерий Мана Уитни применяется, так вроде.. Но почему то принято писать по деЛонгу, с ссылками на работы ДеЛонгов (родственники наверное))). Ну я без претензий, я так понимаю, коль он непараметрический, с допущениями попроще, и можно площади под кривыми сравнить (для непрерывных и бинарной переменной) и тем самым показать наличие или отсутствие преимущество диагностической эффективности какого то из параметров? Так ведь?..

Сообщение отредактировал salm - 16.05.2022 - 22:07
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
salm
сообщение 16.05.2022 - 22:05
Сообщение #26





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



Цитата(nzbr @ 13.05.2022 - 15:25) *
Я сталкивался с подобным. Для возраста группы ВОЗ или какую-то возрастную отсечку с круглым числом 40-50-60-65-70 лет. Но возраст как раз проще всего. А вот с другими вещами бывает сложнее. Обычно ориентируются на какие-либо уже предложенные критерии в статьях других авторов. Не случайно "стоим на плечах гигантов".
Возможно вариантом было бы делить по медиане. Может кто-то ответит, подходит ли такой наивный способ.
В любом случае, статистика - это всего лишь инструмент. Мне кажется, главное представить модель в таком виде, что бы коллеги могли понять и использовать.


Спасибо большое за мнение, учту

Дело в том, что мое исследование в области сердечно-сосудистой патологии, самой распространенной и ассоциированной с возрастом. В принципе никого из коллег не смущает такое деление на 65 до и после, так как оно основано на "бесконечных" популяционных исследованиях, ничего не меняется, по крайней мере в данной группе заболеваний. Я просто думала, как то технически (ну я не знаю как еще выразиться) можно данное разделение оформить или описать чисто с точки зрения статистки..Ну и выслушать мнение.. А если речь идет о клинической целесообразности разделения на группы, то это видимо, не проблема (ну я теперь, на сегодня, так вижу)..

Сообщение отредактировал salm - 16.05.2022 - 22:36
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
salm
сообщение 25.05.2022 - 09:53
Сообщение #27





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



и еще: help.gif мне понять смысл AUC при построении прогностических моделей: видимо, я неверно его понимаю. Я их периодически встречаю при сравнении диагностической эффективности методов: мол AUC такой попеременной был больше AUC такой то при диагностике такого то исхода... При этом, одна сравниваемая переменная категориальная или даже бинарная. Именно площадь, как таковая - что она значит?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nzbr
сообщение 6.06.2022 - 07:50
Сообщение #28





Группа: Пользователи
Сообщений: 8
Регистрация: 14.11.2019
Пользователь №: 36891



Цитата(salm @ 30.03.2022 - 09:01) *
А скажите, корректно ли будет один количсетвенный показатель представить как бинарный (по пороговому значению), а другой количественный (но оценивающий тоже биологическое явления) оставить как непрерывный? имею ли я на это право, и стоит ли объяснять почему именно так я делаю? Причина в том, что модель лучше (а именно коэффициент Найджелкерка). И площадь под кривой чуть больше... Меня не интересует расчет вероятности, я провожу анализ монистической регрессии с целью определения значимости каждого фактора в оценке вероятности


Чем больше тем лучше

Площадь под кривой - оценка точности диагностического теста. Грубо говоря варьируется от 0.5 (50/50) до 1 (100%)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ИНО
сообщение 6.06.2022 - 11:25
Сообщение #29





Группа: Пользователи
Сообщений: 204
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Цитата(salm @ 25.05.2022 - 09:53) *
и еще: help.gif мне понять смысл AUC при построении прогностических моделей: видимо, я неверно его понимаю. Я их периодически встречаю при сравнении диагностической эффективности методов: мол AUC такой попеременной был больше AUC такой то при диагностике такого то исхода... При этом, одна сравниваемая переменная категориальная или даже бинарная. Именно площадь, как таковая - что она значит?

А объясняемая - бинарная, AUC про это. Больший AUC означает лучшее соотношение чувствительности и специфичности, то есть лучшее качество классификатора (в вашей случае - модели, прогнозирующей исход). Только надо учитывать, что если ROC-кривые построены по тем же данным, на которых обучались модели, то практической пользы в сравнении AUC мало.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
salm
сообщение 30.06.2022 - 22:55
Сообщение #30





Группа: Пользователи
Сообщений: 62
Регистрация: 6.12.2021
Пользователь №: 39615



Здравствуйте еще раз!!! А я могу использовать логистичсекую регрессию следующим образом: мне надо оценить вероятность конкретного исхода с включением нескольких факторов (насильно загнать их в модель) с той целью, что бы продемонстрировать, что среди учтенных факторов (тех, которым все мы привыкли, целесообразные с практической точки зрения) какие то сохраняют значимое влияние (с направлением связи, скорректирован ОШ), а какие то теряют значимость... При этом, не указывать самой формулы с коэффициентами.
Короче, взять только ОШ в модели для предикторов что бы показать что вот конкретные факторы, например величина кровотока и возраст влияют на исход, а пол, наличие диабета, курение и еще что то - НЕзначимые, тем самым показать что возраст и величина кровотока объясняют то влияние на исход, которое имело (но частично) по отдельности диабет, курение и пол...
Вот такой вывод возможен? Ну еси Хи2 для всей модели значимость есть и допущения на линейность, независимость и коллинеарность я проверю.. Ну то есть самамодель , выходит, меня не интересует и применять ее я не собираюсь.Не я придумала такое, просто часто вижу... Так можно?

Сообщение отредактировал salm - 30.06.2022 - 23:03
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

7 страниц V  < 1 2 3 4 > » 
Добавить ответ в эту темуОткрыть тему