Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Предикторы и маркёры

Автор: Anna_V 31.01.2020 - 11:46

Добрый день. Подскажите, пожалуйста, есть ли где-то официальное определение предиктора чего-либо и маркёра. В каких случаях какой термин корректно использовать. Будет здорово, если будут конкретные ссылки. Спасибо!

Автор: Marinheiro 28.02.2020 - 22:08

Не встречал. Попробуйте по контексту подобрать литературу (книги или статьи). "Предикторы", например, есть не только в клинике (предиктор заболевания - симптом, проявление, предвестник), но и в статистике (переменная-предиктор) и т.д.

Автор: salm 23.01.2022 - 17:03

Может кто-нибудь подскажет: в понятии "независимый предиктор" что означает "независимый"))? Меня интересует расчет вероятности в модели логистической регрессии. те факторы что значимые в модели и поодиночке?

Автор: passant 23.01.2022 - 18:13

Цитата(salm @ 23.01.2022 - 16:03) *
Может кто-нибудь подскажет: в понятии "независимый предиктор" что означает "независимый"))? Меня интересует расчет вероятности в модели логистической регрессии. те факторы что значимые в модели и поодиночке?


В любой модели относящейся к статистике, машинному обучению, глубокому обучению и пр., тогда, когда вы рассматриваете объект не препарируя его, а анализируя некоторые доступные характеристики, как правило - изменяющиеся во времени, (почти) всегда можно сказать (или считать) что одни из этих характеристики изменяются независимо, а другие - зависят от значений первых. Так вот эти первые характеристики (параметры, предикторы - в разных методах их называют по разному) называют "независимыми", а вторые - "зависимые".
Ну, например, зависимость артериального давления от веса пациента. Тут понятно, считаем, что вес "независимая", или "входная" переменная, а давление - "выходная" или "зависимая" переменная. Разумеется, "вес" зависит от многих факторов, но в данной задачи мы ними пренебрегаем. И строим модель зависимости Давление = F(Вес). Сама F может быть и функцией (регрессии, корреляции....) и нейросетью, и даже алгоритмом (как правило, реализованным программно) или просто неким словесным описанием (ну тогда, разумеется науки/математики там будет мало).
Вот как-тот так.

Р.S.Что означает ваша фраза "те факторы что значимые в модели и поодиночке?" понять не получается.

Автор: passant 23.01.2022 - 18:16

.....э.

Автор: salm 23.01.2022 - 22:36

Спасибо Вам огромное за отклик
Я имела ввиду не понятие зависимой или независимой переменной
В оценке ОШ при оценке вероятности при помощи бинарной логистической регрессии или при оценке прогноза например, часто можно встретить (очень часто на самом деле) такие фразы типа: при построении модели логистической регрессии... такой то фактор являлся независимым предиктором исхода... Я не могу понять: имеется ввиду сохранение значимого влияния на исход в модели регрессии с учетом кофакторов (ADJUSTED) при значимом влиянии CRUDE OR, или только при встраивании этого фактора в модели оценки вероятности..
Может, опять неправильно выразилась, извините заранее
Спасибо в любом случае

Автор: passant 24.01.2022 - 15:07

Не знаю, правильно-ли я ваш вопрос понял, но тем не менее.
Смотрите. Логистическая регрессия, независимо от того, как она реализуется, пусть даже и средствами нейросети (что вовсе не обязательно) , по сути это некая модель, которая дает результат, который нормируется в диапазоне от 0 до 1 (и тогда может интерпретироваться как вероятность выбора решения или уверенности в нем) либо вообще формируется в виде значений 0 и 1, (т.е. "да-нет", "принадлежит классу" - "не принадлежит классу", "больной-здоровый" и пр). Никаких других предикторов (зависимых переменных) кроме тех, что подаются на вход вашей модели нет. И быть не может. И никакой предиктор отдельно не "встраивается" в модель на этапе принятия решения.
Правда надо сказать, что во многих методах используется такой (пред)этап как Feature engineering, т.е. отбор (а возможно и конструирование) наиболее информативных признаков. На основании этих признаков в дальнейшем и строиться модель. А вот при использовании нейросетевых моделей этот этап как бы "встраивается" в саму нейростеть, т.е. (надеются, что) за счет подбора соответствующих весов связей нейросеть сама решает, какие параметры или их объединения более информативны, а какие менее.


Автор: nokh 24.01.2022 - 16:57

Цитата(salm @ 23.01.2022 - 19:03) *
Может кто-нибудь подскажет: в понятии "независимый предиктор" что означает "независимый"))? Меня интересует расчет вероятности в модели логистической регрессии. те факторы что значимые в модели и поодиночке?

Просто не очень грамотные авторы умничали и ввели вас в заблуждение. Если груз отправляется обычной ж/д, а мы напишем, что отправили его "рельсовой ж/д" то это ничего не даст, кроме как введёт в замешательство: "по рельсам - да, по ж/д - да, а это как? может есть нерельсовые ж/д, а может монорельсовая, тогда почему написали просто по рельсовой и т.д.... ". Так и здесь: ага, написали "независимые предикторы", наверное есть и зависимые, а я про это ничего не знаю... Все нормально. Читаем такое - повышаем бдительность, возможно эти авторы ещё чего-нибудь отчебучат, а мы всё за чистую монету...

Есть независимые переменные - регрессоры (с акцентом на проведение анализа регрессионными техниками), или предикторы (с акцентом на то, что на основе установленной зависимости будет делаться какой-то прогноз), а есть зависимые - отклики. Как уже ответили выше, никаких "зависимых предикторов" не существует. Если в анализ вводятся дополнительные переменные, не являющиеся сильными самостоятельными факторами, а как-то модифицирующие действие последних, но которые также хочется учесть в модели, то их можно назвать ковариатами. Но в модели множественной логистической регрессии такие ковариаты - скорее логические, поскольку анализируются наравне с другими предикторами с получением взаимно согласованных (adjusted) оценок.

Если же авторы использовали термин "независимый" применительно к тому в какой регрессии проводилась его оценка - в бинарной или множественной, то с авторами всё ещё хуже: они не умничали, а использовали уже занятый в науке (и даже конкретной её области) термин с приданием ему другого смысла. Использование занятых терминов в науке недопустимо, т.к. термины вводятся для оптимизации информационного обмена, а не для введения коллег в замешательство.

Автор: DoctorStat 24.01.2022 - 21:51

Цитата(salm @ 23.01.2022 - 17:03) *
Может кто-нибудь подскажет: в понятии "независимый предиктор" что означает "независимый"))? Меня интересует расчет вероятности в модели логистической регрессии. те факторы что значимые в модели и поодиночке?

Возьмем для примера прогноз длины растения в зависимости от количества осадков (X) и солнечных дней (Y). Чем больше того и другого, тем длиннее растение. А теперь зададимся вопросом: являются ли переменные (предикторы) X и Y связанными (зависимыми) и в какой степени? Т.е. когда светит солнце, то льет дождь или все происходит с точностью до наоборот, или эти события никак не связаны? Для этого в статистике вводится специальный коэффициент, который называется коэффициентом корреляции. Его значение показывает меру связи между двумя случайными переменными. Если связь сильная, то можно избавиться от одной из двух переменных, заменяя ее линейной функцией другой переменной.

Автор: Игорь 26.01.2022 - 09:21

Цитата(passant @ 24.01.2022 - 15:07) *
Не знаю, правильно-ли я ваш вопрос понял, но тем не менее.
Смотрите. Логистическая регрессия, независимо от того, как она реализуется, пусть даже и средствами нейросети (что вовсе не обязательно)

Логистическая регрессия - простейший случай нейронной сети.

Автор: Игорь 26.01.2022 - 09:27

Цитата(DoctorStat @ 24.01.2022 - 21:51) *
Его значение показывает меру связи между двумя случайными переменными. Если связь сильная, то можно избавиться от одной из двух переменных, заменяя ее линейной функцией другой переменной.


Проблема мультиколлинеарности решается по алгоритму Фаррара-Глаубера. Изложено Бородич С.А., Ферстер Э. с соавт. и Айвазян С.А. с соавт.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)