Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V  < 1 2 3 >  
Добавить ответ в эту темуОткрыть тему
> help анализ частоты осложнений, логистическая регрессия и все, все, все, анализ данных
DrgLena
сообщение 8.12.2007 - 01:23
Сообщение #16





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Спасибо за полезную информацию. Я использую термин "согласованное" значение OR, поскольку стандартизированные - имеют метематически другое значение (типа стандартизированные коэффициенты уравнения регрессии). А согласованное значение появляется, если в уравнение множественной регрессии вводят новый член уравнения, например возраст, который согласовывает или приспосабливает коээффициенты с учетом влияния возраста. После этого OR может измениться вследствии этого согласования и появляется adjusted for age.
ПО ROC анализу Власов пишет, что он редко используется. Я его использую, возможно слишком часто, поскольку его рассматривают как инструмент диагностики. А можно ли его использовать для прогноза отсроченного состояния, т.е. создавать прогностический тест?
Эта ветка врачей-аспирантов не увлекла.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 8.12.2007 - 13:20
Сообщение #17





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Что касается терминологии, то тут могут быть разные точки зрения. Мне кажется, что лучше использовать слова откорректированные и не откорректированные отношения шансов, поскольку самое главное ради чего делается многомерный анализ - выделить независимое от других показтелей влияние данного фактора на исход, откорректировать различия между группами по всем факторам, кроме анализируемого. Слово "коррекция" в данной ситуации кажется более очевидным, чем "согласование"
Что касается же создания прогностического теста, то сама логистическая регрессия очень часто используется для создания прогностических шкал (одной из первых была Фрмингемская шкала риска развития ССЗ). При этом используется, естественно, не сам анализ характеристических кривых (ибо он приспособлен для сравнения разных источников информации - откуда и название - тест вроде бы был сконструирован во время второй мировой войны для определения способности различать сигнал на фоне шума при радиопередачах разный _характер_ восприятия информации в зависимости от силы сигнала и размера шума). Строго говоря, для создания прогностической шкалы берут проспективно полученные данные, затем ищут точку наилучшего разделения (чаще всего ту, что ближе всего к левому верхнему углу на графике характеристической кривой), либо делят всю шкалу рассчитанных по логистической регрессии вероятностей на интервалы и описывают их как возможные значения вероятности развития, например, ИБС за определенный промежуток времени.
Я не очень люблю для этих целей логистическую регрессию, поскольку она не учитывает время, а, как говорил Дж.М.Кейнс "В долгосрочной перспективе мы все мертвы". Кроме того у нее очевидные проблемы тем, что оцениваются отношения шансов, а не относительный риск. Поэтому лучше для построения прогностических моделей пользоваться либо моделью Кокса (в случае бинарных исходов), либо Пуассоновой регрессией. Последняя, кстати, наиболее удобна для построения шкал
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 9.12.2007 - 01:47
Сообщение #18





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Логистическую регрессию гораздо легче описывать в предметной области. Простые ясные трактовки коэффициентов и созданиие групп риска по набору факторов риска. Лнгко привести пример, как работает модель для конкретного больного. Знаю, и потому люблю. Кокс регрессионные модели использую, но не люблю. Поскольку мало представить значения exp (b), объяснить их величину и следовательно вклад в регрессию. Нужно еще знать, что делать потом, когда перед вами конкретный больной, вы подставляете значения его предикторов и.... Нужно вводить понятие базовый риск. Приводить кривую Каплан-Мейера для средних значений предикторов, и только после этого можно показать, где будет проходить кривая выживания для этого больного. Обычно медицинские статьи заканчиваются только представлением коэффициентов. До конца никто не доходит, чтобы эти уравнения использовать. Или я не права?
Пуассонову регрессию не знаю, очевидно - это SAS. Но я по SAS только книжку в руках держала, думаю Вашу! Жалею, что не купила. В сентябре была в Москве, ее уже нет.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 11.12.2007 - 22:02
Сообщение #19





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



На самом деле с Коксовской регрессией все не сложнее, чем с логистической. Если Вы имеете набор предикторов, то подставляя их значения в формулу получаете, насколько риск у одного пациента выше, чем у другого. Тот же результат в принципе получается и для логистической регрессии. В том случае, если надо оценить абсолютный риск для пациента, то тогда Вам нужен базовый риск, но, опять-таки он может быть достаточно легко рассчитан как средний риск по группе (например, риск на человеко-года наблюдения). И тогда индивидуальный риск равен среднему риску, умноженному на относительный риск. Логистическая регрессия дает такие же результаты, только время не учитывается.
Пуассонова регрессия относится к семейству логлинейных моделей и реализована (нормально) в SAS, Stata и R (в последнем пакете используется процедура, предназначенная для анализа модели пропорционального риска - т.е. модели Кокса). Если есть доступ к какому-либо из этих пакетов могу привести соответствующий код. Преимущество Пуассоновой регрессии в том, что она позволяет оценить относительный риск (RR), а не отношение шансов (OR), что значительно приятнее для когортных исследований. Кроме того, можно напрямую рассчитать абсолютный риск для пациента с заранее заданной комбинацией предикторов (а, соответственно, например можно оценить количество лиц, которых надо лечить для предотвращения одного исхода - NNT после коррекции по различий между группами по факторам риска).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 12.12.2007 - 02:10
Сообщение #20





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Спасибо, я имею только Stata 6.0. Но использовала ее очень давно и только однажды в 2000-1? году, меня привлекли к анализу данных по международному проекту (синдром внезапной детской смертности). Сопроводительные документы содержали специальный том по анализу данных, где было подробно описано как провести логистическую регрессию и анализ нужно было выполнить непременно в Stata 6.0. А дальше только help программы. И ROC после регрессии там тоже хорошо получился. Хоть график и был не в графическом, а в текстовом режиме. Но после работы с "кнопочными" программами - вернуться к Stata - это тяжелый труд, нужен стимул и интересная задача, которая бы требовала такого подхода. Постараюсь поискать в инете реализацию Пуассоновской регрессии в медицинских приложениях. Есть ли у вас такие ссылки?.
Есть ли информация о конференциях или семинарах в России по анализу данных и доказательной медицине.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 12.12.2007 - 13:47
Сообщение #21





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Подробное описание с примерами на S есть в книге S.Selvin. Modern Applied Biostatistical methods. Краткий обзор можно найти в следующей статье http://www.unipr.it/arpa/facvet/annali/2006/025_044.pdf
Статьи в которых описывалось использование этого вида регрессии были опубликованы в Am.J.Epidemiology и доступны для просмотра
http://aje.oxfordjournals.org/cgi/content/full/159/7/702
и
http://aje.oxfordjournals.org/cgi/content/full/162/3/199
Обратите внимание внизу страниц список статей, которые цитировали эти статьи, т.е. тех, которые использовали предложенную методологию в разных областях медицины.
Stata 8 (насчет шестерки, просто не помню) дает график ROC кривой (нормальный график, не текстовой) с рассчитанной площадью под кривой по команде lroc. Кроме того диагностическая информация включая чувствительность, специафичность и проч. превосходит все, что только может выдать, например, Statistica (известно, что с точки зрения анализа качественных переменных Stata одна из лучших программ).
На самом деле "кнопочные" программы хуже, чем программы командной строки, если только человеку не надо сделать одну задачу и затем забыть об анализе данных. Можно просто сесть с секундомером и подсчитать, сколько времени уходит на обработку данных (с учетом необходимости чистки данных, трансформации переменных и т.п.) в "кнопочной" программе и программе командной строки. А для повторяющихся задач!
И это уж не говоря о том, что кнопочные программы ригидны и не позволяют реализовывать новые методы или это делается очень сложно.
Кстати для облегчения перехода у Stata сейчас есть очень удобная система меню (а у SAS - Enterprise Guide и SAS/Assist). Почти все (общие) команды можно вызвать через систему меню (у SAS небольшой поднабор) и так потихоньку выучить и язык.
Почитайте письма забугорных статистиков о кнопочных программах
http://www.pubhealth.spb.ru/SAS/point.htm
http://www.pubhealth.spb.ru/SAS/point2.htm (особенно интересно второе письмо)
Я, конечно, понимаю, что плыву против течения, но капля ведь и камень точит smile.gif
Что касается семинаров - вроде сейчас много кто проводит... В СПб МАПО (С.Петербург) цикл по ДМ и биостатистике проводится раз в год в декабре, этим летом должна быть Летняя школа посвященная этим вопросам, организуемая ОИЗ в Москве. Ряд мероприятий проводит ОСДМ (www.osdm.org). Хотя, к сожалению, чаще всего конференции строятся по принципу "что такое РКИ, как плохо с наукой, какой плохой t-тест. Да здравствует тест Вилкоксона, отношения шаносв и хи2!". Обсуждения реально современных методов наблюдается достаточно редко и и еще реже того, как интерпретировать полученные результаты, где подводные камни интерпретации и т.п.
Интересная дискуссия в этой связи была на страницах международного журнала медицинской практики
http://www.mediasphera.ru/journals/practik/2006/2/
http://www.mediasphera.ru/journals/practik/338/
Лучше отформатированная версия статей в МЖМП 2006 года на сайте Леонова
http://www.biometrica.tomsk.ru/MJMP_2_2006.htm
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 12.12.2007 - 21:05
Сообщение #22





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Большое спасибо!
Вполне достаточно информации, чтобы взяться за дело и применить пуассонову регрессию.
Информация с сайтов Леонова и МЖМП у меня есть. Сейчас они кое-что прикрыли и нет в полном доступе. Леонову я даже посылала свои работы в сборник "Вероятностные идеи в науке и философии", там был медицинский раздел, в 2003 году. Но, когда я встретила его собственную статью о влиянии солнечной активности на частоту врожденных уродств, то поняла, что и на Солнце бывают пятна, а генетики рядом с Леоновым отдыхают. Особенно удивила его мысль пользе обращения причинно-следственных связей в его работе по гинекологическим заболеваниям матерей и дочерей, из которой следует, что по гинекологическому здоровью дочери- студентки можно сделать вывод о здоровье матери. Это о трактовке и биологическом смысле результатов анализа данных.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Elene
сообщение 25.12.2007 - 16:00
Сообщение #23





Группа: Пользователи
Сообщений: 1
Регистрация: 25.12.2007
Пользователь №: 4651



Здравствуйте!
Помогите, пожалуйста! Мне нужно вычислить вероятность осуществления некоторого события (например, выживаемости), имея вероятности выживаемости в группах нескольких признаков. Например, есть вероятность выживания в зависимости от возраста; вероятность в зависимости от веса, пола (например) и др. Что нужно сделать с этими тремя вероятностями, чтобы получить одну общую? (зная возраст, вес и пол)?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 26.12.2007 - 23:47
Сообщение #24





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Надо поточнее описать задачу. Выживаемость не имеет вероятности, они и есть вероятность (вероятность прожить х лет/месяцев/дней). Если у Вас есть время до момента наступления события (смерти или окончания исследования), то надо пользоваться методами анализа выживаемости, предпочтительно моделью пропорционального риска Коска, куда и включить все интересующие Вас переменные (возраст, вес и пол). Если у Вас нет данных о времени наблюдения, значит выживаемость Вы оценить не можете, а оцениваете только вероятность наступления события (дожил человек до конца исследования или нет). Тогда Вам нужна логистическая регрессия.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 29.12.2007 - 01:51
Сообщение #25





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Я думаю Elene не четко сформулировала задачу. Возможно, она состоит в том, чтобы имея exp коэф., (которые часто трактуют как вероятность) по трем показателям посчитать вероятность выживания. Такие вопросы возникают, когда в публикациях приводятся эти коэффициенты и возикают вопросы у читателей, как их использовать для своих больных.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Galka_gf
сообщение 4.11.2008 - 10:59
Сообщение #26





Группа: Пользователи
Сообщений: 4
Регистрация: 31.10.2008
Пользователь №: 5470



Здравствуйте, уважаемый Плав!
У меня есть несколько давно наболевших вопросов, относительно логистической регрессии. К сожалению, самостоятельно никак не могу с ними справится.
Во многих зарубежных статьях встречаются такого рода цитаты: Adjusted for age, sex, ets....
Вопросы:
Как выполнить этот adjustment, как определить независимые переменные, по которым он выполняется.
Пробовала выполнить расчеты в SAS 9.1, пользуясь Вашей книгой, но в резултат анализа не содержал данных, полностью соответствующих структуре описанной в книге.
Опять же, остаются вопросы, изложенные выше, относительно набора переменных, которые будут влиять на Odds.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 4.11.2008 - 17:49
Сообщение #27





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Galka_gf @ 4.11.2008 - 10:59) *
Здравствуйте, уважаемый Плав!
У меня есть несколько давно наболевших вопросов, относительно логистической регрессии. К сожалению, самостоятельно никак не могу с ними справится.
Во многих зарубежных статьях встречаются такого рода цитаты: Adjusted for age, sex, ets....
Вопросы:
Как выполнить этот adjustment, как определить независимые переменные, по которым он выполняется.
Пробовала выполнить расчеты в SAS 9.1, пользуясь Вашей книгой, но в резултат анализа не содержал данных, полностью соответствующих структуре описанной в книге.
Опять же, остаются вопросы, изложенные выше, относительно набора переменных, которые будут влиять на Odds.

Adjusted for age, sex и т.д. означает просто, что в логистической регрессионной модели были включены переменные пол и возраст. Т.е. если вы создали модель, например:
PROC LOGISTIC DESCENDING;
MODEL Isxod=age sex treatment;
RUN;
то полученные отношения шансов для treatment будут как раз age and sex adjusted...
CODE
The LOGISTIC Procedure

Analysis of Maximum Likelihood Estimates

Standard Wald
Parameter DF Estimate Error Chi-Square Pr > ChiSq

Intercept 1 -5.2417 0.3139 278.8676 <.0001
AGE 1 0.1060 0.00639 275.7084 <.0001
EDHIGH 1 -0.5383 0.0906 35.3186 <.0001
EDLOW 1 0.4655 0.0833 31.2356 <.0001


Odds Ratio Estimates

Point 95% Wald
Effect Estimate Confidence Limits

AGE 1.112 1.098 1.126
EDHIGH 0.584 0.489 0.697
EDLOW 1.593 1.353 1.875


Association of Predicted Probabilities and Observed Responses

Percent Concordant 68.8 Somers' D 0.393
Percent Discordant 29.5 Gamma 0.399
Percent Tied 1.7 Tau-a 0.196
Pairs 3812130 c 0.696

Выше приведена распечатка в 9.1 она, немного отличается от того, что в книге (там даже в примечании указано, что в книге - с версии 6.12, команды же аналогичны книжным), однако не сильно. Основное различие, что доверительные интервалы для переменных вынесены в отдельный блок. Соответственно, по сравнению с лицами, имеющими среднее образование, лица не закончившие даже среднюю школу имеют шансы умереть в 1,59 раз выше (95%ДИ=1,35-1,87). Вот это отношение шансов является откорректированным на возраст (age-adjusted), поскольку возраст включен в модель.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Galka_gf
сообщение 5.11.2008 - 07:26
Сообщение #28





Группа: Пользователи
Сообщений: 4
Регистрация: 31.10.2008
Пользователь №: 5470



т.е. коррекция проводится только в случае включения в модель количественных переменных? А если я закодирую возраст в виде нескольких дихотомических переменных, то никакой коррекции не будет выполнено (она просто будет не нужна).
В случае с количественным возрастом я должна буду указать в сноске: "Adjusted for age, sex, treatment"? или нет?

"...то полученные отношения шансов для treatment будут как раз age and sex adjusted..." и почему для treatment а не для Isxod?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 5.11.2008 - 13:41
Сообщение #29





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Galka_gf @ 5.11.2008 - 07:26) *
т.е. коррекция проводится только в случае включения в модель количественных переменных? А если я закодирую возраст в виде нескольких дихотомических переменных, то никакой коррекции не будет выполнено (она просто будет не нужна).
В случае с количественным возрастом я должна буду указать в сноске: "Adjusted for age, sex, treatment"? или нет?

"...то полученные отношения шансов для treatment будут как раз age and sex adjusted..." и почему для treatment а не для Isxod?

1) Нет, коррекция по всем внесенным в модель переменным (строго говоря, процедура не знает, что такое качественные переменные, путем использования дихотомических переменных мы систему "обманываем")
2) Потому, что мы брали отношение шансов для treatment. ISxod - это зависимая переменная, шансы которой как раз меняются под воздействием treatment.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Galka_gf
сообщение 6.11.2008 - 12:12
Сообщение #30





Группа: Пользователи
Сообщений: 4
Регистрация: 31.10.2008
Пользователь №: 5470



Я так понимаю, что переменные в модели согласовываются относительно друг друга, или масштабируются, или приводятся к одному "формату", для того, чтобы в дальнейшем их можно было интерпретировать.
В одной из статей нашла вот такую фразу: "Tests statistical significance of adding corresponding variables to the model adjusted for all other variables."
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

3 страниц V  < 1 2 3 >
Добавить ответ в эту темуОткрыть тему