help анализ частоты осложнений, логистическая регрессия и все, все, все, анализ данных |
Здравствуйте, гость ( Вход | Регистрация )
help анализ частоты осложнений, логистическая регрессия и все, все, все, анализ данных |
8.12.2007 - 01:23
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Спасибо за полезную информацию. Я использую термин "согласованное" значение OR, поскольку стандартизированные - имеют метематически другое значение (типа стандартизированные коэффициенты уравнения регрессии). А согласованное значение появляется, если в уравнение множественной регрессии вводят новый член уравнения, например возраст, который согласовывает или приспосабливает коээффициенты с учетом влияния возраста. После этого OR может измениться вследствии этого согласования и появляется adjusted for age.
ПО ROC анализу Власов пишет, что он редко используется. Я его использую, возможно слишком часто, поскольку его рассматривают как инструмент диагностики. А можно ли его использовать для прогноза отсроченного состояния, т.е. создавать прогностический тест? Эта ветка врачей-аспирантов не увлекла. |
|
8.12.2007 - 13:20
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Что касается терминологии, то тут могут быть разные точки зрения. Мне кажется, что лучше использовать слова откорректированные и не откорректированные отношения шансов, поскольку самое главное ради чего делается многомерный анализ - выделить независимое от других показтелей влияние данного фактора на исход, откорректировать различия между группами по всем факторам, кроме анализируемого. Слово "коррекция" в данной ситуации кажется более очевидным, чем "согласование"
Что касается же создания прогностического теста, то сама логистическая регрессия очень часто используется для создания прогностических шкал (одной из первых была Фрмингемская шкала риска развития ССЗ). При этом используется, естественно, не сам анализ характеристических кривых (ибо он приспособлен для сравнения разных источников информации - откуда и название - тест вроде бы был сконструирован во время второй мировой войны для определения способности различать сигнал на фоне шума при радиопередачах разный _характер_ восприятия информации в зависимости от силы сигнала и размера шума). Строго говоря, для создания прогностической шкалы берут проспективно полученные данные, затем ищут точку наилучшего разделения (чаще всего ту, что ближе всего к левому верхнему углу на графике характеристической кривой), либо делят всю шкалу рассчитанных по логистической регрессии вероятностей на интервалы и описывают их как возможные значения вероятности развития, например, ИБС за определенный промежуток времени. Я не очень люблю для этих целей логистическую регрессию, поскольку она не учитывает время, а, как говорил Дж.М.Кейнс "В долгосрочной перспективе мы все мертвы". Кроме того у нее очевидные проблемы тем, что оцениваются отношения шансов, а не относительный риск. Поэтому лучше для построения прогностических моделей пользоваться либо моделью Кокса (в случае бинарных исходов), либо Пуассоновой регрессией. Последняя, кстати, наиболее удобна для построения шкал |
|
9.12.2007 - 01:47
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Логистическую регрессию гораздо легче описывать в предметной области. Простые ясные трактовки коэффициентов и созданиие групп риска по набору факторов риска. Лнгко привести пример, как работает модель для конкретного больного. Знаю, и потому люблю. Кокс регрессионные модели использую, но не люблю. Поскольку мало представить значения exp (b), объяснить их величину и следовательно вклад в регрессию. Нужно еще знать, что делать потом, когда перед вами конкретный больной, вы подставляете значения его предикторов и.... Нужно вводить понятие базовый риск. Приводить кривую Каплан-Мейера для средних значений предикторов, и только после этого можно показать, где будет проходить кривая выживания для этого больного. Обычно медицинские статьи заканчиваются только представлением коэффициентов. До конца никто не доходит, чтобы эти уравнения использовать. Или я не права?
Пуассонову регрессию не знаю, очевидно - это SAS. Но я по SAS только книжку в руках держала, думаю Вашу! Жалею, что не купила. В сентябре была в Москве, ее уже нет. |
|
11.12.2007 - 22:02
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
На самом деле с Коксовской регрессией все не сложнее, чем с логистической. Если Вы имеете набор предикторов, то подставляя их значения в формулу получаете, насколько риск у одного пациента выше, чем у другого. Тот же результат в принципе получается и для логистической регрессии. В том случае, если надо оценить абсолютный риск для пациента, то тогда Вам нужен базовый риск, но, опять-таки он может быть достаточно легко рассчитан как средний риск по группе (например, риск на человеко-года наблюдения). И тогда индивидуальный риск равен среднему риску, умноженному на относительный риск. Логистическая регрессия дает такие же результаты, только время не учитывается.
Пуассонова регрессия относится к семейству логлинейных моделей и реализована (нормально) в SAS, Stata и R (в последнем пакете используется процедура, предназначенная для анализа модели пропорционального риска - т.е. модели Кокса). Если есть доступ к какому-либо из этих пакетов могу привести соответствующий код. Преимущество Пуассоновой регрессии в том, что она позволяет оценить относительный риск (RR), а не отношение шансов (OR), что значительно приятнее для когортных исследований. Кроме того, можно напрямую рассчитать абсолютный риск для пациента с заранее заданной комбинацией предикторов (а, соответственно, например можно оценить количество лиц, которых надо лечить для предотвращения одного исхода - NNT после коррекции по различий между группами по факторам риска). |
|
12.12.2007 - 02:10
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Спасибо, я имею только Stata 6.0. Но использовала ее очень давно и только однажды в 2000-1? году, меня привлекли к анализу данных по международному проекту (синдром внезапной детской смертности). Сопроводительные документы содержали специальный том по анализу данных, где было подробно описано как провести логистическую регрессию и анализ нужно было выполнить непременно в Stata 6.0. А дальше только help программы. И ROC после регрессии там тоже хорошо получился. Хоть график и был не в графическом, а в текстовом режиме. Но после работы с "кнопочными" программами - вернуться к Stata - это тяжелый труд, нужен стимул и интересная задача, которая бы требовала такого подхода. Постараюсь поискать в инете реализацию Пуассоновской регрессии в медицинских приложениях. Есть ли у вас такие ссылки?.
Есть ли информация о конференциях или семинарах в России по анализу данных и доказательной медицине. |
|
12.12.2007 - 13:47
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Подробное описание с примерами на S есть в книге S.Selvin. Modern Applied Biostatistical methods. Краткий обзор можно найти в следующей статье http://www.unipr.it/arpa/facvet/annali/2006/025_044.pdf
Статьи в которых описывалось использование этого вида регрессии были опубликованы в Am.J.Epidemiology и доступны для просмотра http://aje.oxfordjournals.org/cgi/content/full/159/7/702 и http://aje.oxfordjournals.org/cgi/content/full/162/3/199 Обратите внимание внизу страниц список статей, которые цитировали эти статьи, т.е. тех, которые использовали предложенную методологию в разных областях медицины. Stata 8 (насчет шестерки, просто не помню) дает график ROC кривой (нормальный график, не текстовой) с рассчитанной площадью под кривой по команде lroc. Кроме того диагностическая информация включая чувствительность, специафичность и проч. превосходит все, что только может выдать, например, Statistica (известно, что с точки зрения анализа качественных переменных Stata одна из лучших программ). На самом деле "кнопочные" программы хуже, чем программы командной строки, если только человеку не надо сделать одну задачу и затем забыть об анализе данных. Можно просто сесть с секундомером и подсчитать, сколько времени уходит на обработку данных (с учетом необходимости чистки данных, трансформации переменных и т.п.) в "кнопочной" программе и программе командной строки. А для повторяющихся задач! И это уж не говоря о том, что кнопочные программы ригидны и не позволяют реализовывать новые методы или это делается очень сложно. Кстати для облегчения перехода у Stata сейчас есть очень удобная система меню (а у SAS - Enterprise Guide и SAS/Assist). Почти все (общие) команды можно вызвать через систему меню (у SAS небольшой поднабор) и так потихоньку выучить и язык. Почитайте письма забугорных статистиков о кнопочных программах http://www.pubhealth.spb.ru/SAS/point.htm http://www.pubhealth.spb.ru/SAS/point2.htm (особенно интересно второе письмо) Я, конечно, понимаю, что плыву против течения, но капля ведь и камень точит Что касается семинаров - вроде сейчас много кто проводит... В СПб МАПО (С.Петербург) цикл по ДМ и биостатистике проводится раз в год в декабре, этим летом должна быть Летняя школа посвященная этим вопросам, организуемая ОИЗ в Москве. Ряд мероприятий проводит ОСДМ (www.osdm.org). Хотя, к сожалению, чаще всего конференции строятся по принципу "что такое РКИ, как плохо с наукой, какой плохой t-тест. Да здравствует тест Вилкоксона, отношения шаносв и хи2!". Обсуждения реально современных методов наблюдается достаточно редко и и еще реже того, как интерпретировать полученные результаты, где подводные камни интерпретации и т.п. Интересная дискуссия в этой связи была на страницах международного журнала медицинской практики http://www.mediasphera.ru/journals/practik/2006/2/ http://www.mediasphera.ru/journals/practik/338/ Лучше отформатированная версия статей в МЖМП 2006 года на сайте Леонова http://www.biometrica.tomsk.ru/MJMP_2_2006.htm |
|
12.12.2007 - 21:05
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Большое спасибо!
Вполне достаточно информации, чтобы взяться за дело и применить пуассонову регрессию. Информация с сайтов Леонова и МЖМП у меня есть. Сейчас они кое-что прикрыли и нет в полном доступе. Леонову я даже посылала свои работы в сборник "Вероятностные идеи в науке и философии", там был медицинский раздел, в 2003 году. Но, когда я встретила его собственную статью о влиянии солнечной активности на частоту врожденных уродств, то поняла, что и на Солнце бывают пятна, а генетики рядом с Леоновым отдыхают. Особенно удивила его мысль пользе обращения причинно-следственных связей в его работе по гинекологическим заболеваниям матерей и дочерей, из которой следует, что по гинекологическому здоровью дочери- студентки можно сделать вывод о здоровье матери. Это о трактовке и биологическом смысле результатов анализа данных. |
|
25.12.2007 - 16:00
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 1 Регистрация: 25.12.2007 Пользователь №: 4651 |
Здравствуйте!
Помогите, пожалуйста! Мне нужно вычислить вероятность осуществления некоторого события (например, выживаемости), имея вероятности выживаемости в группах нескольких признаков. Например, есть вероятность выживания в зависимости от возраста; вероятность в зависимости от веса, пола (например) и др. Что нужно сделать с этими тремя вероятностями, чтобы получить одну общую? (зная возраст, вес и пол)? |
|
26.12.2007 - 23:47
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Надо поточнее описать задачу. Выживаемость не имеет вероятности, они и есть вероятность (вероятность прожить х лет/месяцев/дней). Если у Вас есть время до момента наступления события (смерти или окончания исследования), то надо пользоваться методами анализа выживаемости, предпочтительно моделью пропорционального риска Коска, куда и включить все интересующие Вас переменные (возраст, вес и пол). Если у Вас нет данных о времени наблюдения, значит выживаемость Вы оценить не можете, а оцениваете только вероятность наступления события (дожил человек до конца исследования или нет). Тогда Вам нужна логистическая регрессия.
|
|
29.12.2007 - 01:51
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Я думаю Elene не четко сформулировала задачу. Возможно, она состоит в том, чтобы имея exp коэф., (которые часто трактуют как вероятность) по трем показателям посчитать вероятность выживания. Такие вопросы возникают, когда в публикациях приводятся эти коэффициенты и возикают вопросы у читателей, как их использовать для своих больных.
|
|
4.11.2008 - 10:59
Сообщение
#26
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 31.10.2008 Пользователь №: 5470 |
Здравствуйте, уважаемый Плав!
У меня есть несколько давно наболевших вопросов, относительно логистической регрессии. К сожалению, самостоятельно никак не могу с ними справится. Во многих зарубежных статьях встречаются такого рода цитаты: Adjusted for age, sex, ets.... Вопросы: Как выполнить этот adjustment, как определить независимые переменные, по которым он выполняется. Пробовала выполнить расчеты в SAS 9.1, пользуясь Вашей книгой, но в резултат анализа не содержал данных, полностью соответствующих структуре описанной в книге. Опять же, остаются вопросы, изложенные выше, относительно набора переменных, которые будут влиять на Odds. |
|
4.11.2008 - 17:49
Сообщение
#27
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Здравствуйте, уважаемый Плав! У меня есть несколько давно наболевших вопросов, относительно логистической регрессии. К сожалению, самостоятельно никак не могу с ними справится. Во многих зарубежных статьях встречаются такого рода цитаты: Adjusted for age, sex, ets.... Вопросы: Как выполнить этот adjustment, как определить независимые переменные, по которым он выполняется. Пробовала выполнить расчеты в SAS 9.1, пользуясь Вашей книгой, но в резултат анализа не содержал данных, полностью соответствующих структуре описанной в книге. Опять же, остаются вопросы, изложенные выше, относительно набора переменных, которые будут влиять на Odds. Adjusted for age, sex и т.д. означает просто, что в логистической регрессионной модели были включены переменные пол и возраст. Т.е. если вы создали модель, например: PROC LOGISTIC DESCENDING; MODEL Isxod=age sex treatment; RUN; то полученные отношения шансов для treatment будут как раз age and sex adjusted... CODE The LOGISTIC Procedure Analysis of Maximum Likelihood Estimates Standard Wald Parameter DF Estimate Error Chi-Square Pr > ChiSq Intercept 1 -5.2417 0.3139 278.8676 <.0001 AGE 1 0.1060 0.00639 275.7084 <.0001 EDHIGH 1 -0.5383 0.0906 35.3186 <.0001 EDLOW 1 0.4655 0.0833 31.2356 <.0001 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits AGE 1.112 1.098 1.126 EDHIGH 0.584 0.489 0.697 EDLOW 1.593 1.353 1.875 Association of Predicted Probabilities and Observed Responses Percent Concordant 68.8 Somers' D 0.393 Percent Discordant 29.5 Gamma 0.399 Percent Tied 1.7 Tau-a 0.196 Pairs 3812130 c 0.696 Выше приведена распечатка в 9.1 она, немного отличается от того, что в книге (там даже в примечании указано, что в книге - с версии 6.12, команды же аналогичны книжным), однако не сильно. Основное различие, что доверительные интервалы для переменных вынесены в отдельный блок. Соответственно, по сравнению с лицами, имеющими среднее образование, лица не закончившие даже среднюю школу имеют шансы умереть в 1,59 раз выше (95%ДИ=1,35-1,87). Вот это отношение шансов является откорректированным на возраст (age-adjusted), поскольку возраст включен в модель. |
|
5.11.2008 - 07:26
Сообщение
#28
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 31.10.2008 Пользователь №: 5470 |
т.е. коррекция проводится только в случае включения в модель количественных переменных? А если я закодирую возраст в виде нескольких дихотомических переменных, то никакой коррекции не будет выполнено (она просто будет не нужна).
В случае с количественным возрастом я должна буду указать в сноске: "Adjusted for age, sex, treatment"? или нет? "...то полученные отношения шансов для treatment будут как раз age and sex adjusted..." и почему для treatment а не для Isxod? |
|
5.11.2008 - 13:41
Сообщение
#29
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
т.е. коррекция проводится только в случае включения в модель количественных переменных? А если я закодирую возраст в виде нескольких дихотомических переменных, то никакой коррекции не будет выполнено (она просто будет не нужна). В случае с количественным возрастом я должна буду указать в сноске: "Adjusted for age, sex, treatment"? или нет? "...то полученные отношения шансов для treatment будут как раз age and sex adjusted..." и почему для treatment а не для Isxod? 1) Нет, коррекция по всем внесенным в модель переменным (строго говоря, процедура не знает, что такое качественные переменные, путем использования дихотомических переменных мы систему "обманываем") 2) Потому, что мы брали отношение шансов для treatment. ISxod - это зависимая переменная, шансы которой как раз меняются под воздействием treatment. |
|
6.11.2008 - 12:12
Сообщение
#30
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 31.10.2008 Пользователь №: 5470 |
Я так понимаю, что переменные в модели согласовываются относительно друг друга, или масштабируются, или приводятся к одному "формату", для того, чтобы в дальнейшем их можно было интерпретировать.
В одной из статей нашла вот такую фразу: "Tests statistical significance of adding corresponding variables to the model adjusted for all other variables." |
|