Homo aureus
19.03.2008 - 23:17
Уважаемые коллеги, прошу прощения если мой вопрос покажется Вам глупым или это уже обсуждалось, но поиск пока ничего не дал.
Я хочу провести ретроспективное исследование по методу случай-контроль. У меня есть некоторое количество больных изучаемой группы с определенным бинарным признаком 1 и популяция пациентов, в несколько раз большая, с бинарным признаком 0. Цель - подобрать на каждый изучаемый случай пациента группы контроля из популяции с бинарным признаком 0, соответствующий ему по нескольким количественным показателям (пару шкал тяжести, + несколько лабораторных показателей).
После этого нужно будет сравнить сравнить показатели исхода (несколько бинарных показателей + несколько количественных показателей, вроде длительность пребыванияв ОРИТ, длительность ИВЛ итп). Здесь кстати уместно ли оценить значимость различий с помощью методов непараметрической статистики (н-р тест Манна-Уитни) для того чтобы утверждать, что пациенты с изучаемым признаком 1, скажем, статистически значимо дольше находились в ОРИТ, чем пациенты с признаком 0 или хи-квадрат, для того, чтобы утверждать, что у среди пациентов группы 1 был более высокий уровень смертности, чем у пациентов группы 0. Как вычислить отношение рисков (odds ratio) и уместно ли оно здесь ?
Под рукой Statistica, SPSS и MedCalc Буду признателен всем ответившим
DrgLena
21.03.2008 - 00:13
Цитата
Я хочу провести ретроспективное исследование по методу случай-контроль
Если вы хотите провести такое исследование, то вам уже должно быть известно, что такое «случай» - это уже и есть исход. Т.е. определенное событие произошло у части пациентов, а у части не произошло - «контроль». Желательно, чтобы число наблюдений в контроле было как минимум в два раза больше, чем «случай», для уменьшения систематической ошибки. Цель исследований такого типа - проанализировать факторы риска наступления изучаемого события («случай»). Показатели типа «длительность пребывания ОРИТ, длительность ИВЛ итп» рассматриваются как факторы, которые могут влиять на исход - «случай», а не являются показателями исхода. В качестве оценки действия факторов риска используют отношение шансов (OR), которое вычисляется легко из четырехпольной таблицы.
То, что Вы описали не является исследованием по типу случай-контроль. Исследование случай-контроль подбирается по показателям исхода, а не параметрам. То, что Вы хотите сделать это фактически ретроспективное когортное исследование, но с резким ограничением популяции. У Вас две когорты - две группы, соответственно, сравнение показателей исходов в них проводится по обычным принципам сравнения двух групп. Если показатель исхода количественный, то проверяете нормальность и используете либо Мэнна-Уитни, либо Стьюдента (но тогда никаких отношений шансов), если показатель исхода бинарный - тогда используете хи2 или Фишера и тогда можете рассчитать отношение шансов на четырех польной таблице.
Homo aureus
22.03.2008 - 10:53
Спасибо коллеги, за ваши ответы. Я наверное неправильно выразился. Я пояcню примерами, что я имел в виду.
Например, это исследование :
http://ajrccm.atsjournals.org/cgi/content/...ract/156/4/1105Было выполнено в дизайне проспективного контроллируемого исследования. Авторы, использовали в качестве того, что я называл "бинарным разделительным признаком" развитие у пациентов ОРИТ вентилятор-ассоциированной пневмонии, а в качестве показателей они взяли смертность и длительность предывания в ОРИТ. Не смотря на это, свое исследование они обозначили как case control study. В качестве критериев, по которым подбирали пациентов контроля были указаны наличие и продолжительность факторов риска, сопутствующие заболевания, длительность пребывания в ОРИТ итп.
К сожалению, авторы немногословны в описании статистических методов ..

Другое недавнее исследование
http://www.ncbi.nlm.nih.gov/pubmed/18156879, я позволю себе процитировать более подробно:
Цитата
Методы и ход исследования
Проспективное, многоцентровое, обсервационное исследование SOAP (Sepsis Occurrence in Acutely Ill Patients) было выполнено рабочей группой Европейского Общества Интенсивной Терапии (ESICM, Брюссель, Бельгия), под руководством Jean-Louis Vincent. Исследование планировалось для того, чтобы оценить эпидемиологию сепсиса и другие характеристики пациентов в ОРИТ, изучить различные аспекты текущей практики ведения пациентов, включая переливание крови. В исследование включались все взрослые пациенты, поступавшие в участвовавшие в исследовании центры с 1 по 15 мая 2002 года. Больных наблюдали в течение 60 дней, либо до выписки из стационара или смерти. Больные, которые находились в ОРИТ менее 24 часов, исключались из исследования.
У больных при поступлении и в динамике изучался широкий спектр клинико-лабораторных показателей, интегральные показатели тяжести и органной дисфункции по шкалам и SOFA. Для того, чтобы определить относительный риск смерти, связанный с гемотрансфузией, использовалась многофакторная модель пропорционального риска Кокса.
Результаты
Из 3 147 пациентов, включенных в исследование, 1 040 (33,0 %) проводилось переливание крови, а 2 107 (67,0 %) не проводилось. Пациенты, которым была выполнена гемотрансфузия, были несколько старше (средний возраст, 62 против 60 лет; P = 0.035), среди них было больше больных с гемобластозами и циррозом печени, больных хирургического профиля, а также у них чаще встречались инфекции и сепсис. Больные, которым проводилась гемотрансфузия, были в целом исходно более тяжелыми, чем те, которым она не проводилась, о чем свидетельствуют более высокая оценка по шкале SAPS II (40.2 против 34.7; P = 0.001) и более высокие средние показатели по шкале SOFA (6.5 против 4.5; P = 0.001) при поступлении. Пациенты, которым проводилось переливание крови, имели в среднем большую продолжительность пребывания в ОРИТ (5.9 против 2.5 дней; P = 0.001). Как и предполагалось, имелась прямая корреляция между числом гемотрансфузий и уровнем смертности.
Тем не менее, при проведении многофакторного регрессионного анализа с учетом таких показателей возраста пациентов, типа поступления, анамнеза (злокачественные новообразования, цирроз, хронические заболевания легких), баланса жидкости, оценки тяжести состояния по шкалам SAPS II и SOFA при поступлении, не было выявлено связи переливания эритроцитов с повышением относительного риска смерти в течение 30 дней (относительный риск = 0.89; 95% доверительный интервал [ДИ] = 0.76?1.05; P = 0.159).
Были также подобраны 821 пар соответствия со схожими основными общими характеристиками и показателями тяжести состояния. В данном анализе в группе больных, которым была выполнена гемотрансфузия, относительный риск смерти был ниже, по сравнению с теми, кому она не проводилась (отношение рисков = 0,73; 95% доверительный интервал, ДИ = 0.59 ? 0.90; P = 0.004).
Расширенный анализ пропорциональных рисков, с поправкой на переливание эритроцитарной массы как зависимой от времени переменной выявил, что переливание было связано со снижением относительного риска смерти к 30 дню во всей популяции (относительный риск = 0.69; 95% ДИ = 0.48 ?1.01; P = 0.055).
Выводы.
Авторы исследования делают заключение, что переливание крови не связано с повышением уровня летальности у больных ОРИТ и даже может быть ассоциировано с повышением выживаемости. Необходимо отметить, что в отличие от предыдущих исследований, 76% принимавших участие в SOAP центров использовали кровь, очищенную от лейкоцитов. Как известно, именно лейкоциты ответственны за основные осложнения переливания крови.
Исследование было обсервационным, поэтому полученные результаты имеют ограниченную ценность. Для того, чтобы подтвердить полученные в ходе исследования данные, необходимо проведение рандомизированного контролируемого исследования.
Источник.
Jean-Louis Vincent et al.. Are Blood Transfusions Associated with Greater Mortality Rates?
Results of the Sepsis Occurrence in Acutely Ill Patients Study. Anesthesiology 2008; 108:31?9
Собственно, с чем я к вам и обратился: Мое исследование будет выполнено в похожем дизайне. Есть огромная база ретроспективных данных на пациентов. Я хочу сформировать две популяции в которой развитие, скажем, к пятым суткам пребывания в ОРИТ или не развитие ифнекции связанной с определенным микроорганизмом х было бы единственным различием, а по остальным параметрам - наличие или отсутствие определенных соп. заюолеваний, показатели шкал тяжести состояния к пятым суткам пребывания в ОРИТ и т п. были статистически неразличимы в двух группах. После этого, можно сравнить эти группы по показателям исхода и утверждать, что развитие развитие инфекции микроорганизмом х
является или не является независимым предиктором летальности или более длительного пребывания в ОРИТ.
Это осуществить можно двумя путями - просто попарно сравниявая и вручную подбирая пациента котроля на каждый случай, используя стандартный набор (Манн-Уитни, Стьюдент, хи-квадрат итп. - ессно после проверки нормальности распределения). Либо, возможно, для этой цели существует другой путь - многофакторная модель пропорционального риска - но что это и каким образом это осуществить я пока не совсем в курсе. Возможно, второй путь - более корректен и я буду оч. признателен за помощь в его осуществлении.
DrgLena
22.03.2008 - 14:42
Цитата
является или не является независимым предиктором летальности или более длительного пребывания в ОРИТ
Цель вашего исследования не четко определена. Скорее всего, вам интересней проанализировать влияние развития определенной инфекции х на летальность. А длительность пребывания в ОРИТ, скорее всего, может быть фактором также влияющим на летальность.
Цели двух приведенных вами примеров различны, поэтому быть похожими на оба не получится, да и не нужно.
В первом примере, изучались факторы, влияющие на развитие VAP. Показана широкая гетерогенность признаков в группе «case», поэтому не найдены различия по количественным показателям (Bilirubin, mmol/L 191.2?323.3SD) между группами с развившейся и не развившейся VAP. Во второй части исследования показано, что, если VAP сопровождается увеличением содержания IL6 IL8, то это увеличивает смертность.
Во втором исследовании больные сразу были разделены по типу вмешательства, т.е. проводилось или нет переливание крови. Цель была выяснить, влияет ли это вмешательство на оценку смертности с учетом других факторов. Вывод делается, что само переливание не увеличивает смертность.
Задача вашего исследования ближе к первому примеру, вы тоже можете проанализировать факторы, которые влияют на возникновение определенной инфекции к 5 дню пребывания в ОРИТ. При этом case - инфекция развилась, контроль - не развилась. Но я бы не стала делать это так, как в первой ссылке (анализ средних арифметических) , а редуцировала количественные показатели до бинарных (точки перегиба ROC-анализом) и вычислила отношение шансов. И если повезет можно и множественную модель получить (логистическая регрессия). А дальше, если наблюдения закончены и число умерших известно, рассмотреть влияние факта развития инфекции к определенному дню совместно с другими факторами (длительность пребывания в ОРИТ) для того чтобы оценить независимость именно этого фактора. Если интересует не только факт смерти, а влияние факторов на время ее наступления, то Кокс-регрессия.
Homo aureus
22.03.2008 - 19:52
Спасибо за помощь, признаться удивлен такой отзывчивостью. Если чем нибудь могу быть полезен - также обращайтесь. Мысль с упрощением количественных переменных до бинарных с помощью ROC весьма интересна. Попробую откатать первую партию пациентов на досуге.
Кокс регрессию я обнаружил в медкальке (кстати простая и чудная програмка - кому интересно могу выслать).
DrgLena
22.03.2008 - 22:36
В MedCalc очень хорошо дана возможность сравнения нескольких ROC кривых и очень понятный отчет по поиску оптимальной точки разделения. Я долго пользовалась демо версией, но там было много ограничений. Сейчас у меня лицензионная версия 9.3.9.0. много полезных вещей типа калькуляторов расчета стат мощности исследования, хи-квадрат для таблиц более, чем 2х2 и т.д.
Уважаемые коллеги! Помогите, пожалуйста решить вопрос. В исследовании был проведен регрессионный анализ, как затем определить велишину относительного риска и отношения шансов для независимых величин, спомощью кросстаблиц? но как кодировать количественные признаки, если их перевести в бинарные как предложила уважаемая DrgLena спомощью cut-off из ROC кривых это будет правильно? Заранее благодарю!!!
DrgLena
16.08.2008 - 20:27
Вопрос не совсем понятен. Очевидно, нужно в новом посте сформулировать, что вы хотите сделать, или хотя бы, какую регрессию вы сделали? Если у вас есть количественные показатели, то используя ROC можно найти наиболее точное разделение показателя на две альтернативные группы. На основе этого разделения, вы кодируете «1», если фактор риска присутствует, и «0», если отсутствует. Если после этого вы создадите регрессионную модель вероятности наступления неблагоприятного события, используя логистическую регрессию только с бинарными признаками, то если фактор риска присутствует, то exp(b) будет иметь значение OR, которое можно получить, в том числе и из таблицы 2х2.
Цитата(DrgLena @ 16.08.2008 - 23:27)

Вопрос не совсем понятен. Очевидно, нужно в новом посте сформулировать, что вы хотите сделать, или хотя бы, какую регрессию вы сделали? Если у вас есть количественные показатели, то используя ROC можно найти наиболее точное разделение показателя на две альтернативные группы. На основе этого разделения, вы кодируете «1», если фактор риска присутствует, и «0», если отсутствует. Если после этого вы создадите регрессионную модель вероятности наступления неблагоприятного события, используя логистическую регрессию только с бинарными признаками, то если фактор риска присутствует, то exp(b) будет иметь значение OR, которое можно получить, в том числе и из таблицы 2х2.
Уважаемая DrgLena! Огромное спасибо, что Вы откликнулись на мою просьбу! Возможно, я задаю вам глупые вопросы, но помогите, пожалуйста, так как я в тупике. Хочу провести бинарную регрессию, не совсем уверена правильно ли я сделала ее. Задача состоит в определениии независимых факторов риска, влияющих на развитие события. Среди них есть количественные и качественные признаки. Затем как определить OR и RR. Мне необходимо определить оба показателя, так одна часть исследования проспективная другая ретроспективная. У меня SPSS13. В полученных таблицах по регрессионному анализу этих показателей: да вижу exp(b), там значения 0,000; 0,038 что это значит? К тому же насколько я понимаю необходимо оценить доверительный интервал и величину р, а вот здесь и начинается моя проблема. Следует ли теперь переходить к кростаблицам 2х2 для оценки OR и RR? Если ВАс не затруднит, проконсультируйте, пожалуйста. Заранее благодарю!
Уважаемая DrgLena! Позвольте задать Вам еще вопрос. Задача в том, чтобы определеить значения по кривой ROC для нескольких переменных, для 1 переменной - понятно, но если мне необходимо оценить и построить такую кривую для комбинации признаков? Возможно ли их простое сложение с созданием новой переменной или это вытекает из какого-либо регрессионного анализа. Например комбинация симптома и количественного признака уровень биомаркера. Спасибо!
Уважаемый Homo aureus! Спешу принять Ваше предложение, если Вам не трудно вышлите мне Кокс регрессию. Спасибо!
DoctorStat
18.08.2008 - 22:29
Цитата(Gula @ 16.08.2008 - 14:52)

Уважаемые коллеги! Помогите, пожалуйста решить вопрос. В исследовании был проведен регрессионный анализ, как затем определить велишину относительного риска и отношения шансов для независимых величин, спомощью кросстаблиц? но как кодировать количественные признаки, если их перевести в бинарные как предложила уважаемая DrgLena спомощью cut-off из ROC кривых это будет правильно? Заранее благодарю!!!
1. Вам не нужно переводить количественные признаки в бинарные. Логистическая регрессия прекрасно справляется с непрерывными независимыми параметрами.
2. Относительный риск вычисляется по формуле: p=1/(1+exp[-z]) (1)
3. Отношение шансов вычисляется по формуле: OR=exp[+z]) (2)
4. Вычисление доверительных интервалов. В программе SPSS для логистической регрессии в таблице Variables in Equation даются стандартные отклонения для коэффициентов В ? S.E. Используйте их и формулы (1) и (2) для получения доверительных интервалов для p и OR.
DrgLena
19.08.2008 - 00:20
Безусловно, логистическая регрессия справляется с любыми переменными, и в этом как раз ее прелесть, но трактовка коэффициентов в случае количественных показателей несколько иная. Exp(b) в этом случае будет показывать во сколько раз увеличится шанс развития события при увеличении значения признака на единицу. Вопрос Gula про ROC я не совсем поняла. Очевидно, как это обычно делают, после получения регрессионной модели по нескольким признакам необходимо к рассчитанным вероятностям применить ROC, чтобы оценить возможность модели по ее площади, а также найти оптимальную точку разделения для этих вероятностей, для которой будет оптимальное значение чувствительности и вероятности.
Уважаемая DrgLena! Огромное спасибо, что-то для меня стало проясняться, спешу применить Ваши рекомендации на практике. Спасибо вам за помощь!!!
Уважаемый DoctorStat! Большое спасибо!!! Вы меня очень выручили и помогли мне, теперь попробую сделать. Спасибо!!!
Обратите только внимание, что логистическая регрессия НЕ позволяет рассчитывать RR (это можно делать только при помощи пуассоновой регрессии).
Кстати, использование RR или OR не зависит от проспективного или ретроспективного характера исследования, а только от способа отбора пациентов - в когортном исследовании (отбор по фактору риска) можно считать и то, и другое, в исследования случай-контроль (отбор по наличию-отсутствию заболевания) только OR.
Цитата(плав @ 20.08.2008 - 11:16)

Обратите только внимание, что логистическая регрессия НЕ позволяет рассчитывать RR (это можно делать только при помощи пуассоновой регрессии).
Вычисление RR для логистической регрессии тут
http://aje.oxfordjournals.org/cgi/reprint/157/10/940.
Цитата(Игорь @ 21.08.2008 - 16:06)

Ошибка, статья указывает на использование лог-биномиальной и пуассоновой регрессии для оценки относительного риска, а никак не логистической. И в том и в другом случае используется другая трансформация зависимой переменной.
Приводимая же в начале статьи формула для пересчета OR в RR (кстати, не имеющая отношения к логистической регрессии, а просто базирующаяся на определениях этих показателей) описывается как имеющая смещение и вся статья посвящена как раз тому, что ее использовать нельзя.
Поэтому повторюсь. Логистическая регрессия НЕ позволяет расчитывать RR (это просто невозможно математически, она работает с шансами, шансы - зависимая переменная в логистической регрессии). Перерасчет OR в RR может быть сопряжен с ошибками, поэтому для расчета RR надо использовать другие статистические методы.
Понятно. Спасибо.
Еще бы где-то пример посмотреть практического использования Пуассоновой регрессии.
Цитата(Игорь @ 22.08.2008 - 12:20)

Понятно. Спасибо.
Еще бы где-то пример посмотреть практического использования Пуассоновой регрессии.
Если имеются ввиду статьи и информация, как делается, то
http://www.ats.ucla.edu/stat/sas/faq/relative_risk.htm (и список литературы внизу страницы)
http://aje.oxfordjournals.org/cgi/content/full/162/3/199Если примеры использования, то смотрите список статей, которые ссылались на статью в Am. J. Epidemiol указанную выше.
У нас была статья в Российском семейном враче, использовавшая пуассонову регрессию, но его в on-line нет.
Цитата(плав @ 22.08.2008 - 12:07)

У нас была статья в Российском семейном враче, использовавшая пуассонову регрессию, но его в on-line нет.
Журнал редкий. Даже оглавление трудно доступно.
Статью можно заказать по МБА. Если можно, пожалуйста, сообщите название работы, год, номер и страницы журнала.
Цитата(Игорь @ 22.08.2008 - 13:35)

Журнал редкий. Даже оглавление трудно доступно.
Статью можно заказать по МБА. Если можно, пожалуйста, сообщите название работы, год, номер и страницы журнала.
Плавинская С.И., Плавинский С.Л., Шестов Д.Б. Прогностическая значимость основных факторов риска у женщин по данным популяционного исследования и шкала риска смерти от ССЗ// Российский семейный врач.-2006.- № 4.- с.4-9
Цитата(плав @ 22.08.2008 - 12:55)

Плавинская С.И., Плавинский С.Л., Шестов Д.Б. Прогностическая значимость основных факторов риска у женщин по данным популяционного исследования и шкала риска смерти от ССЗ// Российский семейный врач.-2006.- № 4.- с.4-9
Очень интересная статья.
Так понял, для показателей (табл. 1 и 2) были построены не множественные логистические регрессии, а логистическая регрессия для каждого показателя?
Цитата(DoctorStat @ 19.08.2008 - 01:29)

2. Относительный риск вычисляется по формуле: p=1/(1+exp[-z]) (1)
3. Отношение шансов вычисляется по формуле: OR=exp[+z]) (2)
4. Вычисление доверительных интервалов. В программе SPSS для логистической регрессии в таблице Variables in Equation даются стандартные отклонения для коэффициентов В ? S.E. Используйте их и формулы (1) и (2) для получения доверительных интервалов для p и OR.
Уважаемые коллеги! Все-таки я не поняла как можно вычислить доверительный интервал с помощью коэф. В и S.E?

Объясните для особо одаренных, пожалуйста.
Есть ли в SPSS пуасонова регрессия? Заранее благодарю!!!
Цитата(Игорь @ 25.08.2008 - 12:42)

Очень интересная статья.
Так понял, для показателей (табл. 1 и 2) были построены не множественные логистические регрессии, а логистическая регрессия для каждого показателя?
Да, хотя макро Muche позволяет находить точки разделения и на основании множественной модели, у меня сомнения в адекватности этого подхода с практической точки зрения: дело в том, что модель считает тогда точку разделения "при условии фиксированности остальных", т.е. естественная корреляция "разрывается". Соответственно, с научной точки зрения мы получаем наилучшую точку зрения в модельной ситуации, когда, например, триглицериды в популяции неизменны. Однако в реальности они коррелируют, скажем с ЛПВП. Соответственно, врач, полузующийся этой точкой разделения будет получать ошибку.
Для ее коррекции надо возвращаться к полной модели, что сложно сделать в повседневной жизни.
Поэтому мы использовали для поиска точки разделения унивариантные модели.
Цитата(Gula @ 25.08.2008 - 13:57)

Уважаемые коллеги! Все-таки я не поняла как можно вычислить доверительный интервал с помощью коэф. В и S.E?

Объясните для особо одаренных, пожалуйста.
Есть ли в SPSS пуасонова регрессия? Заранее благодарю!!!
Нижняя граница: exp(beta-1.96*SE)
Верхняя граница: exp(beta+1.96*SE)
Еслит надол сравнивать факторы риска, то рассчитайте стандартизованные ОШ, а не на единицу измерения:
Нижняя граница: exp([beta-1.96*SE]*SD)
Верхняя граница: exp([beta+1.96*SE]*SD)
Все то же, только логарифм границы умножается на стандратное отклонения для фактора риска
Что касается SPSS короткий ответ, может.
http://www.childrensmercy.org/stats/model/poiss_syntax.asphttp://www.ats.ucla.edu/stat/spss/dae/poissonreg.htmТребует знания языка SPSS. Что касается подхода к рассчету RR, обсуждавшемуся выше, я не достаточно работаю с SPSS, чтобы знать особенности модуля GENLIN (есть ли там возможность использовать коррелированные структуры). Думаю, что возможность есть, надо только обсудить вопрос с кем-то, кто хорошо знает особенности этой процедуры в SPSS.
[quote name='плав' date='25.08.2008 - 17:00' post='5255']
Нижняя граница: exp(beta-1.96*SE)
Верхняя граница: exp(beta+1.96*SE)
Еслит надол сравнивать факторы риска, то рассчитайте стандартизованные ОШ, а не на единицу измерения:
Нижняя граница: exp([beta-1.96*SE]*SD)
Верхняя граница: exp([beta+1.96*SE]*SD)
Все то же, только логарифм границы умножается на стандратное отклонения для фактора риска
Огромное спасибо за отзывчивость!!! Первую часть Вашего сообщения поняла. В моем исследовании OR=exp[+z]? значит для данного ОШ вычисляю по первым формулам ДИ, Эти отношения я получены дя факторов риска, правильно ли я Вас поняла, что ОШ=OR=exp[+z]? Только ДИ необходимо пересчитать по вторым формулам?
Простите за непонятливость, но перечитав 5 книг по статистике, в голове все смешалось, нет ничего налядного. Спасибо большое!!!
Цитата(Gula @ 25.08.2008 - 15:14)

Нижняя граница: exp(beta-1.96*SE)
Верхняя граница: exp(beta+1.96*SE)
Еслит надол сравнивать факторы риска, то рассчитайте стандартизованные ОШ, а не на единицу измерения:
Нижняя граница: exp([beta-1.96*SE]*SD)
Верхняя граница: exp([beta+1.96*SE]*SD)
Все то же, только логарифм границы умножается на стандратное отклонения для фактора риска
Огромное спасибо за отзывчивость!!! Первую часть Вашего сообщения поняла. В моем исследовании OR=exp[+z]? значит для данного ОШ вычисляю по первым формулам ДИ, Эти отношения я получены дя факторов риска, правильно ли я Вас поняла, что ОШ=OR=exp[+z]? Только ДИ необходимо пересчитать по вторым формулам?
Простите за непонятливость, но перечитав 5 книг по статистике, в голове все смешалось, нет ничего налядного. Спасибо большое!!!
Ничего страшного

. Я писал только про ДИ. OR=exp(z) для случая OR на единицу измерения (например, мм. рт. ст) или OR=exp(z*SD) для стандартизированных отношений шансов.
Стандартизированные - если Вы хотите сравнивать разные факторы риска (какой сильнее)
Уважаемый учитель! Коллеги! Спасибо за помощь! Но где взять SD? Я знаю только, что это стандартное отклонение, других значений не знаю, и в таблице результаов по регрессии не нашла. Огромная просьба, разъясните. Спасибо! Посчитав бинарную логистическую регрессию, получила следующие результаты: возможно ли, что признаки, котоые имели меньшее процентное соотношение в группе имели exp(b) больше, или возможно надо посчитать имено стандартизированное ОШ как Вы предложили для сравнения факторов риска???
Спасибо!
Уважаемая DrgLena!
Подскажите, пожалуйста, после определения факторов в бинарной логистичекой регрессии, можно ли вычислить отношение шансов для них отдельно с помощью кросс-таблиц? Будет ли это корректно?
Спасибо!
Цитата(Gula @ 26.08.2008 - 11:22)

Уважаемый учитель! Коллеги! Спасибо за помощь! Но где взять SD? Я знаю только, что это стандартное отклонение, других значений не знаю, и в таблице результаов по регрессии не нашла. Огромная просьба, разъясните. Спасибо! Посчитав бинарную логистическую регрессию, получила следующие результаты: возможно ли, что признаки, котоые имели меньшее процентное соотношение в группе имели exp(b) больше, или возможно надо посчитать имено стандартизированное ОШ как Вы предложили для сравнения факторов риска???
Спасибо!
В показателях регрессии обычно стандартное отклонение не распечатывается. Самый простой вариант - пойти в раздел описательной статистики (зависит от программы, которую Вы используете) и там рассчитать стандартное отклонение для всех факторов риска.
Насчет разных exp(b) то, что Вы описываете, кончено возможно.
Представьте себе следующую истуацию у Вас в модели уровень АД (как фактор риска) и курение. Тогда exp(b) будет для случая АД означать рост риска (изменение шансов наличия заболевания) при росте АД на 1 мм рт. ст. (величина будет маленькая), а для курения будет разницией по риску между курящими и не курящими. Как говорится, сравнение яблок с апельсинами. Именно поэтому и надо сравнивать стандартизированные ОШ.
Цитата(Gula @ 26.08.2008 - 13:35)

Уважаемая DrgLena!
Подскажите, пожалуйста, после определения факторов в бинарной логистичекой регрессии, можно ли вычислить отношение шансов для них отдельно с помощью кросс-таблиц? Будет ли это корректно?
Спасибо!
Хоть и не DrgLena, но отвечу. Можно, но зачем? Идея логистической регрессии получить показатели, откорректированные на влияние других включенных в модель показателей (например, если люди, которые пьют имеют более высокий уровень АД, получить рост риска от потребления алкоголя НЕ объясяемый повышением АД). Простая кросс-табуляция будет давать неоткорректированные ОШ.
Так что рассчет ОШ на основании кросс-таблиц после логистической регрессии не вполне корректен, поскольку значения ОШ не зависят от результатов логистической регрессии. Обычно делается наоборот - вначале унивариантный анализ (таблицы), а затем модели (логистическая).
DrgLena
26.08.2008 - 14:29
Я думаю, что Gula, используя SPSS просто не указала в опциях, что нужно рассчитать ДИ к exp(b), поэтому и хочется, как то все же его получить. Но по кросс таблицам можно получить OR и ДИ только для бинарных признаков. Но если Gula не знает как это сделать в SPSS, то она может пропустить также и указание о типах переменных, которые участвуют в моделировании. Для номинальных или категориальных переменных, например измеряемых в трех уровнях нужно сделать правильный выбор, оносительно какого уровня рассчитывать риски. Не могу согласиться с уважаемым учителем, что для трактовни результатов логистической регрессии необходимо получить стандартизованные оценки рисков. Их трактовать еще труднее. Если в качестве предиктора используется номинальня переменная, например, клеточной тит опухоли в трех категориях, то SD вообще не имеет смысла, впрочем и для курящих и не курящих также. Куда важнее описать, что повышение веса на 1 кг (причем еще нужно знать относительно какого веса !) риск чего то, повышается в 1,03 раза (exp(b), а у курящих в 3,83 раза относительно некурящих.
Цитата(DrgLena @ 26.08.2008 - 15:29)

Не могу согласиться с уважаемым учителем, что для трактовни результатов логистической регрессии необходимо получить стандартизованные оценки рисков. Их трактовать еще труднее. Если в качестве предиктора используется номинальня переменная, например, клеточной тит опухоли в трех категориях, то SD вообще не имеет смысла, впрочем и для курящих и не курящих также. Куда важнее описать, что повышение веса на 1 кг (причем еще нужно знать относительно какого веса !) риск чего то, повышается в 1,03 раза (exp(b), а у курящих в 3,83 раза относительно некурящих.
На самом деле это достаточно логичный показатель (рост ОШ при росте на 1 SD) - SD- показатель разброса данных. Для номинальной переменной с тремы уровнями SD не посчитать, но любая номинальная переменная может быть преобразована в несколько бинарных переменных (k-1, где k - количество уровней номинальной переменной). Более того, логистическая регрессия НЕ может работать с многоуровневыми номинальными переменными и перекодировка в бинарные переменные обязательна (либо вручную исследователем, либо автоматически программой). Неспособность сделать это приведет к неправильной модели.
Для бинарных переменных SD определено, так что мы возвращяемся к исходной позиции.
Стандартизованные ОШ (как и любой стандратизованный показатель) не что иное, как показатель, который имеет одинаковый масштаб.
Что же касается того, ради чего это делать, то посмотрим на Ваш пример. Хорошо, масса тела повышает риск в 1,03 раза (предположим редкое заболевание), а курение в 3,8 раза. Означает ли это, что курение более сильный фактор риска? Да? Нет? А как сравнить?
А если не сравнивать, зачем вообще вся эта модель?
DrgLena
27.08.2008 - 00:42
Модель строится не только чтобы количественно оценить факторы риска, для этого и даются экспоненциальные коэффициенты (exp(b)), которые трактуются как шансы, но чтобы воспользовавшись самими коэффициентами (b) , рассчитать вероятность события для каждого обекта, по набору коэффициентов, которые все же нужно умножать на обычные значения предикторов, а не на стандартизированные. Относительно номинальных предикторов, SPSS дает очень широкие возможности для выбора contrast method, от самого простого, когда каждая категория сравнивается с референтной, до сложных (Helmert), когда каждая категория переменной кроме последней категории сравнивается со средним эффектом последующих категорий. Все же мне кажется, что стандартизация ОШ уводит от логической интерпретации результатов логистической регрессии.
Уважаемые коллеги! Здорово! какие вы умные! Ваши рассуждения пролили свет в моей темной башке и не только по SD, SD- значит, то простое SD, которое мы применяем в описательной статистике, это я могу расчитать. Огромное спасибо за помощь!!!
Уважаемый Учитель! Скажите, пожалуйста, можно ли предложенные Вами формулы применять для расчета ОШ и ДИ при мульноминамальной логистической регрессии и регрессии Кокса? И еще вопрос: ведь мне следует указать источник в материалах и методах по какому способу вычислялись ОШ и т.д. Не могли бы Вы указать этот источник, чтобы можно было на него сослаться. Большое Спасибо!
Homo aureus
28.08.2008 - 18:53
Здравствуйте. А что такое "propensity-score matched-pairs analyses" в каких статистической программе это осуществимо (у меня нет программы SAS) ? Гдде об этом можно прочитать ? Например такой дизайн исследования (из последнего номера The Lancet):
Цитата
Statistical analyses
Bivariate tests were initially used to compare the characteristics of patients who did or did not receive epidural anaesthesia or analgesia (t test, Mann-Whitney U test, χ² test, Fisher?s exact test).
We used propensity-score matched-pairs analyses to determine the adjusted association of perioperative epidural anaesthesia with the primary outcome (30-day mortality). The rationale and methods underlying the use of propensity scores for proposed causal exposure variables have been previously described.26,27 We developed a non-parsimonious multivariable logistic regression model to estimate a propensity score for perioperative
epidural anaesthesia, irrespective of outcome. Clinical signifi cance guided the initial choice of covariates in this model: age, sex, year, surgical procedure, hospital-type (teaching, low-volume nonteaching, mid-volume non-teaching, high-volume nonteaching), comorbid disease, specialist consultations (general internal medicine, cardiology, anaesthesiology), cardiac testing (echo cardiogram, non-invasive myocardial per fusion test, coronary angiogram), intraoperative invasive monitoring, and income. We used previously described methods to categorise non-teaching hospitals
into terciles28 on the basis of the annual volume of included procedures.
We considered comorbid conditions that were present in at least 1% of the study cohort: ischaemic heart disease, congestive heart failure, cerebrovascular disease, hypertension, diabetes, pulmonary disease, renal disease, and malignancy. As suggested by recent statistical research on propensity score development, we used a structured iterative approach to refi ne this model, with the goal of achieving covariate balance within the
matched-pairs.29 Covariate balance was measured using the standardised diff erence, where an absolute standardised diff erence greater than 10% is suggested to represent meaningful covariate imbalance.29 We matched epidural patients to no-epidural patients using a greedy-matching algorithm with a calliper width of 0·2 SD of the log odds of the estimated propensity score. This method involved sampling without replacement, and has been shown to remove 98% of the bias from measured covariates.30 Within the matched pairs, we used the methods of Agresti and Min31 to compare
mortality rates.32
Prespecifi ed subgroup analyses were based on procedure (abdominal, orthopaedic, thoracic, or vascular surgery), hospital (teaching or high-volume hospital versus mid-volume or low-volume hospital), and anatomic location of the epidural catheter (thoracic versus lumbar). We did a subgroup analysis based on the level of the epidural catheter because thoracic epidural analgesia, by selectively blocking cardiac sympathetic innervation,2 might better prevent mortality and cardiac complications.8,33 In these subgroup analyses, we repeated the same propensity-score matching process while forcing an exact match on the subgroup characteristics. The 30-day mortality rates were then compared within the subgroup-specifi c matched-pairs. For each subgroup analysis, we assessed the heterogeneity of treatment eff ects by using a test of interaction in a conditional logistic regression model.
In a sensitivity analysis, we used multivariable logistic regression to determine the adjusted association of epidural anaesthesia with 30-day mortality in the entire sample (N=259 037). These results were similar to the propensity-score analysis, and are therefore not reported. Analyses were done using SAS version 9.1 and R 2.4.1.34 All p values were two-tailed, with statistical significance defined by p<0·05.
Уважаемый Учитель! Мне пришло на почту сообщение о вашем ответе на мой последний запрос, но на форуме я его не нашла, Не могли бы Вы повторить свой ответ? Привожу свой вопрос?
Скажите, пожалуйста, можно ли предложенные Вами формулы применять для расчета ОШ и ДИ при мульноминамальной логистической регрессии и регрессии Кокса? И еще вопрос: ведь мне следует указать источник в материалах и методах по какому способу вычислялись ОШ и т.д. Не могли бы Вы указать этот источник, чтобы можно было на него сослаться. Большое Спасибо!
Уважаемая DrgLena! Коллеги! Подскажите как считать ОШ, ДИ в унивариационном и мультивариационном анализе
Кто работает в SPSS, подскажите, пожалуйста для подсчета их нужно входить в меню GLM Univariate Analysis? Сделав по инструкции, получила разные коэффициенты, но интерпретация оказалась сложной, где искать ОШ и з, ДИ?

Заранее благодарю! И еще вопрос, обязательно для бинарной логистической регрессии сначала проводить унивариантный анализ, просто не во всех работах указывается, что авторы проводили подобный анализ? Спасибо!Позвольте задать вам еще 1 вопрос: скажите, пожалуйста, множественная линейная ререссия и мультивариантный анализ (GLM Multivariate Analysis) одно и то же?
DrgLena
1.09.2008 - 21:03
Судя по по повторяемости вопросов, вы ответы не поняли. Плав подробно объяснил ответы. Вы все же разберитесь, что вы хотите получить после построения модели. Если вам нужно ОШ и ДИ, то наверное вы должны создать Regression binary Logistic, а не GLM -линейную.
В опциях Regression binary Logistic сделайте нужный выбор, какой нужен ДИ. Мы это уже подробно обсуждали.
Уважаемая DrgLena! Спасибо за разъяснения, ОШ, ДИ в бинарной логистической регрессии я уже посчитала, включив указанные опции, Благодаря вашим дискуссиям я поняла сущность данного анализа, и его интерпретацию Я вероятно не так выразилась, по поводу GLM -линейной регрессии. Мн нужно определить, какие факторы влияют на прогноз, вычислить их прогностическую ценность, я понимаю это можно сделать с помощью данной модели и вычислить относительный риск с ДИ, р. В лиературе я встречала, что подсчитывали ОР с помощью унивариантного и мульвариантного анализа. Пуссонову регрессию я в SPSS не нашла. Возможно, я заблуждаюсь. Однако у меня затруднения по поводу интерпретции коэффициентов. Если Вас не затруднит, подскажите, пожалуйста. Огромное спасибо!
DrgLena
2.09.2008 - 15:06
Про пуассонову регрессию - это к Плаву. По бинарной логистической - бинарная означает, что вы рассчитываете вероятность двух состояний, есть и multinominal. Одновариантная, если в качестве предиктора один фактор и вы его вклад можете оценить по exp(b) - ОШ. Если в качестве предикторов несколько иксов, то коэффициенты могут отличаться от одновариантных, кокие то признаки станут более весомыми, а другие менее, т.е. вы получите согласованные с другими переменными коэффициенты. Продолжить не смогу... вечерней лошадью - в Крым, на отдых. Удачи!
К сожалению, как писал выше, детали расчета Пуассоновой регрессии именно в SPSS я не дам, хотя несколько постов назад я давал сссылки на описание методологии для этой программы. Иными словами, этот вид регрессии там есть (GENLIN), но за деталями программирования надо обращаться к людям, которые постоянно работают с SPSS (т.е. знают синтаксис). Я могу сказать, как это делать в SAS
Уважаевый доктор Плав! При подсчете стандартизированных отношений шансов получается, что переменные, которые имеют интервальную или порядковую шкалу всегда будут иметь большие значения, чем категориальные (дихотомические)? Спасибо!
Цитата(Gula @ 17.09.2008 - 19:06)

Уважаевый доктор Плав! При подсчете стандартизированных отношений шансов получается, что переменные, которые имеют интервальную или порядковую шкалу всегда будут иметь большие значения, чем категориальные (дихотомические)? Спасибо!
Нет, почему же. Вы рассчитываете SD. Для дихотомической переменной оно равно квадратный корень из p*(1-p). Например, если р=0,5, то SD=0.5 (р - это процент лиц с признаком). Для интервальной шкалы, скажем, SD=20. Если теперь логистический регресионный коэффициент для дихотомического показателя равен 1, а для интервального - 0,01, то логарифм отношения шансов равен 0,5 для дихотомического показателя и 0,2 для интервального (т.е. отношение шансов равно 1,65 для дихотомического и 1,22 для интервального). Подобная ситуация, например наблюдается, когда сравнивают курение (дихотомический показатель) и холестерин (интервальный) по их влиянию на смертность от ССЗ. Отношение шансов для курения - выше.
Уважаемый доктор Плав! Коллеги! спасибо за помощь. При подсчете стандартизированных ОШ, имея SD 3-значные цифры, у меня получились тоже 3-значные цифры, которых я не встречала доселе в публикациях, обычно цифры 1,2; 3,4 и т.д., Значит все используют обычные ОШ, рассчитанные на единицу измерения? И еще вопрос, скажите, пожалуйста: в бинарной регрессии логистичксой я получила независимый предиктор, но по ROC анализу он не явялется значимым фактором

, такое возможно, или эта особенность методик или ошибка? Спасибо!
Цитата(Gula @ 23.09.2008 - 16:00)

Уважаемый доктор Плав! Коллеги! спасибо за помощь. При подсчете стандартизированных ОШ, имея SD 3-значные цифры, у меня получились тоже 3-значные цифры, которых я не встречала доселе в публикациях, обычно цифры 1,2; 3,4 и т.д., Значит все используют обычные ОШ, рассчитанные на единицу измерения? И еще вопрос, скажите, пожалуйста: в бинарной регрессии логистичксой я получила независимый предиктор, но по ROC анализу он не явялется значимым фактором

, такое возможно, или эта особенность методик или ошибка? Спасибо!
Действительно странно, напишите цифры (бета регрессии и расчитанные Вами SD и сам показатель). Для трехзначных SD и показатель должет быть, как минимум трехзначным...
Спасибо, доктор Плав! Привожу показатели:
1 показатель=1053,6#643,1 (mean#SD); exp(b)=1.02, тогда стандартизирванный ОШ =655,9? Спасибо!