Полная версия этой страницы:
логистическая регрессия
mamalita
18.03.2011 - 22:49
Здравствуйте! Прошу о помощи. Провожу оценку факторов риска, влияющих на развитие рецидива у онкологических больных. Зависимая переменная - отсутствие или наличие рецидива. Независимые - возраст (количественная), время возникновения МТС с момента операции (количественная), стадия (3 градации), дифференцировка (3 градации), количество метастазов (2-5), размер (1-5), суммарный диаметр (2-10). Если строить логит-регрессии отдельно для каждого фактора - модель значимая, процент правильных предсказаний около 78%, соответственно коэффициенты для каждого фактора значимы. Когда ввожу их все вместе, модель значимая но остается значимых только два фактора (возраст, время возникновения МТС), строю для этих 2 факторов - возраст становится незначимым, его убираю качество предсказания ухудшается. Что с этим делать? Программа у меня Statistica6. Второй момент, хотелось бы сделать из этого практический выход, как например таблица оценки перинатальных факторов риска (пример см ниже). Возможно ли это и как это сделать? Может быть есть ссылки на литературу особенно с примерами. Буду признательна за помощь.
Оценка пренатальных факторов риска (О.Г. Фролова, Е.И. Николаева, 1980)
Факторы риска Оценка в баллах
Социально-биологические факторы
Возраст матери:
моложе 20 лет 2
30-34 года 2
35-39 лет 3
40 лет и старше 4
Возраст отца:
40 лет и более 2
Профессиональные вредности:
у матери 3
у отца 3
Вредные привычки
у матери:
Курение (одна пачка сигарет в день) 1
Злоупотребление алкоголем 2
у отца:
Злоупотребление алкоголем 2
Эмоциональные нагрузки у матери 2
Рост и масса тела матери:
Рост 150 см и менее 2
Масса тела на 25% выше нормы 2
Акушерско-гинекологический анамнез
Паритет (число предшествующих родов):
4-7 1
8 и более 2
Аборты перед родами у первородящих:
1 2
2 3
3 и более 4
Аборты в промежутках между родами:
3 и более 2
Преждевременные роды:
1 2
2 и более 3
Мертворождение:
1 3
2 и более 8
Смерть детей в неонатальном периоде:
одного ребенка 2
двух и более детей 7
Аномалии развития у детей 3
Неврологические нарушения у детей 2
Масса тела доношенных детей менее 2500 г или 4000 г и более 2
Бесплодие:
2-4 года 2
5 лет и более 4
Рубец на матке после операции 3
Опухоли матки и яичников 3
Истмико-цервикальная недостаточность 2
Пороки развития матки 3
Экстрагенитальные заболевания беременной
Сердечно-сосудистые:
Пороки сердца без нарушения кровообращения 3
Пороки сердца с нарушением кровообращения 10
Гипертоническая болезнь I-II-III стадий 2-8-12
Вегетососудистая дистония 2
Заболевания почек:
До беременности 3
обострение заболевания при беременности 4
Заболевания надпочечников 7
Сахарный диабет 10
сахарный диабет у родственников 1
Заболевания щитовидной железы 7
Анемия (содержание гемоглобина 90-100-110 г/л) 4-2-1
Нарушение свертываемости крови 2
Миопия и другие заболевания глаз 2
Хронические инфекции (туберкулез, бруцеллез, сифилис, токсоплазмоз и др.) 3
Острые инфекции 2
Осложнения беременности
Выраженный ранний токсикоз беременных 2
Поздний токсикоз беременных:
водянка 2
нефропатия беременных I-II-III степени 3-5-10
преэклампсия 11
эклампсия 12
Кровотечение в первой и второй половине беременности 3-5
Резус- и АВ0-изосенсибилизация 5-10
Многоводие 4
Маловодие 3
Тазовое предлежание плода 3
Многоплодие 3
Переношенная беременность 3
Неправильное положение плода (поперечное, косое) 3
Патологические состояния плода и некоторые показатели нарушения его жизнедеятельности
Гипотрофия плода 10
Гипоксия плода 4
Содержание эстриола в суточной моче
менее 4,9 мг в 30 нед. беременности 34
менее 12 мг в 40 нед. беременности 15
Изменение околоплодных вод при амниоскопии 8
При сумме баллов 10 и более - риск перинатальной патологии высокий, при сумме 5-9 баллов - средний, при сумме 4 балла и менее - низкий.
DrgLena
23.03.2011 - 11:43
Рассчитывать вероятность рецидива у больных с количеством МТС 2- 5 ? - понять такое смысловое содержание цели логистической регрессии не просто. Если имеется такое число МТС, какой смысл искать еще и рецидив опухоли?
При таком подходе вы можете получить только такой вывод, с увеличением числа МТС на 1 вероятность рецидива опухоли повышается в? раз. Отсутствие или 1 МТС не участвует в оценке.
Экспоненциальное значение коэффициента уравнения регрессии показывает как изменяется риск с увеличением на единицу значения признака, подумайте, какими единицами измерена у вас , например , дифференцировка, по моему как и клеточный тип опухоли, это чисто номинальный признак, обозначьте три уровня не 1, 2 и 3, а А Б С и поймете, что для ее оценки в программе Statistica возможности нет, в этой программе логистическая регрессия реализована только для количественных или бинарных переменных. Стадия также имеет 3 градации и вовсе не обязательно риск возрастает абсолютно одинаково при второй относительно первой и третьей относительно второй. Для проведения логистической регрессии для таких признаков нужно использовать другие программы, например SPSS, где эта возможность реализована.
В примере из монографии оценки рисков вряд ли получены логистической регрессией, скорее всего, или в лучшем случае, были рассчитаны диагностические коэффициенты и по сумме ДК (обсуждалось на форуме) созданы группы риска. А может, просто среднепотолочные бальные значения выставленные ?экспертами?. Возможно метод описан в монографии. Желательно, чтобы такой диагностический или прогностический тест сопровождался цифрами чувствительности и специфичности, чтобы было понятно какова его точность, сколько ложноположительных и ложноотрицательных значений может быть получено.
mamalita
23.03.2011 - 18:06
Добрый день! Спасибо, что откликнулись. Сразу поясню ситуацию с количеством метастазов - столько их было до операции. Мы их все удалили хирургическим путем (во всяком случае, думаем что удалили) и наблюдаем этих пациентов в течение 5 лет. За это время рецидив либо появляется либо нет. У нас есть время появления рецидива - наверное нужно анализ времен жизни (регрессия Кокса?), просто я до этого еще не дошла. Хотела оценить в принципе высока или нет вероятность рецидивов при сочетании тех или иных факторов и сделать доступную таблицу. Например, низкодифференцированная опухоль, 3 стадия, исходное число метастазов 5 штук - риск развития рецидива высокий (столько то балов). Может быть подскажете более рациональный метод?
По поводу Statistica6: можно ли сделать переменные dummy и тогда строить логистическую регрессию?
По поводу SPSS: можно ли в ней использовать качественные переменные например 3 градаций. У меня эта программа есть, но не умею с ней работать. Есть Attestat - может быть в ней что-то можно сделать?
Спасибо.
DrgLena
23.03.2011 - 20:19
В описанной задаче, действительно, важно оценить именно время безрецидивного течения, а так же и непосредственyю выживаемость больных после удаления МТС. Кокс регрессия для этого и предназначена. Предварительно можно проанализировать кривые Капран-Мейера для номинальных переменных, на их основе можно сделать бинарные переменные и включать их в кокс регрессионную модель.
mamalita
24.03.2011 - 14:15
Не могли бы вы пояснить. То есть с логрегрессией заморачиваться не стоит, а сразу регрессии Кокса. Сравнить кривые Каплана-Маейера например - три кривые по стадиям, три по дифференцировке - все отдельно, я правильно поняла? Там где будут значимые различия: например при 3 стадии чаще всего рецидивы, делаем бинарную переменную 1 - 1 и 2 стадия и 2- 3 стадия и включаем в качестве предиктора, и так со всеми остальными?
А что по поводу таблички? Поискала ссылки - это скорее всего последовательный анализ Вальда. Но насколько я поняла он нам не подходит. Все равно раз уж разговор зашел: спрошу: для одинаковых ошибок альфа =0,1 и бетта=0,05 будут одинаковые пороги независимо от количества больных и анализируемых факторов?
DrgLena
24.03.2011 - 21:19
Да, лучше сделать кокс-регрессию. Бинарные переменные кодируются 0 и 1, тогда exp коэффициент покажет во сколько возрастает риск рецидивирования при наличии фактора риска (1) против альтернативы ? его отсутствия (0).
По поводу Вальда, вам он не подходит по уже изложенной причине.
Пороги рассчитываются по формуле:
А=10log(aльфа/(1-бета))
В=10log((1-альфа)/бета)
Т.о. при α =β =0,05 порог +-13, при α =β =0,01, порог +-20.
Пороги не зависят от числа наблюдений и числа факторов. Возможно, эксперт может сделать промежуточную группу среднего риска исходя из сумм ДК при не достижении ни положительных, ни отрицательных порогов (зона неуверенной диагностики).
mamalita
25.03.2011 - 18:02
Спасибо. Попробую все прикинуть на кокс-регрессию.
Для просмотра полной версии этой страницы, пожалуйста,
пройдите по ссылке.