логистическая регрессия |
Здравствуйте, гость ( Вход | Регистрация )
логистическая регрессия |
18.03.2011 - 22:49
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 7.04.2010 Пользователь №: 15366 |
Здравствуйте! Прошу о помощи. Провожу оценку факторов риска, влияющих на развитие рецидива у онкологических больных. Зависимая переменная - отсутствие или наличие рецидива. Независимые - возраст (количественная), время возникновения МТС с момента операции (количественная), стадия (3 градации), дифференцировка (3 градации), количество метастазов (2-5), размер (1-5), суммарный диаметр (2-10). Если строить логит-регрессии отдельно для каждого фактора - модель значимая, процент правильных предсказаний около 78%, соответственно коэффициенты для каждого фактора значимы. Когда ввожу их все вместе, модель значимая но остается значимых только два фактора (возраст, время возникновения МТС), строю для этих 2 факторов - возраст становится незначимым, его убираю качество предсказания ухудшается. Что с этим делать? Программа у меня Statistica6. Второй момент, хотелось бы сделать из этого практический выход, как например таблица оценки перинатальных факторов риска (пример см ниже). Возможно ли это и как это сделать? Может быть есть ссылки на литературу особенно с примерами. Буду признательна за помощь.
Оценка пренатальных факторов риска (О.Г. Фролова, Е.И. Николаева, 1980) Факторы риска Оценка в баллах Социально-биологические факторы Возраст матери: моложе 20 лет 2 30-34 года 2 35-39 лет 3 40 лет и старше 4 Возраст отца: 40 лет и более 2 Профессиональные вредности: у матери 3 у отца 3 Вредные привычки у матери: Курение (одна пачка сигарет в день) 1 Злоупотребление алкоголем 2 у отца: Злоупотребление алкоголем 2 Эмоциональные нагрузки у матери 2 Рост и масса тела матери: Рост 150 см и менее 2 Масса тела на 25% выше нормы 2 Акушерско-гинекологический анамнез Паритет (число предшествующих родов): 4-7 1 8 и более 2 Аборты перед родами у первородящих: 1 2 2 3 3 и более 4 Аборты в промежутках между родами: 3 и более 2 Преждевременные роды: 1 2 2 и более 3 Мертворождение: 1 3 2 и более 8 Смерть детей в неонатальном периоде: одного ребенка 2 двух и более детей 7 Аномалии развития у детей 3 Неврологические нарушения у детей 2 Масса тела доношенных детей менее 2500 г или 4000 г и более 2 Бесплодие: 2-4 года 2 5 лет и более 4 Рубец на матке после операции 3 Опухоли матки и яичников 3 Истмико-цервикальная недостаточность 2 Пороки развития матки 3 Экстрагенитальные заболевания беременной Сердечно-сосудистые: Пороки сердца без нарушения кровообращения 3 Пороки сердца с нарушением кровообращения 10 Гипертоническая болезнь I-II-III стадий 2-8-12 Вегетососудистая дистония 2 Заболевания почек: До беременности 3 обострение заболевания при беременности 4 Заболевания надпочечников 7 Сахарный диабет 10 сахарный диабет у родственников 1 Заболевания щитовидной железы 7 Анемия (содержание гемоглобина 90-100-110 г/л) 4-2-1 Нарушение свертываемости крови 2 Миопия и другие заболевания глаз 2 Хронические инфекции (туберкулез, бруцеллез, сифилис, токсоплазмоз и др.) 3 Острые инфекции 2 Осложнения беременности Выраженный ранний токсикоз беременных 2 Поздний токсикоз беременных: водянка 2 нефропатия беременных I-II-III степени 3-5-10 преэклампсия 11 эклампсия 12 Кровотечение в первой и второй половине беременности 3-5 Резус- и АВ0-изосенсибилизация 5-10 Многоводие 4 Маловодие 3 Тазовое предлежание плода 3 Многоплодие 3 Переношенная беременность 3 Неправильное положение плода (поперечное, косое) 3 Патологические состояния плода и некоторые показатели нарушения его жизнедеятельности Гипотрофия плода 10 Гипоксия плода 4 Содержание эстриола в суточной моче менее 4,9 мг в 30 нед. беременности 34 менее 12 мг в 40 нед. беременности 15 Изменение околоплодных вод при амниоскопии 8 При сумме баллов 10 и более - риск перинатальной патологии высокий, при сумме 5-9 баллов - средний, при сумме 4 балла и менее - низкий. |
|
23.03.2011 - 11:43
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Рассчитывать вероятность рецидива у больных с количеством МТС 2- 5 ? - понять такое смысловое содержание цели логистической регрессии не просто. Если имеется такое число МТС, какой смысл искать еще и рецидив опухоли?
При таком подходе вы можете получить только такой вывод, с увеличением числа МТС на 1 вероятность рецидива опухоли повышается в? раз. Отсутствие или 1 МТС не участвует в оценке. Экспоненциальное значение коэффициента уравнения регрессии показывает как изменяется риск с увеличением на единицу значения признака, подумайте, какими единицами измерена у вас , например , дифференцировка, по моему как и клеточный тип опухоли, это чисто номинальный признак, обозначьте три уровня не 1, 2 и 3, а А Б С и поймете, что для ее оценки в программе Statistica возможности нет, в этой программе логистическая регрессия реализована только для количественных или бинарных переменных. Стадия также имеет 3 градации и вовсе не обязательно риск возрастает абсолютно одинаково при второй относительно первой и третьей относительно второй. Для проведения логистической регрессии для таких признаков нужно использовать другие программы, например SPSS, где эта возможность реализована. В примере из монографии оценки рисков вряд ли получены логистической регрессией, скорее всего, или в лучшем случае, были рассчитаны диагностические коэффициенты и по сумме ДК (обсуждалось на форуме) созданы группы риска. А может, просто среднепотолочные бальные значения выставленные ?экспертами?. Возможно метод описан в монографии. Желательно, чтобы такой диагностический или прогностический тест сопровождался цифрами чувствительности и специфичности, чтобы было понятно какова его точность, сколько ложноположительных и ложноотрицательных значений может быть получено. |
|
23.03.2011 - 18:06
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 7.04.2010 Пользователь №: 15366 |
Добрый день! Спасибо, что откликнулись. Сразу поясню ситуацию с количеством метастазов - столько их было до операции. Мы их все удалили хирургическим путем (во всяком случае, думаем что удалили) и наблюдаем этих пациентов в течение 5 лет. За это время рецидив либо появляется либо нет. У нас есть время появления рецидива - наверное нужно анализ времен жизни (регрессия Кокса?), просто я до этого еще не дошла. Хотела оценить в принципе высока или нет вероятность рецидивов при сочетании тех или иных факторов и сделать доступную таблицу. Например, низкодифференцированная опухоль, 3 стадия, исходное число метастазов 5 штук - риск развития рецидива высокий (столько то балов). Может быть подскажете более рациональный метод?
По поводу Statistica6: можно ли сделать переменные dummy и тогда строить логистическую регрессию? По поводу SPSS: можно ли в ней использовать качественные переменные например 3 градаций. У меня эта программа есть, но не умею с ней работать. Есть Attestat - может быть в ней что-то можно сделать? Спасибо. |
|
23.03.2011 - 20:19
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
В описанной задаче, действительно, важно оценить именно время безрецидивного течения, а так же и непосредственyю выживаемость больных после удаления МТС. Кокс регрессия для этого и предназначена. Предварительно можно проанализировать кривые Капран-Мейера для номинальных переменных, на их основе можно сделать бинарные переменные и включать их в кокс регрессионную модель.
|
|
24.03.2011 - 14:15
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 7.04.2010 Пользователь №: 15366 |
Не могли бы вы пояснить. То есть с логрегрессией заморачиваться не стоит, а сразу регрессии Кокса. Сравнить кривые Каплана-Маейера например - три кривые по стадиям, три по дифференцировке - все отдельно, я правильно поняла? Там где будут значимые различия: например при 3 стадии чаще всего рецидивы, делаем бинарную переменную 1 - 1 и 2 стадия и 2- 3 стадия и включаем в качестве предиктора, и так со всеми остальными?
А что по поводу таблички? Поискала ссылки - это скорее всего последовательный анализ Вальда. Но насколько я поняла он нам не подходит. Все равно раз уж разговор зашел: спрошу: для одинаковых ошибок альфа =0,1 и бетта=0,05 будут одинаковые пороги независимо от количества больных и анализируемых факторов? |
|
24.03.2011 - 21:19
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Да, лучше сделать кокс-регрессию. Бинарные переменные кодируются 0 и 1, тогда exp коэффициент покажет во сколько возрастает риск рецидивирования при наличии фактора риска (1) против альтернативы ? его отсутствия (0).
По поводу Вальда, вам он не подходит по уже изложенной причине. Пороги рассчитываются по формуле: А=10log(aльфа/(1-бета)) В=10log((1-альфа)/бета) Т.о. при α =β =0,05 порог +-13, при α =β =0,01, порог +-20. Пороги не зависят от числа наблюдений и числа факторов. Возможно, эксперт может сделать промежуточную группу среднего риска исходя из сумм ДК при не достижении ни положительных, ни отрицательных порогов (зона неуверенной диагностики). Сообщение отредактировал DrgLena - 24.03.2011 - 21:20 |
|
25.03.2011 - 18:02
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 49 Регистрация: 7.04.2010 Пользователь №: 15366 |
Спасибо. Попробую все прикинуть на кокс-регрессию.
|
|