Есть зависимая переменная инсульт и факторы: сахарный диабет (СД) и курение (К).
С помощью логистической регрессии (PASW 18) получаю отношения шансов для СД (8,521) и для К (1,328).
Затем добавляю в модель взаимодействие СД*К и получаю такие коэффициенты:
CODE
СД 2,068 (значимость - 0,000)
К 0,271 (значимость - 0,226)
СД*К 0,358 (значимость - 0,769)
Конст. -0,904 (значимость - 0,000)
К 0,271 (значимость - 0,226)
СД*К 0,358 (значимость - 0,769)
Конст. -0,904 (значимость - 0,000)
Интерпретирую их так:
У не курильщиков СД повышает риск инсульта в exp(2,068)=7,909 раз
У курильщиков СД повышает риск инсульта в exp(2,068+0,358)=11,314 раз
У не диабетиков курение повышает риск инсульта в exp(0,271)=1,311 раз
У диабетиков курение повышает риск инсульта в exp(0,271+0,358)=1,876 раз
Вопрос 1: правильно ли всё это?
Вопрос 2: Как считать доверительные интервалы (ДИ) для этих ОШ? PASW считает exp(B) с доверительным интервалом. Я должен просуммировать границы ДИ для exp(B) для коэффициентов, которые складываю?
Вопрос 3: PASW выдает значимость для факторов. Зачем она может быть нужна? Я смотрю на границы ДИ для ОШ, и если в них попадает 1, значит изменение риска не значимо. Нужно ли мне при интерпретации результатов использовать ещё и эту значимость.
Вопрос 4: как посчитать ОШ для курящих диабетиков по сравнению со всеми остальными? Нужно перемножить ОШ?
8,521 * 1,328 = 11,316
Но тогда не учитывается связь между СД и К. И как в этом случае получить доверительный интервал?
Вопрос 5. Вообще факторов порядка 20 и для многих из них увеличение риска статистически не значимо (ОШ ~ 1). Но вполне возможно, что сочетания таких факторов дают значимое увеличение риска. Как лучше всего выбрать комбинации факторов? И как посчитать для этих сочетаний ОШ с ДИ?