![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 9 Регистрация: 31.08.2010 Пользователь №: 22710 ![]() |
Здравствуйте!
Есть зависимая переменная инсульт и факторы: сахарный диабет (СД) и курение (К). С помощью логистической регрессии (PASW 18) получаю отношения шансов для СД (8,521) и для К (1,328). Затем добавляю в модель взаимодействие СД*К и получаю такие коэффициенты: CODE СД 2,068 (значимость - 0,000) К 0,271 (значимость - 0,226) СД*К 0,358 (значимость - 0,769) Конст. -0,904 (значимость - 0,000) Интерпретирую их так: У не курильщиков СД повышает риск инсульта в exp(2,068)=7,909 раз У курильщиков СД повышает риск инсульта в exp(2,068+0,358)=11,314 раз У не диабетиков курение повышает риск инсульта в exp(0,271)=1,311 раз У диабетиков курение повышает риск инсульта в exp(0,271+0,358)=1,876 раз Вопрос 1: правильно ли всё это? Вопрос 2: Как считать доверительные интервалы (ДИ) для этих ОШ? PASW считает exp(B) с доверительным интервалом. Я должен просуммировать границы ДИ для exp(B) для коэффициентов, которые складываю? Вопрос 3: PASW выдает значимость для факторов. Зачем она может быть нужна? Я смотрю на границы ДИ для ОШ, и если в них попадает 1, значит изменение риска не значимо. Нужно ли мне при интерпретации результатов использовать ещё и эту значимость. Вопрос 4: как посчитать ОШ для курящих диабетиков по сравнению со всеми остальными? Нужно перемножить ОШ? 8,521 * 1,328 = 11,316 Но тогда не учитывается связь между СД и К. И как в этом случае получить доверительный интервал? Вопрос 5. Вообще факторов порядка 20 и для многих из них увеличение риска статистически не значимо (ОШ ~ 1). Но вполне возможно, что сочетания таких факторов дают значимое увеличение риска. Как лучше всего выбрать комбинации факторов? И как посчитать для этих сочетаний ОШ с ДИ? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
По-моему у них не очень точные формулировки: А именно? С увеличением зарплаты шансы алкоголизма увеличиваются на 4.4% только для женщин, а не в среднем для всех. Нет, это независимое влияние фактора. На 4,4% увеличивается шанс алкоголизма при повышении зарплаты относительно тех у кого зарплата не увеличивается. Для мужчин прибавка к зарплате увеличивает шансы на 4,4%*(100%-3,8%)=0,4%=exp(0,0432-0,0390) Из их фразы можно понять, что прибавка к зарплате для мужчин увеличивает шансы на 4,4%-3,8%=0,6% Нет, уменьшает, ??.правда такая прибавка мужчине одновременно уменьшает это отношение на 3.8% (5.7%-1.9%)? , поскольку exp(b) для взаимодействия меньше единицы. 1,0-0,9618=0,0382. Это уменьшение и есть результат взаимодействия факторов. Предлагаемой вами формулы у них вообще нет: exp(0,0432+0,8801-0,0390)=увеличение в 2,4 раза Вы дойдите до конца любого примера. Ваш не сложный, два бинарный фактора, вы получите 4 значения вероятности в зависимости от сочетания факторов. Пример по вашей ссылке ucla c предоставлением файла данных, легко используемый в любом стат. gакетt, там расчет в Stata, но с SPSS совпадает полностью (контраст ? переменная пол, а переменная взаимодействия должна быть создана). Но там количественные переменные, а ваши все бинарные. Если вы представите пример своих данных, будет легче, вы поймете, что не группы сравниваются, а риск оценивается относительно альтернативы,т.е. относительно отсутствия фактора риска. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 9 Регистрация: 31.08.2010 Пользователь №: 22710 ![]() |
Нет, это независимое влияние фактора. На 4,4% увеличивается шанс алкоголизма при повышении зарплаты относительно тех у кого зарплата не увеличивается. Нет, если в логистической регрессии есть взаимодействие факторов (пол*зарплата), то просто ОШ для повышения зарплаты уже не посчитать. Только отдельно для мальчиков и отдельно для девочек. Прикладываю данные по инсультам, если кого-нибудь заинтересуют... у некоторых пациентов неизвестен фактор курения или СД, но PASW справляется...
Прикрепленные файлы
|
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Помогите, пожалуйста, разобраться, мне совсем не понятно: 1) Какие отношения шансов более правильные (лучше характеризуют влияние СД на инсульт)? 2) И какую таблицу сопряженности нужно построить, чтобы получить ОШ 8,521 Я подозреваю, что при расчете вторым способом мы исключаем связь СД и К и получаем более точное ОШ... Вот, нашел ссылку: http://www.childrensmercy.org/stats/model/logistic.asp Если я всё правильно понял, то мои подозрения правильные: 8,521 - согласованное ОШ для СД 7,229 - сырое ОШ для СД "Правильные" или "неправильные" это не то понятие. Вас интересует влияние СД на инсульт. Если курение обладает независимым влиянием на инсульт, и есть взаимодействие СД и курения, то надо использовать модель, которая включает СД, курение и взаимодействие. Тогда описание будет включать указание того факта, что при наличии СД курение усиливает риск в большей степени, чем у курильщиков без СД (или что у курильщиков СД усиливает риск больше, чем у не курящих - модель одна и та же). Сырыми (crude) отношениями шансов называются те, в которых не выполняется коррекция по другим факторам риска. Соответственно, первое из приведенных Вами ОШ является сырым. Сырое отношение шансов, это то, которое получается в модели без включения курения. Откорректированное (adjusted) - после включения курения в модель, наличие или отсутствие взаимодействия только относятся к адекватности модели, а не к корректировке (поскольку сразу после включения курения в модель проводится корректировка шансов). Допустим мы посчитали ОШ так: log_odds=beta0 + beta_dm*1 log_odds=beta0 + beta_dm*0 log_OR=beta_dm = 7,229 и так (ОШ для СД при фиксированном факторе курения): log_odds=beta0 + beta_dm*1 + beta_sm*0 log_odds=beta0 + beta_dm*0 + beta_sm*0 log_OR=beta_dm = 8,521 log_odds=beta0 + beta_dm*1 + beta_sm*1 log_odds=beta0 + beta_dm*0 + beta_sm*1 log_OR=beta_dm = 8,521 Второе отношение шансов - это откорректированное на действие курения ОШ для связи СД и инсульта. Это модельная величина, посему напрямую из таблицы сопряженности ее не получить (фактически усреднение двух ОШ для таблицы СД*инсульт для курящих и СД*инсульт для некурящих). Тем, что в примере выше Вы не включили взаимодействие в расчет ОШ, Вы посчитали, что эти два ОШ (для курящих и некурящих) примерно равны и их можно усреднить. Наличие взаимодействия говорит о том, что эти два ОШ отличаются друг от друга. |
|
![]() |
![]() |
![]() ![]() |