Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Вопрос по анализу данных
Alex
сообщение 3.04.2007 - 19:02
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 3.04.2007
Пользователь №: 4028



Уважаемые господа, можно ли обратиться к Вам за помощью?
Имеется база данных, основанная на анкетировании более 1500 человек, в которой категориально (да - нет) отражены такие симптомы как головные боли, боли в пояснице, боли в грудной клетке и пр. (более 30), на их основе вычисленный индекс состояния здоровья (непрерывная величина от 0 до 1). Для каждого случая естественно записаны предикты, такие как населенный пункт, возраст (или возрастная группа), пол, профессия, привычки, группа риска (на основе воздействия химических загрязнителей поллютантов - 3 группы) и пр.
Стоит задача выявить предикторы вызывающие значимое повышение отношение шансов наблюдаемых симптомов, а также оценить комплексное влияние этих факторов (предикторов).

Попытка провести данный анализ методом логистической регрессии с помощью одноименного модуля epi info 2000 (стандартная программа используемая в эпидемиалогии и лежащая в свободном доступе) дает неплохие результаты при
учете только одного из перечислденных факторов. При учете нескольких взаимодействующих факторов, получаем
неподдающиеся интерпретации результаты, что может быть вызвано однако сильной взаимосвязью предикторов, которые возможно необходимо минимизировать (что не хотелось бы, из-за потери части информации).

В связи с этим хотелось бы обратиться к Вам с вопросом, может имеет смысл воспользоваться каким-нибудь другим методом анализа?

Будем рады любому ответу...

P.S. Пользуем программу Statistica 6
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Tatiana
сообщение 15.08.2007 - 23:17
Сообщение #2





Группа: Пользователи
Сообщений: 7
Регистрация: 15.08.2007
Пользователь №: 4262



У меня тоже есть вопрос по применению логистической регрессии, пожалуйста, подскажите.
Если в модели используются порядковые независимые переменные, не бинарные, напрммер степень выраженности чего либо (1 - нет, 2-слабая, 3- сльная). Зависимая - бинарная, как полагается ( 1 -есть болезнь, 0 -нет), то как интерпретировать результаты? Как правильно оценить риск развития заболевания от этого фактора?. Пользуюсь Statistica 6. Расчетная величина OR=3.5. Это как правильно интерпретировать?
Когда независимая бинарная понятно. Или нужно все-таки разбивать независимую на несколько бинарных переменных. Подскажите, пожалуйста, кто сталкивался с этим.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 27.08.2007 - 10:44
Сообщение #3





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Tatiana @ 16.08.2007 - 00:17) [snapback]3157[/snapback]
У меня тоже есть вопрос по применению логистической регрессии, пожалуйста, подскажите.
Если в модели используются порядковые независимые переменные, не бинарные, напрммер степень выраженности чего либо (1 - нет, 2-слабая, 3- сльная). Зависимая - бинарная, как полагается ( 1 -есть болезнь, 0 -нет), то как интерпретировать результаты? Как правильно оценить риск развития заболевания от этого фактора?. Пользуюсь Statistica 6. Расчетная величина OR=3.5. Это как правильно интерпретировать?
Когда независимая бинарная понятно. Или нужно все-таки разбивать независимую на несколько бинарных переменных. Подскажите, пожалуйста, кто сталкивался с этим.

Если Вы кодировали переменные так, как написали - 1,2,3, то интерпретировать отношение шансов бессмысленно - Вы предположили, что "дистанция" от слабого до сильного и от отсутствия до слабого одинаковая.
Надо делать так: вместо одной переменной с тремя уровнями сделать две бинарных переменных. Например - Exist (0 - нет, 1- да) и Severity (0- нет или слабая, 1 - сильная). Тогда Вы полностью описываете свою классификацию:
Exist Severity
нет 0 0
слабая 1 0
сильная 1 1
Получаете два отношения шансов. Первое показывает во сколько раз наличие чего-то увеличивает шансы наличия заболевания, второе - во сколько раз сильное воздействие увеличивает шансы наличия заболевания по сравнению с отсутствием/слабоым воздействием. Произведение отношения шансов - во сколько раз риск при сильной выраженности больше, чем при отсутствии и т.д.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему