![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 3.04.2007 Пользователь №: 4028 ![]() |
Уважаемые господа, можно ли обратиться к Вам за помощью?
Имеется база данных, основанная на анкетировании более 1500 человек, в которой категориально (да - нет) отражены такие симптомы как головные боли, боли в пояснице, боли в грудной клетке и пр. (более 30), на их основе вычисленный индекс состояния здоровья (непрерывная величина от 0 до 1). Для каждого случая естественно записаны предикты, такие как населенный пункт, возраст (или возрастная группа), пол, профессия, привычки, группа риска (на основе воздействия химических загрязнителей поллютантов - 3 группы) и пр. Стоит задача выявить предикторы вызывающие значимое повышение отношение шансов наблюдаемых симптомов, а также оценить комплексное влияние этих факторов (предикторов). Попытка провести данный анализ методом логистической регрессии с помощью одноименного модуля epi info 2000 (стандартная программа используемая в эпидемиалогии и лежащая в свободном доступе) дает неплохие результаты при учете только одного из перечислденных факторов. При учете нескольких взаимодействующих факторов, получаем неподдающиеся интерпретации результаты, что может быть вызвано однако сильной взаимосвязью предикторов, которые возможно необходимо минимизировать (что не хотелось бы, из-за потери части информации). В связи с этим хотелось бы обратиться к Вам с вопросом, может имеет смысл воспользоваться каким-нибудь другим методом анализа? Будем рады любому ответу... P.S. Пользуем программу Statistica 6 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Если Вы привели данные по регрессиям с вводом по одной переменной, то улучшение модели - значительное - происходит. Смотрите, на последнем этапе -2LL 643,6, а на предыдущем - 650,5. Разность (уменьшение неопределенности ввиду добавления дополнительной переменной) - почти 7. Поскольку добавлена одна переменная, это значение имеет распределение хи2 с 1 степенью свободы, пограничное значение для р=0,05 составляет 3,84. Соответственно, модель улучшилась значительно по сравнению с предыдущим этапом.
Соответственно, Вам надо анализировать модель, полученную на последнем - пятом этапе. В таблице будут указаны пять факторов (они все значимые, это почти автоматом при пошаговом отборе переменных), их регресионные коэффициенты, ошибки регресионных коэффициентов и т.п. Значимость фактора определяется значением (абсолютным) коэффициента регрессии если все факторы бинарные. Проще пересчитать коэффициенты регрессии в отношения шансов (если SPSS этого не сделала) по формуле ОШ=exp(коэфф.регрессии). Чем больше ОШ, тем сильнее значимость фактора. Если какие-то показатели не бинарные - появляется небольшая проблема - как стандартизовать ОШ (ибо сравнивать изменение возраста на 1 год и АД на 1 мм. рт. ст. достаточно бессмысленно). В этом случае принято пойти в модуль описательной статистики и рассчитать для каждого показателя стандартное отклонение. Затем рассчитывается стандартизованный ОШ = exp(коэфф.регрессии*стандартное отклонение). Теперь можно сравнивать "по силе" факторы и качественные, и количественные. |
|
![]() |
![]() |
![]() ![]() |