Вопрос по анализу данных - Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Вопрос по анализу данных

Alex Просмотр профиля	3.04.2007 - 19:02 Сообщение #1
Группа: Пользователи Сообщений: 6 Регистрация: 3.04.2007 Пользователь №: 4028	Уважаемые господа, можно ли обратиться к Вам за помощью? Имеется база данных, основанная на анкетировании более 1500 человек, в которой категориально (да - нет) отражены такие симптомы как головные боли, боли в пояснице, боли в грудной клетке и пр. (более 30), на их основе вычисленный индекс состояния здоровья (непрерывная величина от 0 до 1). Для каждого случая естественно записаны предикты, такие как населенный пункт, возраст (или возрастная группа), пол, профессия, привычки, группа риска (на основе воздействия химических загрязнителей поллютантов - 3 группы) и пр. Стоит задача выявить предикторы вызывающие значимое повышение отношение шансов наблюдаемых симптомов, а также оценить комплексное влияние этих факторов (предикторов). Попытка провести данный анализ методом логистической регрессии с помощью одноименного модуля epi info 2000 (стандартная программа используемая в эпидемиалогии и лежащая в свободном доступе) дает неплохие результаты при учете только одного из перечислденных факторов. При учете нескольких взаимодействующих факторов, получаем неподдающиеся интерпретации результаты, что может быть вызвано однако сильной взаимосвязью предикторов, которые возможно необходимо минимизировать (что не хотелось бы, из-за потери части информации). В связи с этим хотелось бы обратиться к Вам с вопросом, может имеет смысл воспользоваться каким-нибудь другим методом анализа? Будем рады любому ответу... P.S. Пользуем программу Statistica 6

Ответов

Alex Просмотр профиля	12.04.2007 - 16:16 Сообщение #2
Группа: Пользователи Сообщений: 6 Регистрация: 3.04.2007 Пользователь №: 4028	Это снова я.... извините за назойливость воспользовался SPSS, несмотря на наличие достаточного неплохого встроенного хелпа в ней, по всей видимости что-то делаю не так например: рассматриваемый фактор - боли в пояснице (да нет), ковариаты - предикторы: деревня, группа риска экспозиции, характер работы и др (все перекодировано в бинарную систему). регрессия бинарная логистическая, первая манипуляция метод вложения, дает достоверное влияние 5 факторов, токсикант, группа риска экспозиции, профессия... при этом наиболее значимый фактор - деревня! второй этап - метод forward stepwise (conditional) после пяти ступенях вложения, эти же значимые факторы, при этом на первой ступени - деревня и т.д. анализ -2 Log likelihood и Nagelkerke R Square дает основания полагать что улучшение модели значимо не происходит.... Model Summary Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 1 694,427 ,053 ,091 2 665,092 ,086 ,146 3 656,558 ,095 ,162 4 650,481 ,102 ,173 5 643,623 ,109 ,186 то же самое и относительно Classification Table overall percentage на первом этапе - 83,9% на пятом - 85,5% Аналогичные данные получаются при использовании всех методов (Fw: LR, Wald; Bw: Cond, Lr, Wald). Уйти от кластеризованнаых данных не получается... Возможно от слабого знания стат пакета, не прописываю возможыные установки. Какой из перечисленных факторов наиболее ответственный за частоты шансов симтомов, не понятно. К слову сказать, в Epi info получаются несколько другие результаты, которые к тому же еще и различны в зависимости от того в какой очередности заданы предикторы в логистическую регрессию (странно....) Исходя из вышеизложенного, уважаемый совет, буду рад за любые комментарии относительно письма, даже в виде "ты не дочитал, хелп....." С уважением, Алекс

Сообщений в этой теме

Alex Вопрос по анализу данных 3.04.2007 - 19:02

плав Боюсь, что тут вышла некоторая путаница Логистиче... 3.04.2007 - 23:08

Alex Огромное спасибо за оперативный ответ! По всей... 4.04.2007 - 19:02

Те Чжоу Ой! А можно ответ в форум а не на e-mail. Тоже... 4.04.2007 - 20:17

плав Ну, если кратко. Для анализа бинарных переменных в... 7.04.2007 - 16:05

Alex Огромное спасибо за обстоятельный ответ, извините ... 7.04.2007 - 19:16

Игорь Цитата(Alex @ 3.04.2007 - 19:02) 270... 10.04.2007 - 09:05

Alex Это снова я.... извините за назойливость воспользо... 12.04.2007 - 16:16

плав Если Вы привели данные по регрессиям с вводом по о... 14.04.2007 - 11:24

Tatiana У меня тоже есть вопрос по применению логистическо... 15.08.2007 - 23:17

плав Цитата(Tatiana @ 16.08.2007 - 00:17)... 27.08.2007 - 10:44

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум