![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 ![]() |
Уважаемые форумчане! Всем добрый день. С монофакторным анализом я вроде бы разобралась. Теперь нужно сделать многофакторный. Я постараюсь коротко изложить задачу, которая передо мной стоит и очень надеюсь на вашу помощь.
Есть следующие данные - построены в табличке примерно такой: №||Результат:1-есть,0-нет ||Признак А:1-есть признак,0 -нет признака ||Признак В:1- есть,0 -нет ||Признак С:1-есть, 0 - нет || и т.д. 1 | 1 | 0 | 0 | 0 | 2 | 1 | 0 | 0 | 1 | 3 | 0 | 1 | 0 | 0 | 4 | 1 | 0 | 0 | 1 | 5 | 0 | 1 | 1 | 0 | 6 | 0 | 1 | 0 | 0 | 7 | 1 | 0 | 1 | 0 | и т.д. Я ввожу эти данные в программу Статистика. А вот что делать дальше - это уже сложнее. На выходе мне нужно получить примерно следующий результат: Для комбинациии признаков АВ Относительный риск =...., ДИ = ...., Р= ....., Для комбинации признаков АВС Относительный риск =...., ДИ = ...., Р= ....., Для комбинации признаков АС Относительный риск =...., ДИ = ...., Р= ....., и т.д. по разным комбинациям. Подскажите пожалуйса, на какие кнопки последовательно жать и в получившихся данных где искать ответы на мои вопросы. Там же в резульатах всегда много цифр и не всегда понятно, что есть что. Очень надеюсь на вашу помощь. Сообщение отредактировал Solo... - 21.12.2008 - 11:03 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
DrgLena, спасибо за участие. Но в тех данных , которые у меня есть, там многие "ячейки" пропущены. Т.е. например, какой то признак есть не у каждого больного (ну, в силу разных причин не удалось провести всем больным это исследование). В тех данных, которые вы привели, нет пропущенных значений. И "0" и "1" означают значение признака, а если исследование не проводилось, тогда будет пропущенное. На первый вопрос ответ - нет! У кластерного анализа другие задачи. На второй вопрос ответ - да! Можно в работе привести результат одновариантного анализа. Действительно ли у вас только 7 наблюдений? Тогда, для каждого признака (предиктора) постройте четырехпольные таблицы, по ним посчитайте OR и 95%ДИ. Результат расчета руками и при использовании одновариантной логистической регрессии exp (b) совпадет. Но при условии, что в ячейках четырехпольной таблицы не будет нулей. Redundant означает не недостаток ваших данных, у вас как раз все значения в вашем примере есть, а избыточность данных в том смысле, что все значения фактора - в одной категории результата. Четырехпольная таблица по первым двум признакам: a b c d =0 4 3 0. Это ясно? Или коэффициент корреляции r=-1.0. Сообщение отредактировал DrgLena - 23.12.2008 - 11:50 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 ![]() |
На первый вопрос ответ - нет! У кластерного анализа другие задачи. На второй вопрос ответ - да! Можно в работе привести результат одновариантного анализа. Действительно ли у вас только 7 наблюдений? Нет-нет, у меня вовсе не 7 наблюдений. Это я просто привела пример той таблицы с данными, которые у меня есть. Я там даже написала "т.д." - я думала, что станет от этого ясно, что эти данные - просто как пример. На самом деле у меня 78 пациентов. У одних есть хороший результат лечения, у других - его нет. И есть ряд признаков (около 12), от которых мы предполагаем зависимость результатов. В клинике все почти ясно - зависимость вырисовывается. А вот статистически надо это оформить. По унивариантному анализу - все хорошо вышло, все почти совпадает с клиническим данными, расхождений нет. А вот с многофакторынм я зависла. Дело в том, что есть признаки, которые нам удалось проверить не у каждого больного . И если унивариантный анализ нам дает результат, то когда я начинаю во второе окошко Var вводить несколько признаков (а не один, как при попарной лог.регрессии для унивар.анализа), то машина не выдает ничего или через раз выдает. Я думаю, что это из за того, что нет данных во всех ячейках, черт бы их побрал. Еще вот что. Если рассмотреть группу из 78 человек, у которых то там то сям отсутствуют какие то признаки , то получились некоторые результаты. Если рассмотреть группу примерно из 30 человек , у которых есть ВСЕ данные по всем признакам - то РЕЗУЛЬТАТЫ СОВПАДАЮТ с теми, что получены у 78 - практически полностью . Казалось бы, можно взять и написать про 30 человек, но это - очень мало. И выглядит не солидно. Заболевание , про которое мы пишем, редкое и эта работа включает наблюдения за больными в течение 9 лет (в смысле столько было больных за эти годы). По этому каждый больной - на вес золота, и кого то выкидывать - не очень хочется. Вот я по этому спросила про кластерный анализ. Жалко, что его нельзя. Что же делать ? |
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 381 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 ![]() |
Я думаю, что это из за того, что нет данных во всех ячейках, черт бы их побрал. Обычная логистическая регрессия в SPSS и Statistica не работает с пропущенными данными. Нужно искать более продвинутые методы.![]() Просто включи мозги => http://doctorstat.narod.ru
|
|
![]() |
![]() |
![]() ![]() |