![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 ![]() |
Уважаемые форумчане! Всем добрый день. С монофакторным анализом я вроде бы разобралась. Теперь нужно сделать многофакторный. Я постараюсь коротко изложить задачу, которая передо мной стоит и очень надеюсь на вашу помощь.
Есть следующие данные - построены в табличке примерно такой: №||Результат:1-есть,0-нет ||Признак А:1-есть признак,0 -нет признака ||Признак В:1- есть,0 -нет ||Признак С:1-есть, 0 - нет || и т.д. 1 | 1 | 0 | 0 | 0 | 2 | 1 | 0 | 0 | 1 | 3 | 0 | 1 | 0 | 0 | 4 | 1 | 0 | 0 | 1 | 5 | 0 | 1 | 1 | 0 | 6 | 0 | 1 | 0 | 0 | 7 | 1 | 0 | 1 | 0 | и т.д. Я ввожу эти данные в программу Статистика. А вот что делать дальше - это уже сложнее. На выходе мне нужно получить примерно следующий результат: Для комбинациии признаков АВ Относительный риск =...., ДИ = ...., Р= ....., Для комбинации признаков АВС Относительный риск =...., ДИ = ...., Р= ....., Для комбинации признаков АС Относительный риск =...., ДИ = ...., Р= ....., и т.д. по разным комбинациям. Подскажите пожалуйса, на какие кнопки последовательно жать и в получившихся данных где искать ответы на мои вопросы. Там же в резульатах всегда много цифр и не всегда понятно, что есть что. Очень надеюсь на вашу помощь. Сообщение отредактировал Solo... - 21.12.2008 - 11:03 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
Если вы не можете ничем помочь, это понятно - сложно объяснять тому, кто мало знаком со статистикой. Но такого рода советы тоже, на мой взгляд, лишние... Кому они нужны? Постараюсь помочь, если приведенные данные реальные. Но в этом случае нужно начать не с логистической регрессии, а с более простого взгляда на данные. По вашим данным, между результатом и признаками существует следующая корреляционная связь (рагновая, по Спирмену) 1 2 3 4 результат -1.00000 -1.00000 -0.091287 0.547723 Т.е. если имеется 1 и 2 признак (1), то результат отсутствует (0). Т.о. в таблице 2х2 у вас в двух ячейках «0». Можно посчитать OR или RR только, если добавить 0,5 к каждому значению в четырехпольной таблице. Тогда OR=0.016, можете и RR =0.14 также руками посчитать. Признак 3 не влияет на результат, мы его пропустим. Четвертый влияет на результат, постройте таблицу 2х2 и посчитайте OR аналогично, добавляя 0.5 в каждую ячейку OR=7.0, но 95% Ди 0.2-219.0. Если вы при таких данных хотите оценить одновременно результат влияния нескольких таких признаков, используя логистическую регрессию, которая теоретически была бы очень хороша, но оценки у вас будут весьма сомнительны из за того, что предикторы very redundant. Очевидно, это вам программа и выдает. Вот, как смогла, .... А про плохо обусловленную матрицу пусть Плав расскажет. Сообщение отредактировал DrgLena - 23.12.2008 - 02:08 |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 ![]() |
Постараюсь помочь, если приведенные данные реальные. ... Если вы при таких данных хотите оценить одновременно результат влияния нескольких таких признаков, используя логистическую регрессию, которая теоретически была бы очень хороша, но оценки у вас будут весьма сомнительны из за того, что предикторы very redundant. Очевидно, это вам программа и выдает. Вот, как смогла, .... А про плохо обусловленную матрицу пусть Плав расскажет. DrgLena, спасибо за участие. Все таки я пыталась это сделать с помощью логистической регрессии. Сначала я сделала унивариантный анализ - это мне подробо рассказал Плав. Он мне очень помог. Я это все сделала, хоть и не сразу дошло. Далее я хотела с помощью этого же метода провести многофакторный анализ. С ним мне тоже помогал Плав. Но в тех данных , которые у меня есть, там многие "ячейки" пропущены. Т.е. например, какой то признак есть не у каждого больного (ну, в силу разных причин не удалось провести всем больным это исследование). И по этому не все получается. При проведении этого многофактороного анализа (так я называю метод лог.регресссии для нескольких признаков одновременно), машина не все считает - при какой то комбинации признаков выдает результат, при какой то - нет. Кстати, ведь слово redundant обозначает "лишний". В общем, не очень это понятно, т.к. ведь признаков - не хватает, а они "лишними " называются. Или машина не выдает р. В связи с этим, у меня есть 2 теоретических вопроса: 1. Можно ли провести кластерный анализ в недостающих ячейках? Правильно ли я понимаю, что кластерный анализ позволяет восполнить пустые ячейки - те, в которых данных о признаке нет? А после этого уже снова провести унивариантный и многофакторный анализ с помощью логистической регрессии? Будет ли это правомерно? 2. Можно ли в работе привести данные только унивариантного анализа без многофакторного? Или это на столько взаимосвязано, что один без другого - будет нелепо? Просто очень часто в статьях эти 2 анализа идут рядом. Да, они оба несут каждый свою информацию, но все таки если есть данные только по унивариантному, можно ли размещать только его? |
|
![]() |
![]() |
![]() ![]() |