Монофакторный анализ. Как сделать? |
Здравствуйте, гость ( Вход | Регистрация )
Монофакторный анализ. Как сделать? |
7.12.2008 - 18:33
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Уважаемые форумчане!!! Я опять к вам за помощью. На этот раз я опять пользовалась поиском, но что то у меня ничего не нарисовалось почему то.
Есть результат лечения - положительный и отрицательный. И есть несколько факторов - пол, возраст, размеры опухоли, параметры лечения и ряд других. Как провести анализ зависимости результата от каждого в отдельности фактора? В одну колонку я вношу результат, в другие колонки - эти факторы. А как посчитать это с помощью Статистика - 6 или -7? Подскажите пожалуйста, на какие кнопки жать и какие параметры оценивать? Заранее спасибо. |
|
7.12.2008 - 20:28
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Вообще-то логистическая регрессия. Если бы не менюшный интефейс, то совет можно было бы дать, типа в R
glm(Y~age+sex+size+treat1,family="binomial"), но в Statistica процедура достаточно хорошо описана в хелпе. Идея в том, что вначале можно построить модель попарно с каждым фактором, затем все вместе. Т.е. зависимая переменная - исход (кодируйте 0 и 1), а независимые - изучаемые. Можно и поуродоваться - вначале для качественных переменных построить таблицы сопряженности (crosstables в базовой статистике), для количественных все равно придется делать унивариантную логистическую регрессию. |
|
8.12.2008 - 22:01
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Вообще-то логистическая регрессия. Если бы не менюшный интефейс, то совет можно было бы дать, типа в R glm(Y~age+sex+size+treat1,family="binomial"), но в Statistica процедура достаточно хорошо описана в хелпе. Идея в том, что вначале можно построить модель попарно с каждым фактором, затем все вместе. Т.е. зависимая переменная - исход (кодируйте 0 и 1), а независимые - изучаемые. Можно и поуродоваться - вначале для качественных переменных построить таблицы сопряженности (crosstables в базовой статистике), для количественных все равно придется делать унивариантную логистическую регрессию. Плав, спасибо большое, что откликаетесь. Я с помощью вас все таки провела РОК-анализ, и поняла что это такое. Книгу Флечера, которую вы мне советовали (да и не только вы) в другой теме, я , увы, не могу найти. Кроме того, изучить целую книгу - это не просто в условиях постоянного потока больных и кучи дел. Наука в нашем учреждении - дело прикладное. Так сказать, хобби. Уверена, что в "Статистике" это можно посчитать без глубоких знаний в статистической науке, нажимая на кнопки - знать бы на какие. Не подумайте, что я лишь поверхностно подхожу к делу. Просто мне кажется, что если я примерно понимаю, в чем суть монофакторного анализа, то зная, на что жать в Статистике, я это сделать смогу сама, не дергая людей. И еще понимать бы, что значит куча результатов на выходе. Не могли бы пошагово разъяснить, как это сделать? Я делаю несколько вергикальных колонок - вар.1 - это результат (о - плохой, 1 - хороший - так кодирую), вар.2 - и последующие варианты - это признаки, от которых может зависеть результат. Количественный признак я вношу, как есть (например, размеры опухоли столько то см), а качественный - например, пол - кодирую (м-1, ж-2 допустим). Дальше жму на кнопку "статистика". А дальше что выбирать? ЛИнейные и нелинейные модели? Дальше - общие регрессионные модели? А дальше - простая регрессия? Далеее вносятся варианты, ну, а дальше - там уже я не знаю. Подскажите, пожалуйста!! |
|
8.12.2008 - 23:35
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Не могли бы пошагово разъяснить, как это сделать? Я делаю несколько вергикальных колонок - вар.1 - это результат (о - плохой, 1 - хороший - так кодирую), вар.2 - и последующие варианты - это признаки, от которых может зависеть результат. Количественный признак я вношу, как есть (например, размеры опухоли столько то см), а качественный - например, пол - кодирую (м-1, ж-2 допустим). Дальше жму на кнопку "статистика". А дальше что выбирать? ЛИнейные и нелинейные модели? Дальше - общие регрессионные модели? А дальше - простая регрессия? Далеее вносятся варианты, ну, а дальше - там уже я не знаю. Подскажите, пожалуйста!! Итак, Вы ввели все данные. Далее ищите логистическую регрессию. 6 версии Statistica она находится в Statistics - Advanced linear/Nonlinear Models - Nonlinear Estimation - Quick Logit Regression т.е. в русской версии должно быть что-то типа (у меня русской под рукой нет) Статистика- ...линейные/нелинейные модели - нелинейная оценка - быстрая логит-регрессия (логистическая регрессия) Оставляет без изменений Codes and no counts Жмете на кнопку Variables (переменные) Появляется окно с двумя окошками - слева для зависимой переменной, справа - для независимых В левом кликаете вар1 В правом кликаете по вар2, вар3 и т.д. Жмете на ОК и еще раз ОК В появившемся окошке удостоверяетесь, что стоит птичка около Asymptotic Standard Errors Жмете ОК В появившемся окошке проверяете, что модель "работает": -2*log(Likelihood): for this model = 29,70874 intercept only: 98,30010 Chi-square = 68,59136, df = 3, p = ,0000000 р должно быть, понятно, меньше 0.05 Далее жмете на кнопку summary:parameters & standard errors Получаете основной результат: оценки коэффициентов регрессии для всех вар2, вар3 и т.п., их стандартные ошибки и р, доверительные интервалы. Уфф. И люди еще говорят, что в Statistica проще работать... В R все сводится к summary(glm(var1~var2+var3+var4,family="binomial")) И можно переходить к анализу результатов... |
|
9.12.2008 - 22:07
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Получаете основной результат: оценки коэффициентов регрессии для всех вар2, вар3 и т.п., их стандартные ошибки и р, доверительные интервалы. Уфф. И люди еще говорят, что в Statistica проще работать... В R все сводится к summary(glm(var1~var2+var3+var4,family="binomial")) И можно переходить к анализу результатов... Плав, спасибо большое!!! Ну, это просто нельзя не осилить. Я все сделала. Пожалуйста, можно еще вопрос? Я получила табличку с основными результатами - у меня там пока 2 независимых переменных - это вар.2 и вар.3. Как оценить эти результаты? Что значит первый столбец Const BO ? и дальше - estimate, final-loss, t(75), p-level, +95%, -95%, Wold s Chi-square, другой p-level и Odds ratio ? К сожалению, я пыталась - пыталась загрузить табличку с результатами, но она сюда не грузится. Я ее и в виде файла Статистика-6, и в виде вордовского документа, и в виде экселевского пыталась - не выходит. Пожалуйста, помогите мне!!! Что бы я это дело уже до конца смогла довести. Заранее спасибо!! |
|
9.12.2008 - 22:25
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Что значит первый столбец Const BO Это значение константы B0. Если число красного цвета, то эта переменная значима p<0,05. и дальше - estimate, final-loss, t(75), p-level, +95%, -95%, Wold s Chi-square, другой p-level и Odds ratio ? estimate - оценки коэффициентов регрессии B0, B1, B2, смотри уравнение в самом низу p-level - это уровень значимости. Если он <0,05, то данная пременная значима и показана красным цветом +95%, -95% - это 95% доверительный интервал для показателя, расположенного строкой выше и Odds ratio ? Odds ratio=exp(Bi) - это отношение шансов (заболеть или выздороветь) при увеличении i-ой переменной на 1, когда все другие независимые переменные не изменяются. Чем это отношение шансов больше, тем важнее данная переменная для прогноза. Окончательно уравнение логистической регрессии выглядит так: ln(p/1-p)=B0+B1*var2+B2*Var3 Сообщение отредактировал DoctorStat - 9.12.2008 - 22:38 Просто включи мозги => http://doctorstat.narod.ru
|
|
9.12.2008 - 22:55
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Добавить нечего , кроме того, что не во всех версиях Statistica значимые переменные подсвечиваются красным цветом, смотрите, чтобы было р<0.05
|
|
11.12.2008 - 00:15
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Cпасибо большое.
Я уже существенно приближаюсь к пониманию процесса. У меня по всем показателям, от которых в клинике зависит результат - статистически зависимость подтвердилась. Теперь еще вот о конкретных задачах хочу спросить. ... Нам надо дать статью в буржуйский журнал. У них всегда особые требования. В, общем, в статье надо дать таблицу под примерным названием - "монофакторный анализ зависимости результата лечения от разных признаков". В вертикальном столбце первом - это будут те самыез независимые переменные - высота, протяженность, пол и пр. А в горизонтальном верхнем... Надо там написать RR, OR, доверительный интервал и р. Сначала вопрос - почему некоторые авторы указывают и RR и OR в таблице, некоторые только - RR, а некоторые - только OR ? В чем принципиальная разница между этими показателями? Если я буду указывать RR, то где конкретно эту цифру взять в получившейся таблице результатов в программе Статистика? Тот же вопрос и об OR - там же в двух строках указано это ОR (ОR unit ch и ОR range)- какое же брать? И в каких цифрах указывать? Сейчас я дальше про цифры поясню вопрос. Доверительных интервалов тоже два в этой таблице результатов - какой надо брать? И потом, если следовать примеру буржуйский статей, то у них доверительный интервал указан в простых цифрах , а у меня в полученной таблице эти цифры (причем - все!!) равны примерно следующему 5,915333E+00 или 2,347344E-01 . Что это за цифры? Раньше , если у меня такие цифры получались при расчетах р, то мне было понятно, что р- высоко достоверна, что она меньше, чем 0,0001. А что значат эти цифры в строке напротив "+95%" и в строке напротив "-95%" ? Интервал - это же от и до. А это что за цифра? И, наконец, p-level .В полученной таблице их тоже - два. Какой надо давать в ту таблицу, которую я хочу привести в статье? Очень буду ждать ответа. И еще... простите, а что такое константа ВО? |
|
11.12.2008 - 00:30
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Cпасибо большое. Я уже существенно приближаюсь к пониманию процесса. У меня по всем показателям, от которых в клинике зависит результат - статистически зависимость подтвердилась. Теперь еще вот о конкретных задачах хочу спросить. ... Нам надо дать статью в буржуйский журнал. У них всегда особые требования. В, общем, в статье надо дать таблицу под примерным названием - "монофакторный анализ зависимости результата лечения от разных признаков". В вертикальном столбце первом - это будут те самыез независимые переменные - высота, протяженность, пол и пр. А в горизонтальном верхнем... Надо там написать RR, OR, доверительный интервал и р. Сначала вопрос - почему некоторые авторы указывают и RR и OR в таблице, некоторые только - RR, а некоторые - только OR ? В чем принципиальная разница между этими показателями? Если я буду указывать RR, то где конкретно эту цифру взять в получившейся таблице результатов в программе Статистика? Тот же вопрос и об OR - там же в двух строках указано это ОR (ОR unit ch и ОR range)- какое же брать? И в каких цифрах указывать? Сейчас я дальше про цифры поясню вопрос. Доверительных интервалов тоже два в этой таблице результатов - какой надо брать? И потом, если следовать примеру буржуйский статей, то у них доверительный интервал указан в простых цифрах , а у меня в полученной таблице эти цифры (причем - все!!) равны примерно следующему 5,915333E+00 или 2,347344E-01 . Что это за цифры? Раньше , если у меня такие цифры получались при расчетах р, то мне было понятно, что р- высоко достоверна, что она меньше, чем 0,0001. А что значат эти цифры в строке напротив "+95%" и в строке напротив "-95%" ? Интервал - это же от и до. А это что за цифра? И, наконец, p-level .В полученной таблице их тоже - два. Какой надо давать в ту таблицу, которую я хочу привести в статье? Очень буду ждать ответа. И еще... простите, а что такое константа ВО? Кратко 1) RR после логистической регресии не посчитать никак, только OR 2) +00 E-01, т.н. научная нотация, 10 в степени, соответственно, +00 означает умножить число слева на 1, Е-01, умножить на 0,1: цифры которые Вы привели 5,9-0,23 3) +95% - верхняя граница доверительного интервла, -95% - нижняя граница 4) OR лучше брать unit change 5) В0 - постоянный член уравнения, в таблицах в статьях не приводится |
|
11.12.2008 - 08:35
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
А почему "монофакторный анализ"? Если бы вы рассматривали OR для всех факторов по отдельности, в изоляции друг от друга - тогда да. А раз вы использовали логистическую регрессию, где все факторы присутствовали одновременно - то это уже многофакторный анализ. Полученные OR являются согласованными и будут отличаться от OR для "монофакторных" анализов. Т.е. озаглавить таблицу результатов логистической регрессии как вы планируете нельзя.
|
|
14.12.2008 - 16:11
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 13.05.2008 Пользователь №: 5031 |
Извините, а можно поинтересоваться, что это за клиника такая?
|
|
14.12.2008 - 18:01
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
А почему "монофакторный анализ"? Если бы вы рассматривали OR для всех факторов по отдельности, в изоляции друг от друга - тогда да. А раз вы использовали логистическую регрессию, где все факторы присутствовали одновременно - то это уже многофакторный анализ. Полученные OR являются согласованными и будут отличаться от OR для "монофакторных" анализов. Т.е. озаглавить таблицу результатов логистической регрессии как вы планируете нельзя. плав как-то давал ссылку на работу "Плавинская С.И., Плавинский С.Л., Шестов Д.Б. Прогностическая значимость основных факторов риска у женщин по данным популяционного исследования и шкала риска смерти от ССЗ // Российский семейный врач, 2006, № 4, с. 4-9." Я нашел данную статью и ознакомился. Там предложен любопытный прием. Строится логистическая регрессия, но не по всем факторам сразу, а по каждому в отдельности. Таким образом, исследуется прогностическая ценность каждого фактора в отдельности. Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|