Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Монофакторный анализ. Как сделать?
Solo...
сообщение 7.12.2008 - 18:33
Сообщение #1





Группа: Пользователи
Сообщений: 35
Регистрация: 3.10.2008
Из: Москва
Пользователь №: 5369



Уважаемые форумчане!!! Я опять к вам за помощью. На этот раз я опять пользовалась поиском, но что то у меня ничего не нарисовалось почему то.
Есть результат лечения - положительный и отрицательный. И есть несколько факторов - пол, возраст, размеры опухоли, параметры лечения и ряд других. Как провести анализ зависимости результата от каждого в отдельности фактора? В одну колонку я вношу результат, в другие колонки - эти факторы. А как посчитать это с помощью Статистика - 6 или -7?

Подскажите пожалуйста, на какие кнопки жать и какие параметры оценивать? Заранее спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 7.12.2008 - 20:28
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Вообще-то логистическая регрессия. Если бы не менюшный интефейс, то совет можно было бы дать, типа в R
glm(Y~age+sex+size+treat1,family="binomial"), но в Statistica процедура достаточно хорошо описана в хелпе. Идея в том, что вначале можно построить модель попарно с каждым фактором, затем все вместе. Т.е. зависимая переменная - исход (кодируйте 0 и 1), а независимые - изучаемые. Можно и поуродоваться - вначале для качественных переменных построить таблицы сопряженности (crosstables в базовой статистике), для количественных все равно придется делать унивариантную логистическую регрессию.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Solo...
сообщение 8.12.2008 - 22:01
Сообщение #3





Группа: Пользователи
Сообщений: 35
Регистрация: 3.10.2008
Из: Москва
Пользователь №: 5369



Цитата(плав @ 7.12.2008 - 20:28) *
Вообще-то логистическая регрессия. Если бы не менюшный интефейс, то совет можно было бы дать, типа в R
glm(Y~age+sex+size+treat1,family="binomial"), но в Statistica процедура достаточно хорошо описана в хелпе. Идея в том, что вначале можно построить модель попарно с каждым фактором, затем все вместе. Т.е. зависимая переменная - исход (кодируйте 0 и 1), а независимые - изучаемые. Можно и поуродоваться - вначале для качественных переменных построить таблицы сопряженности (crosstables в базовой статистике), для количественных все равно придется делать унивариантную логистическую регрессию.


Плав, спасибо большое, что откликаетесь. Я с помощью вас все таки провела РОК-анализ, и поняла что это такое. Книгу Флечера, которую вы мне советовали (да и не только вы) в другой теме, я , увы, не могу найти. Кроме того, изучить целую книгу - это не просто в условиях постоянного потока больных и кучи дел. Наука в нашем учреждении - дело прикладное. Так сказать, хобби. Уверена, что в "Статистике" это можно посчитать без глубоких знаний в статистической науке, нажимая на кнопки - знать бы на какие. Не подумайте, что я лишь поверхностно подхожу к делу. Просто мне кажется, что если я примерно понимаю, в чем суть монофакторного анализа, то зная, на что жать в Статистике, я это сделать смогу сама, не дергая людей. И еще понимать бы, что значит куча результатов на выходе. smile.gifsmile.gifsmile.gif

Не могли бы пошагово разъяснить, как это сделать? Я делаю несколько вергикальных колонок - вар.1 - это результат (о - плохой, 1 - хороший - так кодирую), вар.2 - и последующие варианты - это признаки, от которых может зависеть результат. Количественный признак я вношу, как есть (например, размеры опухоли столько то см), а качественный - например, пол - кодирую (м-1, ж-2 допустим). Дальше жму на кнопку "статистика". А дальше что выбирать? ЛИнейные и нелинейные модели? Дальше - общие регрессионные модели? А дальше - простая регрессия? Далеее вносятся варианты, ну, а дальше - там уже я не знаю.

Подскажите, пожалуйста!!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 8.12.2008 - 23:35
Сообщение #4





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Solo... @ 8.12.2008 - 22:01) *
Не могли бы пошагово разъяснить, как это сделать? Я делаю несколько вергикальных колонок - вар.1 - это результат (о - плохой, 1 - хороший - так кодирую), вар.2 - и последующие варианты - это признаки, от которых может зависеть результат. Количественный признак я вношу, как есть (например, размеры опухоли столько то см), а качественный - например, пол - кодирую (м-1, ж-2 допустим). Дальше жму на кнопку "статистика". А дальше что выбирать? ЛИнейные и нелинейные модели? Дальше - общие регрессионные модели? А дальше - простая регрессия? Далеее вносятся варианты, ну, а дальше - там уже я не знаю.

Подскажите, пожалуйста!!

Итак, Вы ввели все данные.
Далее ищите логистическую регрессию. 6 версии Statistica она находится в Statistics - Advanced linear/Nonlinear Models - Nonlinear Estimation - Quick Logit Regression
т.е. в русской версии должно быть что-то типа (у меня русской под рукой нет) Статистика- ...линейные/нелинейные модели - нелинейная оценка - быстрая логит-регрессия (логистическая регрессия)
Оставляет без изменений Codes and no counts
Жмете на кнопку Variables (переменные)
Появляется окно с двумя окошками - слева для зависимой переменной, справа - для независимых
В левом кликаете вар1
В правом кликаете по вар2, вар3 и т.д.
Жмете на ОК и еще раз ОК
В появившемся окошке удостоверяетесь, что стоит птичка около Asymptotic Standard Errors
Жмете ОК
В появившемся окошке проверяете, что модель "работает":
-2*log(Likelihood): for this model = 29,70874 intercept only: 98,30010
Chi-square = 68,59136, df = 3, p = ,0000000
р должно быть, понятно, меньше 0.05
Далее жмете на кнопку summary:parameters & standard errors
Получаете основной результат:
оценки коэффициентов регрессии для всех вар2, вар3 и т.п., их стандартные ошибки и р, доверительные интервалы.

Уфф. И люди еще говорят, что в Statistica проще работать... В R все сводится к
summary(glm(var1~var2+var3+var4,family="binomial"))
И можно переходить к анализу результатов...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Solo...
сообщение 9.12.2008 - 22:07
Сообщение #5





Группа: Пользователи
Сообщений: 35
Регистрация: 3.10.2008
Из: Москва
Пользователь №: 5369



Цитата(плав @ 8.12.2008 - 23:35) *
Получаете основной результат:
оценки коэффициентов регрессии для всех вар2, вар3 и т.п., их стандартные ошибки и р, доверительные интервалы.

Уфф. И люди еще говорят, что в Statistica проще работать... В R все сводится к
summary(glm(var1~var2+var3+var4,family="binomial"))
И можно переходить к анализу результатов...



Плав, спасибо большое!!! Ну, это просто нельзя не осилить. Я все сделала. Пожалуйста, можно еще вопрос? Я получила табличку с основными результатами - у меня там пока 2 независимых переменных - это вар.2 и вар.3. Как оценить эти результаты? Что значит первый столбец Const BO ? и дальше - estimate, final-loss, t(75), p-level, +95%, -95%, Wold s Chi-square, другой p-level и Odds ratio ?

К сожалению, я пыталась - пыталась загрузить табличку с результатами, но она сюда не грузится. Я ее и в виде файла Статистика-6, и в виде вордовского документа, и в виде экселевского пыталась - не выходит.

Пожалуйста, помогите мне!!! Что бы я это дело уже до конца смогла довести. Заранее спасибо!!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 9.12.2008 - 22:25
Сообщение #6





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(Solo... @ 9.12.2008 - 22:07) *
Что значит первый столбец Const BO

Это значение константы B0. Если число красного цвета, то эта переменная значима p<0,05.
Цитата(Solo... @ 9.12.2008 - 22:07) *
и дальше - estimate, final-loss, t(75), p-level, +95%, -95%, Wold s Chi-square, другой p-level и Odds ratio ?

estimate - оценки коэффициентов регрессии B0, B1, B2, смотри уравнение в самом низу
p-level - это уровень значимости. Если он <0,05, то данная пременная значима и показана красным цветом
+95%, -95% - это 95% доверительный интервал для показателя, расположенного строкой выше
Цитата(Solo... @ 9.12.2008 - 22:07) *
и Odds ratio ?

Odds ratio=exp(Bi) - это отношение шансов (заболеть или выздороветь) при увеличении i-ой переменной на 1, когда все другие независимые переменные не изменяются. Чем это отношение шансов больше, тем важнее данная переменная для прогноза. Окончательно уравнение логистической регрессии выглядит так:

ln(p/1-p)=B0+B1*var2+B2*Var3

Сообщение отредактировал DoctorStat - 9.12.2008 - 22:38


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 9.12.2008 - 22:55
Сообщение #7





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Добавить нечего smile.gif , кроме того, что не во всех версиях Statistica значимые переменные подсвечиваются красным цветом, смотрите, чтобы было р<0.05
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Solo...
сообщение 11.12.2008 - 00:15
Сообщение #8





Группа: Пользователи
Сообщений: 35
Регистрация: 3.10.2008
Из: Москва
Пользователь №: 5369



Cпасибо большое.

Я уже существенно приближаюсь к пониманию процесса. У меня по всем показателям, от которых в клинике зависит результат - статистически зависимость подтвердилась. Теперь еще вот о конкретных задачах хочу спросить. ... Нам надо дать статью в буржуйский журнал. У них всегда особые требования. В, общем, в статье надо дать таблицу под примерным названием - "монофакторный анализ зависимости результата лечения от разных признаков". В вертикальном столбце первом - это будут те самыез независимые переменные - высота, протяженность, пол и пр. А в горизонтальном верхнем... Надо там написать RR, OR, доверительный интервал и р.

Сначала вопрос - почему некоторые авторы указывают и RR и OR в таблице, некоторые только - RR, а некоторые - только OR ? В чем принципиальная разница между этими показателями?

Если я буду указывать RR, то где конкретно эту цифру взять в получившейся таблице результатов в программе Статистика?

Тот же вопрос и об OR - там же в двух строках указано это ОR (ОR unit ch и ОR range)- какое же брать? И в каких цифрах указывать? Сейчас я дальше про цифры поясню вопрос.

Доверительных интервалов тоже два в этой таблице результатов - какой надо брать? И потом, если следовать примеру буржуйский статей, то у них доверительный интервал указан в простых цифрах , а у меня в полученной таблице эти цифры (причем - все!!) равны примерно следующему 5,915333E+00 или 2,347344E-01 . Что это за цифры? Раньше , если у меня такие цифры получались при расчетах р, то мне было понятно, что р- высоко достоверна, что она меньше, чем 0,0001. А что значат эти цифры в строке напротив "+95%" и в строке напротив "-95%" ? Интервал - это же от и до. А это что за цифра?

И, наконец, p-level .В полученной таблице их тоже - два. Какой надо давать в ту таблицу, которую я хочу привести в статье?

Очень буду ждать ответа.

И еще... простите, а что такое константа ВО?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 11.12.2008 - 00:30
Сообщение #9





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Solo... @ 11.12.2008 - 00:15) *
Cпасибо большое.

Я уже существенно приближаюсь к пониманию процесса. У меня по всем показателям, от которых в клинике зависит результат - статистически зависимость подтвердилась. Теперь еще вот о конкретных задачах хочу спросить. ... Нам надо дать статью в буржуйский журнал. У них всегда особые требования. В, общем, в статье надо дать таблицу под примерным названием - "монофакторный анализ зависимости результата лечения от разных признаков". В вертикальном столбце первом - это будут те самыез независимые переменные - высота, протяженность, пол и пр. А в горизонтальном верхнем... Надо там написать RR, OR, доверительный интервал и р.

Сначала вопрос - почему некоторые авторы указывают и RR и OR в таблице, некоторые только - RR, а некоторые - только OR ? В чем принципиальная разница между этими показателями?

Если я буду указывать RR, то где конкретно эту цифру взять в получившейся таблице результатов в программе Статистика?

Тот же вопрос и об OR - там же в двух строках указано это ОR (ОR unit ch и ОR range)- какое же брать? И в каких цифрах указывать? Сейчас я дальше про цифры поясню вопрос.

Доверительных интервалов тоже два в этой таблице результатов - какой надо брать? И потом, если следовать примеру буржуйский статей, то у них доверительный интервал указан в простых цифрах , а у меня в полученной таблице эти цифры (причем - все!!) равны примерно следующему 5,915333E+00 или 2,347344E-01 . Что это за цифры? Раньше , если у меня такие цифры получались при расчетах р, то мне было понятно, что р- высоко достоверна, что она меньше, чем 0,0001. А что значат эти цифры в строке напротив "+95%" и в строке напротив "-95%" ? Интервал - это же от и до. А это что за цифра?

И, наконец, p-level .В полученной таблице их тоже - два. Какой надо давать в ту таблицу, которую я хочу привести в статье?

Очень буду ждать ответа.

И еще... простите, а что такое константа ВО?

Кратко
1) RR после логистической регресии не посчитать никак, только OR
2) +00 E-01, т.н. научная нотация, 10 в степени, соответственно, +00 означает умножить число слева на 1, Е-01, умножить на 0,1: цифры которые Вы привели 5,9-0,23
3) +95% - верхняя граница доверительного интервла, -95% - нижняя граница
4) OR лучше брать unit change
5) В0 - постоянный член уравнения, в таблицах в статьях не приводится
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 11.12.2008 - 08:35
Сообщение #10





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



А почему "монофакторный анализ"? Если бы вы рассматривали OR для всех факторов по отдельности, в изоляции друг от друга - тогда да. А раз вы использовали логистическую регрессию, где все факторы присутствовали одновременно - то это уже многофакторный анализ. Полученные OR являются согласованными и будут отличаться от OR для "монофакторных" анализов. Т.е. озаглавить таблицу результатов логистической регрессии как вы планируете нельзя.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
M.Dio
сообщение 14.12.2008 - 16:11
Сообщение #11





Группа: Пользователи
Сообщений: 5
Регистрация: 13.05.2008
Пользователь №: 5031



Извините, а можно поинтересоваться, что это за клиника такая?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 14.12.2008 - 18:01
Сообщение #12





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(nokh @ 11.12.2008 - 09:35) *
А почему "монофакторный анализ"? Если бы вы рассматривали OR для всех факторов по отдельности, в изоляции друг от друга - тогда да. А раз вы использовали логистическую регрессию, где все факторы присутствовали одновременно - то это уже многофакторный анализ. Полученные OR являются согласованными и будут отличаться от OR для "монофакторных" анализов. Т.е. озаглавить таблицу результатов логистической регрессии как вы планируете нельзя.

плав как-то давал ссылку на работу "Плавинская С.И., Плавинский С.Л., Шестов Д.Б. Прогностическая значимость основных факторов риска у женщин по данным популяционного исследования и шкала риска смерти от ССЗ // Российский семейный врач, 2006, № 4, с. 4-9." Я нашел данную статью и ознакомился. Там предложен любопытный прием. Строится логистическая регрессия, но не по всем факторам сразу, а по каждому в отдельности. Таким образом, исследуется прогностическая ценность каждого фактора в отдельности.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему