Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Логистическая регрессия
aspir_h
сообщение 5.04.2015 - 20:37
Сообщение #1





Группа: Пользователи
Сообщений: 21
Регистрация: 2.02.2013
Пользователь №: 24597



Доброго времени, уважаемые коллеги! Для прогнозирования бинарного признака использован метод логистической регрессии. Анализ проводился в Statistica. Получены следующие результаты и уравнение :
y=〖exp〗^(-20,46327-2,746382×x_1-1,339306×x_2+b×x_n )/(1+〖exp〗^(-20,46327-2,746382×x_1-1,339306×x_2+b×x_n ) )
Уравнение из-за большого размера сократил, заменив переменные х3-х8 на ?b×x_n?.
Коллеги, мне наряду с прогнозированием бинарной переменной, необходимо оценить вклад каждой независимой переменной в зависимую переменную. В множественной линейной регрессии это можно сделать, используя стандартизованные коэффициенты (бэта-коэффициенты). Распространяется ли данное правило для уравнения логистической регрессии?
Если да, то, как рассчитать стандартизованные коэффициенты уравнения логистической регрессии?
Я так понимаю что, в таблице, полученном при расчетах в Statistica (в прикрепленном файле) коэффициенты регрессии НЕ стандартизованные (строка с красным шрифтом)?
Заранее спасибо!

Более подробная информация в прикрепленном файле.
Прикрепленные файлы
Прикрепленный файл  логист.регрессия.rar ( 16,54 килобайт ) Кол-во скачиваний: 264
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 6.04.2015 - 19:59
Сообщение #2





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(aspir_h @ 5.04.2015 - 22:37) *
Доброго времени, уважаемые коллеги! Для прогнозирования бинарного признака использован метод логистической регрессии. Анализ проводился в Statistica. Получены следующие результаты и уравнение :
y=〖exp〗^(-20,46327-2,746382Чx_1-1,339306Чx_2+bЧx_n )/(1+〖exp〗^(-20,46327-2,746382Чx_1-1,339306Чx_2+bЧx_n ) )
Уравнение из-за большого размера сократил, заменив переменные х3-х8 на ?bЧx_n?.
Коллеги, мне наряду с прогнозированием бинарной переменной, необходимо оценить вклад каждой независимой переменной в зависимую переменную. В множественной линейной регрессии это можно сделать, используя стандартизованные коэффициенты (бэта-коэффициенты). Распространяется ли данное правило для уравнения логистической регрессии?
Если да, то, как рассчитать стандартизованные коэффициенты уравнения логистической регрессии?
Я так понимаю что, в таблице, полученном при расчетах в Statistica (в прикрепленном файле) коэффициенты регрессии НЕ стандартизованные (строка с красным шрифтом)?
Заранее спасибо!

Более подробная информация в прикрепленном файле.

Параметры уравнения логистической регрессии, т.е. её коэффициенты, являются согласованными (друг на друга). Т.е. для оценки важности предиктора никакая дополнительная стандартизация не нужна. Для ранжирования предикторов по важности достаточно отсортировать их в порядке уменьшения абсолютного значения коэффициента. В вашем примере самый важный предиктор - х7, затем х1..., самый слабый - х8.
Коэффициенты логистической регрессии - логиты - натуральные логарифмы отношения шансов. Чтобы информация в таблице хорошо воспринималась, может быть удобнее коэффициенты с отрицательными значениями (и, следовательно, с ОR<1) переформулировать словами так, чтобы можно было избавиться от знака "минус" при коэффициенте и получить все OR>1. Например, если для показателя "Наличие признака" коэфф-т = -4 (OR=0,018), то можно назвать его "Отсутствие признака" и дать коэфф-т 4 (OR=54,60). Тогда все OR будут больше 1 и сравнивать предикторы будет удобнее и нагляднее.

Сообщение отредактировал nokh - 6.04.2015 - 20:01
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
aspir_h
сообщение 6.04.2015 - 21:19
Сообщение #3





Группа: Пользователи
Сообщений: 21
Регистрация: 2.02.2013
Пользователь №: 24597



Цитата(nokh @ 6.04.2015 - 19:59) *
Параметры уравнения логистической регрессии, т.е. её коэффициенты, являются согласованными (друг на друга). Т.е. для оценки важности предиктора никакая дополнительная стандартизация не нужна. Для ранжирования предикторов по важности достаточно отсортировать их в порядке уменьшения абсолютного значения коэффициента. В вашем примере самый важный предиктор - х7, затем х1..., самый слабый - х8.
Коэффициенты логистической регрессии - логиты - натуральные логарифмы отношения шансов. Чтобы информация в таблице хорошо воспринималась, может быть удобнее коэффициенты с отрицательными значениями (и, следовательно, с ОR<1) переформулировать словами так, чтобы можно было избавиться от знака "минус" при коэффициенте и получить все OR>1. Например, если для показателя "Наличие признака" коэфф-т = -4 (OR=0,018), то можно назвать его "Отсутствие признака" и дать коэфф-т 4 (OR=54,60). Тогда все OR будут больше 1 и сравнивать предикторы будет удобнее и нагляднее.


Спасибо огромнейшее за Ваш подробный ответ!
Есть еще один вопрос. Коэффициент верности полученного уравнения логистической регрессии 86%. Насколько корректным является расчет вклада каждого фактора (в процентах) в эти самые 86% по формуле: вклад фактора = (100 х коэффициент фактора/сумма модулей всех коэффициентов) х коэффициент верности (в данном случае 0,86), в%.?

Спасибо заранее!

Сообщение отредактировал aspir_h - 6.04.2015 - 21:21
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 11.04.2015 - 03:57
Сообщение #4





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(aspir_h @ 6.04.2015 - 23:19) *
Спасибо огромнейшее за Ваш подробный ответ!
Есть еще один вопрос. Коэффициент верности полученного уравнения логистической регрессии 86%. Насколько корректным является расчет вклада каждого фактора (в процентах) в эти самые 86% по формуле: вклад фактора = (100 х коэффициент фактора/сумма модулей всех коэффициентов) х коэффициент верности (в данном случае 0,86), в%.?

Спасибо заранее!

Честно говоря, сам я не знаю насколько это корректно и пока нигде подобного не встречал. Но логика в вашей интерпретации есть. Думаю, я всё-таки проголосую "за". Интересно мнение других участников форума.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 11.04.2015 - 17:43
Сообщение #5





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(nokh @ 11.04.2015 - 03:57) *
Честно говоря, сам я не знаю насколько это корректно и пока нигде подобного не встречал. Но логика в вашей интерпретации есть. Думаю, я всё-таки проголосую "за". Интересно мнение других участников форума.


По моему в общем случае надо исключать по одному и смотреть на "коэффициент верности" smile.gif, причем не просто на "коэффициент верности" именно этой подогнанной модели, а на "коэффициент верности" полученный в процедуре кроссвалидации.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему