![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 32 Регистрация: 15.02.2009 Пользователь №: 5815 ![]() |
Уважаемые коллеги!
При анализе литературных источников неоднократно сталкиваешься с фразой типа "фактор является независимым предиктором...", при этом автооры используют разные статистические методы. Если у кого-то есть опыт в этой сфере, поделитесь, пожалуйста, какие методы предпочтительнее использовать для выявления зависимости качественного от качественного, количественного от количественного, количественного от качественного и качественного от количественного? Какие имеются ограничения для их использования, как их обойти? Всем участникам заранее спасибо! |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 32 Регистрация: 15.02.2009 Пользователь №: 5815 ![]() |
Итак, я имею биноминальную зависимую переменную и зависимые переменные (непрерывные, дискретные, порядковые, номинальные). Выявить предикторное значение независимой переменной по отношению к зависимой - строим логистическую модель.
Скажите, я правильно понимаю, что для максимального правдоподобия как функции потерь, которая используется по умолчанию в модуле quick logit regression (Statistica 6.0), не требуется выполнение условий Гаусса-Маркова, т.е. нам принципиально не важен анализ остатков (нормальность распределения, сериальная корреляция, нулевое матожидание, постоянство дисперсии)?, а имеет значение только 1. значимость коэффициентов и свободного члена, 2. различие построенной модели по сравнению с моделью, в которой все независимые переменные кроме свободного члена приравниваются нулю, 3. оценка степени подгонки модели к данным - ее адекватность (индекс отношения правдоподобия - псевдо R2 или R2 McFadden). В моей модели (зависимый - бинарный признак (развитие (1) либо отсутствие (0) клинического события, независимый - количественный непрерывный - значения лабораторного показателя (либо второй вариант - также биноминальный - нормальный (0) или повышенный (1) уровень того же показателя) - результаты получаются идентичные) первые два условия выполняются, последнее плохо - приближается к нулю. Можно ли в таком случае говорить о независимой переменной как о предикторе? Если нет, то подтверждают первые 2 условия связь зависимой и независимой переменной? Дисперсионный анализ: зависимая переменная - количественная, независимые - неважно? Получим ли мы предиктор, если дисперсионный анализ выявляет лишь различия дисперсий? И последнее, попытался освоить книгу Халафяна "Современные статистические методы медицинских исследований". Он для одной и той задачи и набора признаков ( в частности больные ХСН: 6-минутный тест, одышка, слабость, ряд показателей ЭХОкардиографии ) использует и линейную, и логистическую регрессию, и дискриминантный анализ, и деревья классификации. Вопрос - что этим он хотел показать: бери любой метод, и тот из них, который дает более удобоваримые результаты, тот и бери в расчет? При всем уважении к светилам статистики и при моей удаленности от конкретного знания, что, где, когда применить, мне, как и многим страждущим, нужен ответ. Пожалуйста, поясните, в чем смысл этих методов, заключения какого рода можно формулировать на основании результатов их применения?! Еще раз спасибо! Даже от одного ответа в голове начинает проясняться, может, так и до истины докопаюсь. P.S. Прочитал ветку про adjustment - правильно ли я понял, что все, что требуется для проведения стандартизации по полу и возрасту - это включение этих переменных в модель? |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Итак, я имею биноминальную зависимую переменную и зависимые переменные (непрерывные, дискретные, порядковые, номинальные). Выявить предикторное значение независимой переменной по отношению к зависимой - строим логистическую модель. Скажите, я правильно понимаю, что для максимального правдоподобия как функции потерь, которая используется по умолчанию в модуле quick logit regression (Statistica 6.0), не требуется выполнение условий Гаусса-Маркова, т.е. нам принципиально не важен анализ остатков Нет, не правильно, анализ остатков проводить надо, но анализ немного иной, чем в случае линейной регрессии Дисперсионный анализ: зависимая переменная - количественная, независимые - неважно? Получим ли мы предиктор, если дисперсионный анализ выявляет лишь различия дисперсий? не совсем так, дисперсионный анализ это метод сравнения средних групп, а не сравнение дисперсий И последнее, попытался освоить книгу Халафяна "Современные статистические методы медицинских исследований". Он для одной и той задачи и набора признаков ( в частности больные ХСН: 6-минутный тест, одышка, слабость, ряд показателей ЭХОкардиографии ) использует и линейную, и логистическую регрессию, и дискриминантный анализ, и деревья классификации. Вопрос - что этим он хотел показать: бери любой метод, и тот из них, который дает более удобоваримые результаты, тот и бери в расчет? нет, все зависит от зависимой переменной и свойств модели, а то, что пишут авторы - оставим на их совести P.S. Прочитал ветку про adjustment - правильно ли я понял, что все, что требуется для проведения стандартизации по полу и возрасту - это включение этих переменных в модель? а вот это правильно |
|
![]() |
![]() |
![]() ![]() |