Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Выявление независимых предикторов, возможные статистические методы
mix3d
сообщение 15.02.2009 - 00:59
Сообщение #1





Группа: Пользователи
Сообщений: 32
Регистрация: 15.02.2009
Пользователь №: 5815



Уважаемые коллеги!

При анализе литературных источников неоднократно сталкиваешься с фразой типа "фактор является независимым предиктором...", при этом автооры используют разные статистические методы.

Если у кого-то есть опыт в этой сфере, поделитесь, пожалуйста, какие методы предпочтительнее использовать для выявления зависимости качественного от качественного, количественного от количественного, количественного от качественного и качественного от количественного?

Какие имеются ограничения для их использования, как их обойти?

Всем участникам заранее спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
mix3d
сообщение 16.02.2009 - 18:09
Сообщение #2





Группа: Пользователи
Сообщений: 32
Регистрация: 15.02.2009
Пользователь №: 5815



Итак, я имею биноминальную зависимую переменную и зависимые переменные (непрерывные, дискретные, порядковые, номинальные). Выявить предикторное значение независимой переменной по отношению к зависимой - строим логистическую модель.

Скажите, я правильно понимаю, что для максимального правдоподобия как функции потерь, которая используется по умолчанию в модуле quick logit regression (Statistica 6.0), не требуется выполнение условий Гаусса-Маркова, т.е. нам принципиально не важен анализ остатков (нормальность распределения, сериальная корреляция, нулевое матожидание, постоянство дисперсии)?, а имеет значение только

1. значимость коэффициентов и свободного члена,
2. различие построенной модели по сравнению с моделью, в которой все независимые переменные кроме свободного члена приравниваются нулю,
3. оценка степени подгонки модели к данным - ее адекватность (индекс отношения правдоподобия - псевдо R2 или R2 McFadden).

В моей модели (зависимый - бинарный признак (развитие (1) либо отсутствие (0) клинического события, независимый - количественный непрерывный - значения лабораторного показателя (либо второй вариант - также биноминальный - нормальный (0) или повышенный (1) уровень того же показателя) - результаты получаются идентичные) первые два условия выполняются, последнее плохо - приближается к нулю.

Можно ли в таком случае говорить о независимой переменной как о предикторе? Если нет, то подтверждают первые 2 условия связь зависимой и независимой переменной?

Дисперсионный анализ: зависимая переменная - количественная, независимые - неважно? Получим ли мы предиктор, если дисперсионный анализ выявляет лишь различия дисперсий?

И последнее, попытался освоить книгу Халафяна "Современные статистические методы медицинских исследований". Он для одной и той задачи и набора признаков ( в частности больные ХСН: 6-минутный тест, одышка, слабость, ряд показателей ЭХОкардиографии ) использует и линейную, и логистическую регрессию, и дискриминантный анализ, и деревья классификации. Вопрос - что этим он хотел показать: бери любой метод, и тот из них, который дает более удобоваримые результаты, тот и бери в расчет?

При всем уважении к светилам статистики и при моей удаленности от конкретного знания, что, где, когда применить, мне, как и многим страждущим, нужен ответ.

Пожалуйста, поясните, в чем смысл этих методов, заключения какого рода можно формулировать на основании результатов их применения?!

Еще раз спасибо! Даже от одного ответа в голове начинает проясняться, может, так и до истины докопаюсь.

P.S. Прочитал ветку про adjustment - правильно ли я понял, что все, что требуется для проведения стандартизации по полу и возрасту - это включение этих переменных в модель?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 16.02.2009 - 18:36
Сообщение #3





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(mix3d @ 16.02.2009 - 18:09) *
Итак, я имею биноминальную зависимую переменную и зависимые переменные (непрерывные, дискретные, порядковые, номинальные). Выявить предикторное значение независимой переменной по отношению к зависимой - строим логистическую модель.

Скажите, я правильно понимаю, что для максимального правдоподобия как функции потерь, которая используется по умолчанию в модуле quick logit regression (Statistica 6.0), не требуется выполнение условий Гаусса-Маркова, т.е. нам принципиально не важен анализ остатков

Нет, не правильно, анализ остатков проводить надо, но анализ немного иной, чем в случае линейной регрессии

Цитата(mix3d @ 16.02.2009 - 18:09) *
Дисперсионный анализ: зависимая переменная - количественная, независимые - неважно? Получим ли мы предиктор, если дисперсионный анализ выявляет лишь различия дисперсий?

не совсем так, дисперсионный анализ это метод сравнения средних групп, а не сравнение дисперсий

Цитата(mix3d @ 16.02.2009 - 18:09) *
И последнее, попытался освоить книгу Халафяна "Современные статистические методы медицинских исследований". Он для одной и той задачи и набора признаков ( в частности больные ХСН: 6-минутный тест, одышка, слабость, ряд показателей ЭХОкардиографии ) использует и линейную, и логистическую регрессию, и дискриминантный анализ, и деревья классификации. Вопрос - что этим он хотел показать: бери любой метод, и тот из них, который дает более удобоваримые результаты, тот и бери в расчет?

нет, все зависит от зависимой переменной и свойств модели, а то, что пишут авторы - оставим на их совести

Цитата(mix3d @ 16.02.2009 - 18:09) *
P.S. Прочитал ветку про adjustment - правильно ли я понял, что все, что требуется для проведения стандартизации по полу и возрасту - это включение этих переменных в модель?

а вот это правильно
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему