Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Корректировка (adjustment) при проведения сравнений
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
martyni
Задача: среди больных, одни из которых имеют признак Х (в данном случае метаболический синдром), другие не имеют, необходимо провести сравнение по нескольким параметрам (длительность основного заболевания, курение (да-нет), употребление алкоголя (да-нет), прием одного из препаратов в анамнезе (да-нет)). При этом многие из этих параметров не только могут влиять на развитие метаболического синдрома, но и зависят от возраста (например, чем больше возраст, тем больше длительность основного заболевания, при этом и метаболический синдром чаще возникает в более старших возрастных группах) и от пола (например, мужчины курят чаще). Поэтому при сравнении необходимо скорректировать эти факторы на пол и возраст.
Идея в следующем: сперва как есть для групп, сформированных по наличию или отсутствию признака метаболического синдрома, посчитать Т-критерий для количественных признаков и Хи-квадрат (или точный тест Фишера) для бинарных. Полученные значимости будут нескорректированными (Unadjusted). Затем в бинарную логистическую регрессию внести метаболический синдром как зависимую переменную, а в качестве ковариант пол, возраст и один из сравниваемых показателей, затем вместо него второй и т.д. (т.е. для каждого в отдельности). Таким образом получим для каждого из сравниваемых показателей скорректированную (adjusted) по полу и возрасту значимость различий между группой больных с метаболическим синдромом и без него.
Это подсмотрено в одной англоязычной статье, но т.к. нигде более не видел (может быть плохо смотрел), возникло сомнение, правильно ли я понял.
Вопрос в правомерности использования для этой задачи логистической регрессии. Какие другие методы корректировки могут быть здесь использованы, с учетом того, что признаки как количественные, так и бинарные?
DoctorStat
Цитата(martyni @ 8.02.2009 - 14:34) *
Вопрос в правомерности использования для этой задачи логистической регрессии.
Насколько я понимаю, логистическая регрессия предназначена для расчета влияния каждого фактора (количественного или бинарного), независимо от других, т.е. когда другие факторы постоянны. Пользуясь Вашей терминологией, логистическая регрессия изначально «скорректирована».
плав
Цитата(martyni @ 8.02.2009 - 14:34) *
Таким образом получим для каждого из сравниваемых показателей скорректированную (adjusted) по полу и возрасту значимость различий между группой больных с метаболическим синдромом и без него.
Это подсмотрено в одной англоязычной статье, но т.к. нигде более не видел (может быть плохо смотрел), возникло сомнение, правильно ли я понял.
Вопрос в правомерности использования для этой задачи логистической регрессии. Какие другие методы корректировки могут быть здесь использованы, с учетом того, что признаки как количественные, так и бинарные?

Смотрели, действительно плохо, данный вопрос обсуждался даже на этом форуме.
1) Откорректированные "различия" при помощи логистической регрессии вычислить невозможно, впочем "различия" для бинарного показателя вообще странное слово. Логистическая регрессия позволяет оценить степень "связи" ("зависимости") между двумя показателями
2) Задача оценки влияния одних факторов на другой (бинарный) с коррекцией по полу и возрасту является, как указано DoctorStat практически стандартным видм анализа, используется в сотнях статей.
3) Перед проведением логистической регрессии с несколькими переменными использовать t-криерий и тест Фишера вообще-то бессмысленно. Они базируются на разных допущениях распределения (Фишер) и методах оценки (t). Поэтому для унивариантного анализа надо использовать логистическую регрессию с одним независимым показателем
4) Опасность в логистической регрессии исходит не от количественных и бинарных признаков (она вспринимает количественные ризнаки, но бинарные при кодировке 0/1 тоже подходят), а от ординальных - их надо перекодировать
5) Коррекцию надо проводить не только на пол и возраст, но и другие переменные, ибо они могут быть связаны друг с другом.
DrgLena
Мне не очень понятно "изначально скорректирована", если вы в логистической регрессии используете один предиктор, то с чем он будет скорректирован?

Дизайн исследования case-сontrol
Оценка факторов риска при одновариантном анализе проводится с расчетом OR, для бинарных признаков из таблиц 2х2. Для количественных показателей можно найти точку разделения, используя ROC и тоже создать бинарные. Все эти оценки OR будут несогласованными по возрасту и полу. Поэтому и используют логистическую регрессию, чтобы согласовать OR с нужными показателями, а также для количественных показателей получить OR. На форуме много информации по логистической регрессии, она в данном случае, имеет прямые показания к применению!
martyni
Спасибо, DrgLena
Цитата(DrgLena @ 8.02.2009 - 15:40) *
Для количественных показателей можно найти точку разделения, используя ROC и тоже создать бинарные.

Это обязательно? и почему?


Цитата(плав @ 8.02.2009 - 15:38) *
Смотрели, действительно плохо, данный вопрос обсуждался даже на этом форуме.
1) Откорректированные "различия" при помощи логистической регрессии вычислить невозможно, впочем "различия" для бинарного показателя вообще странное слово. Логистическая регрессия позволяет оценить степень "связи" ("зависимости") между двумя показателями

В данном случае идея - не оценить степень связи, а взять из логистической регрессии только статистическую значимость различий между группами, выявленную при внесении в ковариаты не только переменной, которую мы рассматриваем, но и пола и возраста. Идея, не моя, а замечена мною в очень солидной (в моей области) статье. И полученное таким образом значение р позволило авторам статьи делать заключения о том, значимы ли скорректированные на пол и возраст различия по каждому из признаков в отдельности. При этом, в таблице авторы приводят средние значения (для количественных признаков и частоты для бинарных) в каждой подгруппе, "нескорректированные" значения р, полученные при дисперсионном анализе и хи-квадрате (соответственно для разных признаков), и после этого "скорректированные" по полу и возрасту.
Правда, они для коррекции количественных они использовали ковариационный анализ и внесли значения полученного р в таблицу, а для качественных использовали логист.регрессию (как я писал выше) и ограничились только NS (а само значение р привели в сноске).
К сожалению этой статьи нет в открытом доступе, а процитировать тут не получается. Поэтому если позволите могу выложить ее здесь целиком (если политика форума это позволяет) или прислать копию в личку.


Цитата(плав @ 8.02.2009 - 15:38) *
2) Задача оценки влияния одних факторов на другой (бинарный) с коррекцией по полу и возрасту является, как указано DoctorStat практически стандартным видм анализа, используется в сотнях статей.

Очень извиняюсь, что этого не знаю, но какой метод может скорректировать влияние одного бинарного фактора на другой бинарный по двум другим признакам (полу и возрасту)?
Т.е. из моего примера: больные с МС и без него. Среди тех кто с МС 70% курящих, среди тех кто без МС 40% курящих. Но в группе с МС 70% мужчин (а они курят чаще), а в группе без МС мужчин - 30%. Как уравнять эти группы по полу (и возрасту!!!), чтобы сопоставление их было адекватным?
Цитата(плав @ 8.02.2009 - 15:38) *
4) Опасность в логистической регрессии исходит не от количественных и бинарных признаков (она вспринимает количественные ризнаки, но бинарные при кодировке 0/1 тоже подходят), а от ординальных - их надо перекодировать

Вопрос был немного в другом, видимо я плохо сформулировал: как внести коррекцию при использовании бинарного параметра (бинарная и зависимая, а одна из ковариаты)?
Цитата(плав @ 8.02.2009 - 15:38) *
5) Коррекцию надо проводить не только на пол и возраст, но и другие переменные, ибо они могут быть связаны друг с другом.

Теоретически надо, надо и больных найти 10тыс...
DrgLena
Не могу сказать, что после пояснений, стало больше ясности, что вы хотите проанализировать. Судя по дизайну, вы хотите оценить влияние различных факторов на развитие определенного состояния. Почему непременно, нужно получить достовреность различия средних в двух группах,т.е. р<0,05. Дисперсионный анализ звучит. Количественные переменные могут статистически не различаться, но можно найти такую границу, выше или ниже которой риск развития статистически достоврено выше, поэтому можно использовать ROC, но не обязательно, если вас это не интересует. Возможно, необходима стратификация, для контроля вмешивающихся факторов, для этого есть специальные критерии. Лучше, все же привести статью, чтобы понять логику анализа.
martyni
Статья целиком. Нас интересуют страницы 5-7. Результаты изложены в таблице 3 (стр7) Нажмите для просмотра прикрепленного файла
Мои задачи такие же как и у авторов, только немного другие переменные и больных всего 163.
плав
Цитата(martyni @ 8.02.2009 - 19:29) *
Статья целиком. Нас интересуют страницы 5-7. Результаты изложены в таблице 3 (стр7) Нажмите для просмотра прикрепленного файла
Мои задачи такие же как и у авторов, только немного другие переменные и больных всего 163.

А это другая задача. Оцениваются значения факторов риска в двух группах, не влияние ФР на исход.
Они использовали дисперсионный анализ (ANOVA), зависимыми переменными были ФР, а независимыми - наличие или отсутствие МС. Для корректировки использовали многофакторный дисперсионный анализ или многофакторный дисперсионный анализ с ковариантами (ANCOVA). Полагаю, что для расчетов использовали PROC GLM в SAS, она позволяет вообще рассчитать откорректированные значения показателя (хотя они, похоже ограничлись только р-оценками). Для описания оценки анализа бинарных факторов можно использовать логистическую регрессию (для них дисперсоный анализ не предназанчен, но при больших выборках можно использовать преобразование Фишера), однако зависимые и независимые переменные будут перевернуты, т.е. национальность=МС+возраст+пол, а не МС=национальность+возраст+пол.
Задача абсолютна иная, нежели Вы писали в начале поста. Таким анализом не изучается влияние факторов НА синдром, наобоот, как и написано в статье, изучается влияние МС на факторы. Так то на Ваш вопрос ответ - логистическая регрессия, на вопрос в статье - ДА.
martyni
Цитата(плав @ 8.02.2009 - 20:13) *
А это другая задача. Оцениваются значения факторов риска в двух группах, не влияние ФР на исход.

Ура! Именно об этой задаче я и писал с самого начала!!! Тут или я плохо сформулировал, или Вас сбило слово регрессия в названии темы.
Цитата(плав @ 8.02.2009 - 20:13) *
Они использовали дисперсионный анализ (ANOVA), зависимыми переменными были ФР, а независимыми - наличие или отсутствие МС. Для корректировки использовали многофакторный дисперсионный анализ или многофакторный дисперсионный анализ с ковариантами (ANCOVA). Полагаю, что для расчетов использовали PROC GLM в SAS, она позволяет вообще рассчитать откорректированные значения показателя (хотя они, похоже ограничлись только р-оценками).

Да, так они сделали для большинства количественных переменных.
Цитата(плав @ 8.02.2009 - 20:13) *
Для описания оценки анализа бинарных факторов можно использовать логистическую регрессию (для них дисперсоный анализ не предназанчен, но при больших выборках можно использовать преобразование Фишера), однако зависимые и независимые переменные будут перевернуты, т.е. национальность=МС+возраст+пол, а не МС=национальность+возраст+пол.

Это и было содержание моего вопроса, как делать корректировку при сравнении двух групп по бинарному фактору? Только не очень ясно почему Вы считаете, что они должны быть перевернуты? Если опять же процитировать статью, то делали регрессию они ничего не переворачивая: Since it was hypothesized that years of antipsychotic exposure and alcohol use might be predictors of MS status, adjusted comparisons of these parameters were assessed based on a logistic regression model, with MS status as the binary outcome, and age, gender, race and ethnicity as covariates.
Цитата(плав @ 8.02.2009 - 20:13) *
Задача абсолютна иная, нежели Вы писали в начале поста. Таким анализом не изучается влияние факторов НА синдром, наобоот, как и написано в статье, изучается влияние МС на факторы. Так то на Ваш вопрос ответ - логистическая регрессия, на вопрос в статье - ДА.

1. Не очень понятно биологический смысл анализа ВЛИЯНИЯ о котором Вы говорите? Например, если бы одной из изучаемых переменных был бы цвет глаз, мы бы изучали влияние метаболического синдрома на цвет глаз? Типа с развитием МС глаза синеют? В статье, например, таким образом рассчитывалась длительность антипсихотической терапии. Что, получается, они изучали влияние метаболического синдрома, который только что сами впервые выявили, на начало терапии нейролептиками (в среднем 15 лет до этого)? Мне известно только одно показание для начала терапии нейролептиками у этих больных - дебют их основного заболевания - шизофрении. И здесь клинический вопрос в том есть ли различия между больными с МС и без него в длительности использования ими антипсихотической терапии. Но косвенно положительный ответ на этот вопрос позволил бы предположить, что именно антипсихот.терапия влияет на развитие МС, а не наоборот, что как сказано выше биологически НЕВОЗМОЖНО! Выше в цитате я выделил жирным, что именно из предположения о влиянии терапии на МС авторы и исходили.
2. Я вообще-то про ВЛИЯНИЕ факторов ничего не писал. Я писал про сравнение двух подгрупп и название этой темы "корректировка при проведении СРАВНЕНИЯ", как и само названии статьи, которую мы здесь обсуждаем: "клиническое сопоставление двух подгрупп с и без метаболического синдрома". Где в статье Вы увидели, что это не так?
Опять же, видимо, Вас сбило с толку слово регрессия. Но именно это меня самого изначально и заинтересовало - применение регрессии при проведении скорректированного сравнения (как в статье - adjusted comparisons).
А за то, о чем Вы прежде писали, т.е. о том, что есть такое логист.регрессия и зачем она нужна, СПАСИБО, но, я смею наедяться, что и сам имею об этом некоторое представление:)
DrgLena
Не могу согласиться с тем, то представленная работа является образцом для подражания.
10 авторов из 11 департаментов, имея столько наблюдений, могли бы провести более качественный анализ. Ставить перед собой цель сравнить средние значения в двух группах, довольно скромная задача, не удивительно, что различий не нашли, кроме SF12
Нет никакого смысла проводить коррекцию эффекта множественных сравнений для показателей, различия которых вообще не достигли заданного уровня. Тем не менее, для 5 первичных переменных проводили коррекцию р на множественность сравнений, а для анализа других множественность сравнений уже не волновала и при анализе вторичных показателей учитывали влияние конфаундингов. При этом пол остался в стороне, для него провели стратификацию и результат не представили.
А логистическая регрессия, которую авторы используют, показывает не достоверность различий между группами, а то «р», которое указано, говорит о том, что коэффициент регрессии (exp вета) при переменной (алкоголь) с корректированный на влияние вмешивающихся факторов оказывает статистически значимое или нет влияние на вероятность МС.
А в таблице 2 также множество переменных, достоверно различающихся в двух группах. Но никто не обсуждает, что это могут быть факторы риска развития МД.
Если вы действительно имеете представление о логистической регрессии, то напишете свою работу лучше, чем ваши коллеги. Впрочем, я возможно ошибаюсь, это тяжелая область медицины, я здесь на специалист
martyni

Еще раз спасибо, DrgLena!
Цитата(DrgLena @ 9.02.2009 - 14:52) *
Не могу согласиться с тем, то представленная работа является образцом для подражания.
10 авторов из 11 департаментов, имея столько наблюдений, могли бы провести более качественный анализ. Ставить перед собой цель сравнить средние значения в двух группах, довольно скромная задача, не удивительно, что различий не нашли, кроме SF12

Статья, которую мы обсуждаем, одна из частей очень большого и самого авторитетного исследования в психиатрии последних лет. Его финансировал минздрав США, бюджет был многомиллионный, работало там много центров, очень много врачей, а из этих 10 авторов большая часть - столпы современной психиатрии, которые вряд ли что-то делали сами, но уж профессиональных статистиков найти, я думаю, могли.

Скромность задачи, мне кажется, обусловлена сложностью самой проблемы и желанием получить наиболее достоверный результат.
Прошу прощения, но у меня, как у человека далекого от статистики, иногда возникает ощущение, что сложными стат.методами пытаются замаскировать плохое качество данных и неинтересные результаты. Пример, статья на которую в каком-то из Ваших постов была ссылка про рок-кривые и пр. у больных на ИВЛ. Очень красивая статистика, заметно преобладающая над данными, но в чем там клинический смысл? Что именно с 53 лет (ни раньше, ни позже) риск неблагоприятного исхода увеличивается. И зачем это? Всем известно, что с возрастом хуже прогноз. Но авторы, возможно, хотят создать свою собственную формулу.
Цитата(DrgLena @ 9.02.2009 - 14:52) *
Нет никакого смысла проводить коррекцию эффекта множественных сравнений для показателей, различия которых вообще не достигли заданного уровня.

Они же не знали об этом заранее. Они написали протокол, написали как будут делать анализ, опубликовали его, обсудили всем миром, утвердили коррективы, а потом провели исследование и анализ. Все как положено, не наоборот, как делают у нас!

Цитата(DrgLena @ 9.02.2009 - 14:52) *
Тем не менее, для 5 первичных переменных проводили коррекцию р на множественность сравнений, а для анализа других множественность сравнений уже не волновала и при анализе вторичных показателей учитывали влияние конфаундингов. При этом пол остался в стороне, для него провели стратификацию и результат не представили.

результат отдельно для пола не предоставили, но пол в логист.регрессионную модель у них входил.

Цитата(DrgLena @ 9.02.2009 - 14:52) *
А логистическая регрессия, которую авторы используют, показывает не достоверность различий между группами, а то «р», которое указано, говорит о том, что коэффициент регрессии (exp вета) при переменной (алкоголь) с корректированный на влияние вмешивающихся факторов оказывает статистически значимое или нет влияние на вероятность МС.

Т.е. мы и получим ответ как раз на вопрос, который ставили - есть ли различия между группами с МС и без него по какому-либо отдельному признаку с коррекцией на пол и возраст?

Цитата(DrgLena @ 9.02.2009 - 14:52) *
А в таблице 2 также множество переменных, достоверно различающихся в двух группах. Но никто не обсуждает, что это могут быть факторы риска развития МД.

В таблице 2 - параметры самого МС и близкие к нему, т.е. это не факторы риска, а уже сам исход, только выраженный по-другому.
Цитата(DrgLena @ 9.02.2009 - 14:52) *
Если вы действительно имеете представление о логистической регрессии, то напишете свою работу лучше, чем ваши коллеги. Впрочем, я возможно ошибаюсь, это тяжелая область медицины, я здесь на специалист


Конечно, я не в такой мере специалист в статистике, чтобы сказать, что это лучший способ обработать их данные (именно поэтому я и обратился сюда с вопросом). Но сдается мне, что они делали все именно так не с бухты-барахты.
Сама проблема - сложная, очень много разнонаправленно действующих факторов и при поперечном исследовании выяснить что-либо (даже с использованием ретроспективных данных) сложно, а проспективное построить еще сложнее.
И, если уж при анализе 1,5тыс больных ничего не выявили, то сделать это с количеством больных в 10 раз меньше, еще сложнее. Надежда только на клинический опыт в выборе гипотезы (т.е. переменных для сравнения). Исходя из последнего у меня тоже есть вопросы к авторам этой статьи - могли бы более интересные переменные проанализировать, немного по-другому собрать данные и пр.
Я, естественно, изначально думал, сделать более сложный анализ, чем здесь, но боюсь, что это может быть лишним. При этом я исхожу из мысли (может быть конечно не самой верной), что если уж различия (зависимости) есть, то их может выявить любой метод, а усложнять не всегда стоит.

плав
Проблема подхода заключается в том, что действительно анализируются не те вопросы. То, что авторы считали - это ответ на вопрос, синют ли глаза при МС. К сожалению, просто забывается, что не все показатели являются обратимыми, а в особенности откорректированные.
Далее, если автор поста хочет указывать на то, что другие не совсем точно его понимают, надо учиться четко выражать свои мысли. Если автор пишет, что "необходимо провести сравнение по нескольким параметрам, употребление алкоголя , прием одного из препаратов в анамнезе). При этом многие из этих параметров не только могут влиять на развитие метаболического синдрома..." Меня никакое слово регрессия с толку не сбило, я просто прекрасно понимаю, что опять происходит подмена понятий. Вашим анализом и анализом опубликованным в статье не изучается влияние факторов на развитие метаболического синдрома, а наоборот, изучается как метаболический синдром влияет на эти факторы. Так что определитесь с научной задачей, а затем продумывайте статистический анализ.
martyni
Еще раз прошу прощения и признаю, что мне трудно правильно и четко сформулировать свою мысль с точки зрения статистики.
Если Вас не затруднит, уважаемый плав, объясните, пожалуйста, в чем, на Ваш взгляд, не правы авторы статьи.
Еще раз хочу объяснить клиническую сторону задачи, которую они ставили. Для примера возьмем показатель длительности антипсихотической терапии в анамнезе. Задача была: проверить, есть ли различия в длительности терапии между больными у которых при обследовании выявили МС с теми, у кого при обследовании МС не выявили. При этом, т.к. и частота мс и вероятность более длительноого анамнеза заболевания увеличивается с возрастом и увеличивается у женщин, и у белых по сравнению с черными, их задача была в том, чтобы как-то уравнять сравнивые группы по этим показателям. Для этого они использовали логист.регрессию так, как подробно написано в статье (я уже приводил полную цитату).
Вы считаете, что они, использовав таким образом этот метод, изучали влияние МС на длительность терапии шизофрении. Почему?
Заранее спасибо.
еще раз извините.
плав
Цитата(martyni @ 9.02.2009 - 22:26) *
Для примера возьмем показатель длительности антипсихотической терапии в анамнезе. Задача была: проверить, есть ли различия в длительности терапии между больными у которых при обследовании выявили МС с теми, у кого при обследовании МС не выявили. При этом, т.к. и частота мс и вероятность более длительноого анамнеза заболевания увеличивается с возрастом и увеличивается у женщин, и у белых по сравнению с черными, их задача была в том, чтобы как-то уравнять сравнивые группы по этим показателям. Для этого они использовали логист.регрессию так, как подробно написано в статье (я уже приводил полную цитату).
Вы считаете, что они, использовав таким образом этот метод, изучали влияние МС на длительность терапии шизофрении. Почему?

Итак, если задача - изучить связь терапии с МС, то вряд ли авторов интересует как МС влияет на длительность терапии (если только они не предполагают, что МС заставляет бросить терапию, т.е. МС появляется вначале и является фоном, на котором идет терапия). Соответственно, интересно выяснить, влияет ли длительность терапии на развитие МС. Соответственно, МС (наличие или отсутствие) является зависимой переменной, а длительность терапии - независимой. Соответственно, задачей будет являться выяснить, насколько повышается риск развития МС при увеличении терапии. Если задачу перевернуть (посчитать среднее время терапии в группе МС и без МС), то вопрос будет иным. В случае двумерного анализа (продолжительность и МС) ситуация обратимая и, строго говоря, оценки достоверности влияния будут одинаковыми в двух вопросах (в конце концов нулевая - тестируемая - гипотеза, что МС и продолжительность не связаны друг с другом).
Однако в случае многомерного анализа ситуация меняется принципиально, модель первого типа:
МС=время+пол+возраст,
второго типа
время=пол+возраст+МС.
Очевидно, что изучаются просто разные связи - время и пол, время и возраст во втором и МС и пол и МС и возраст в первом.
По тексту статьи непонятно какую модель использовали авторы при применении логистической регрессии, но, учитывая, что они вспоминают про логистическую регрессию только в случае бинарных факторов (не МС), подозреваю, что второго типа, т.е. не ту, которая заявлена как тема исследования.
В любом случае, если авторы хотят выяснить влияние чего-то на МС (бинарный показатель), они должны выбрать метод статистического анализа для бинарной зависимой переменной (т.е. логистическую регрессию). Вне зависимости от того, какой показатель является независимым - качественный (пол) или количественный (возраст). Соответственно, унивариантная модель будет
МС=возраст
а многомерная
МС=возраст+пол+...
Вообще-то в кардиологии это уже известно лет 30, после использования Kannell логистической регрессии на данных Фрамингемского исследования, почему психиатры продолжают применять методы, популярные до эпохи персональных компьютеров, когда доступ к статистическим программам на мэйнфреймах был только у эпидемиологов - кардиологов остается только догадываться.
Описанный в статье подход использовался в конце 70х - начале 80х, поскольку для дисперсионного анализа можно было использовать программируемые калькуляторы (у ДА есть аналитическое решение, у логистической регрессии только итерационное). С появлением мощных персоналок ограничения для использования логистической регрессии снялись.
Я подозреваю, что в статье просто намеряли большое количество параметров, оценить их влияние на МС не представлялось возможным, посему прибегли к чисто описательному подходу - как факторы риска выглядят в группе с МС и без МС, на самом деле работа - ни о чем, которых, к сожалению, попадается много и в зарубежной печати. Обычно такие статьи появляются после провала основного исследования, которое является их основой (т.е. отсутствия ожидаемых результатов), в данном случае CATIE продемонстрировал отсутствие значительного эффекта новых антипсихотических средств в сравнении со старыми препаратами. Исследование вызвало много споров (строго говоря вывод - новое не лучше старого, но много-много дороже) и поэтому была нужда в объяснении результатов (в частности оланзапин в CATIE давал серьезные метаболические изменения). Вот и появилась упомянутая статья...
Поэтому если Вы хотите изучить влияние антипсихотической терапии на МС, лучше использовать описанный выше всеми отвечавшими подход - логистическая регрессия с МС в качестве зависимой переменной.
martyni
Честно говоря Вы ставите меня в тупик. Я считал, что цитата из статьи, которую я здесь уже приводил, полностью объясняет то, как они строили регрессию. Почему же Вам это осталось не понятно?
Еще раз:
Цитата(martyni @ 9.02.2009 - 11:05) *
Since it was hypothesized that years of antipsychotic exposure and alcohol use might be predictors of MS status, adjusted comparisons of these parameters were assessed based on a logistic regression model, with MS status as the binary outcome, and age, gender, race and ethnicity as covariates.


в моем понимании MS status as the binary outcome - это и значит, что Метаболический Синдром они взяли как зависимую переменную.
почему же Вы говорили, что они сделали все наоборот?
Все же правильно они проводили анализ или, как Вы прежде говорили, изучали то как МС заставляет синеть глаза?
Заранее спасибо за разъяснения.

Насколько я, все же понимаю, несмотря на априорное уважение к специалистам этого форума, авторы статьи все делали правильно. Но они, видимо, не хотели вносить в логист.регрессионную модель все параметры сразу, а хотели учитывать факторы по одному. Типа МС=пол+возраст+длит.терапии, МС=пол+возраст+употребление алкоголя и т.д. почему? можно было бы предположить если бы они в своей статье нашли хотя бы одну статистическую значимость, а так не знаю...

CATIE не провалилось, а наоборот дало "нужный" авторам результат, т.к. оно финансировалось не фарм.фирмами, а нии психиатрии сша. И эта статья (как и вся тема) была поднята для того, чтобы еще более "утопить" новые антипсихотики (в частности оланзапин, который по показателям эффективности был наилучшим, но давал, как Вы верно заметили, больше метаболических НЯ).
плав
Если Вы хотите сдублировать ошибки авторов статьи не надо задавать вопросы на форуме.
NIH не финансирует исследования, чтобы "утопить" новые антипсихотики или иные другие препараты. Результаты CATIE были неожиданными, почитайте литературу после публикации и исходные статьи (возьмите, посмотрите описание протокола (http://www.catie.unc.edu/schizophrenia/index.html), там четко написано, что в 1999 году гипотеза была, что новые антипсихотики лучше перфеназина). Исследования доказательства отстутствия эффекта организуются иначе, чем наличия, поэтому даже после изменения гипотезы в 2004 году задачей являлось прямое сравнение всех четырех групп лечения.
Поскольку исследование планировалось как сравнение антипсихотиков, анализ приведенный в статье не мог являться спланированным (собственно говоря, в протоколе о МС ничего нет - там только сравнение показателей качества жизни). Это анализ post hoc. В этом случае уже поддержка, которая была у оригинальной, протокольной части исследования исчезает, что и приводит к возможности неточностей. Собственно, судя по всему, это и является причиной мешанины подходов в статье - сравнение средних в группах ДА (это часть описательной статистики для групп лечения, предусмотренная протоколом) и сравнение эффектов на МС логистической регрессией.
Но, в принципе, я не интересуюсь написанием рецензии на результаты CATIE (особенно spin-off статей), с моей точки зрения такое обсуждение - если кто-то захочет его проводить, должно быть в разделе клиническая медицина.
Вы задали вопрос, как решить задачу. Вам ответили. Вопрос, почему авторы исследования считали по-другому надо адресовать авторам исследования.
Последний раз.
1) Если вопрос, что связано с МС, правильный подход ВСЕГДА использовать логистическую регрессию, ибо МС - бинарный показатель
2) Если вопрос, чем группы с МС отличаются друг от друга (хотя этот вопрос обычно задается для групп лечения - проверка адекватности рандомизации), то подход - сравнение средних при помощи ДА для количественных и логистическая регрессия - для качественных показателей. Разницу логистической регрессии подходов 1 и 2 я уже описал выше.
Смешение двух подходов является ошибкой, но вопрос о том, почему авторы ее допустили лежит вне сферы обсуждения на этом форуме.
martyni
Спасибо.
Рад был познакомиться с Вашим мнением.
Сомнений в компетентности отвечающих здесь у меня нет и не было, были только опасения, что мой вопрос не поняли, что ярко проявилось в первых ответах на мой вопрос.
Считаю тему статистического анализа, затронутого в этом посте, закрытой, дальнейшее обсуждение клинического вопроса, начатого здесь, бессмысленным.
mix3d
Уважаемые модераторы!

Несмотря на то, что пост закрыт, позволю себе обратиться к вам с вопросом. Написано много, но хотел бы удостовериться в правильности своих рассуждений.

Итак, требуется сравнить (выявить наличие либо отсутствие различий) по показателю (количественный непрерывный) 3 группы пациентов, классифицированные только по наличию у них одной из форм фибрилляции предсердий. При этом на сравниваемый показатель оказывают влияние другие факторы: пол, возраст, наличие АГ и/или ИБС и т.д.

Построение модели не требуется.

Я планирую использовать ковариационный анализ (ANCOVA), при этом сравниваемый показатель будет зависимой переменной, а перечисленные факторы независимыми. Вопрос в следующем, необходимо ли все факторы, по которым проводится корректировка включать одновременно либо по отдельности, кроме того, АГ и ИБС кодировать по отдельности (как два фактора), или можно в виде 1 (АГ), 2 (ИБС), 3 (АГ+ИБС) (1 фактор), если известно, что в такой последовательности увеличивается негативное влияние на изучаемый параметр.

Следующее, какую функцию связи использовать - линейную или нелинейную (или попробовать все варианты, выбрать лучший по результатам анализа)?

И, пожалуйста, последнее: не совсем для себя понял по какому p оценивать значимость различий, статистика Вальда для переменной, кодирующей форму фибрилляции предсердий или...?

Большое спасибо!

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.