Здравствуйте, гость ( Вход | Регистрация )
1.09.2009 - 19:41
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 32 Регистрация: 15.02.2009 Пользователь №: 5815 |
Извините, что пришлось открыть новую тему, пробовал задать вопрос в уже существующих, но не дождался, а время как всегда не терпит...
Мой вопрос касается корректировки при сравнении групп. Итак, требуется сравнить (выявить наличие либо отсутствие различий) по показателю (количественный непрерывный) 3 группы пациентов, классифицированные только по наличию у них одной из форм фибрилляции предсердий. При этом на сравниваемый показатель оказывают влияние другие факторы: пол, возраст, наличие АГ и/или ИБС и т.д. Построение модели не требуется. Я планирую использовать ковариационный анализ (ANCOVA), при этом сравниваемый показатель будет зависимой переменной, а перечисленные факторы независимыми. Вопрос в следующем, необходимо ли все факторы, по которым проводится корректировка включать одновременно либо по отдельности, кроме того, АГ и ИБС кодировать по отдельности (как два фактора), или можно в виде 1 (АГ), 2 (ИБС), 3 (АГ+ИБС) (1 фактор), если известно, что в такой последовательности увеличивается негативное влияние на изучаемый параметр. Следующее, какую функцию связи использовать - линейную или нелинейную (или попробовать все варианты, выбрать лучший по результатам анализа)? И, пожалуйста, последнее: не совсем для себя понял по какому p оценивать значимость различий, статистика Вальда для переменной, кодирующей форму фибрилляции предсердий или...? Большое спасибо! |
|
|
![]() |
![]() |
![]() |
2.09.2009 - 18:27
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Извините, что пришлось открыть новую тему, пробовал задать вопрос в уже существующих, но не дождался, а время как всегда не терпит... В другом разделе Вы пожелали чтобы вам ответили модераторы - никто из обычных "духов" форума и не осмелился встревать Итак, требуется сравнить (выявить наличие либо отсутствие различий) по показателю (количественный непрерывный) 3 группы пациентов, классифицированные только по наличию у них одной из форм фибрилляции предсердий. При этом на сравниваемый показатель оказывают влияние другие факторы: пол, возраст, наличие АГ и/или ИБС и т.д. Построение модели не требуется. Я планирую использовать ковариационный анализ (ANCOVA), при этом сравниваемый показатель будет зависимой переменной, а перечисленные факторы независимыми. Вопрос в следующем, необходимо ли все факторы, по которым проводится корректировка включать одновременно либо по отдельности, кроме того, АГ и ИБС кодировать по отдельности (как два фактора), или можно в виде 1 (АГ), 2 (ИБС), 3 (АГ+ИБС) (1 фактор), если известно, что в такой последовательности увеличивается негативное влияние на изучаемый параметр. Следующее, какую функцию связи использовать - линейную или нелинейную (или попробовать все варианты, выбрать лучший по результатам анализа)? И, пожалуйста, последнее: не совсем для себя понял по какому p оценивать значимость различий, статистика Вальда для переменной, кодирующей форму фибрилляции предсердий или...? Большое спасибо! Да, эта задача решается ковариационным анализом в следующей модели: Отклик - ваш Показатель; Качественные предикторы (факторы) - Группа (3 градации), Пол (2 градации) и Заболевание (3-4 или более градаций); Количественный предиктор (ковариата) - Возраст. Поскольку заболевания - качественный фактор, вы можете закодировать их самым произвольным образом (например 0 - АГ+ИБС, 1 - отсутствие заболевания и т.д. - хотя это и неудобно и лучше упорядочить как у Вас), т.е. коды не несут количественной информации о степени влияния на признак. ANCOVA - линейная процедура, и хотя теоретически её можно обобщить и на нелинейный отклик, мне неизвестны пакеты, где была бы реализована такая возможность. Поэтому в случае отчетливо нелинейной зависимости Признака от Возраста единственным выходом из ситуации будет искусственная линеаризация отклика с помощью известного из теоретических соображений преобразования (или с помощью преобразования Бокса-Кокса по методу Зарембки в случае неизвестной из теории, но не слишком сложной нелинейной зависимости). Преобразования никак не помешают интерпретации результатов, но приблизят данные к требованиям статистической модели. Статистическая значимость межгрупповых различий, а также влияния других предикторов и их взаимодействий оценивается обычным F-критерием (критерием дисперсионного отношения) - это к вопросу о р. Плюс такого анализа - одновременный учёт всех влияющих факторов и следовательно - наиболее правильная оценка истинных межгрупповых различий. Она будет согласованной (adjusted) на все прочие факторы, как и оценки любого другого фактора. Минусы анализа: сложность и вероятное нарушение допущений модели. Сложность не столько в техническом плане, сколько в плане верной интерпретации результатов. По сути модель предполагает полную однородность наклонов регрессий Признака от Возраста во всех ячейках комплекса. Т.е., например, для женщин с первой формой фибрилляции и наличием АГ и мужчин с третьей формой фибрилляции и отсутствием АГ и ИБС (не знаю возможно ли такое, но главное - идея понятна) зависимость признака от возраста должна быть линейной, а сами линии - параллельны. Отсутствие однородности наклонов (непараллельность) ведёт к неверному обсчету модели и следовательно - к неверной интерпретации. Поэтому чтобы разобраться "что к чему" на практике потребуется провести не один, а несколько анализов (с исключением или перегруппировкой каких-то факторов, посмотреть наклоны в отдельных ячейках и т.д.). Если даже однородность дисперсий в ANOVA наблюдается далеко не всегда, то однородность ковариаций в таких сложных ANCOVA - вообще редкая вещь, а это также может привести к ошибкам интерпретации даже при большом числе наблюдений. Но попробовать и поразбираться конечно стоит. Сообщение отредактировал nokh - 2.09.2009 - 19:19 |
|
|
![]() |
![]() |
mix3d Сравнение групп с учетом сторонних факторов 1.09.2009 - 19:41
mix3d Спасибо!
Видимо, побалуюсь и ограничусь Манно... 2.09.2009 - 19:16
nokh Цитата(mix3d @ 2.09.2009 - 22:16) Сп... 2.09.2009 - 19:29
mix3d Ну конечно же, что-то я сплоховал, правда помимо в... 2.09.2009 - 22:20
mix3d Уважаемые форумчане, к вопросу о...
Как, подскажи... 19.01.2010 - 00:51
DoctorStat Цитата(mix3d @ 19.01.2010 - 00:51) К... 19.01.2010 - 11:13
mix3d Спасибо.
Нет, к сожалению, какое именно распредел... 19.01.2010 - 13:17
Игорь Цитата(mix3d @ 19.01.2010 - 13:17) В... 19.01.2010 - 14:03
mix3d Фридман - это да, но по-моему в Statistica он реал... 19.01.2010 - 22:44
Pinus Обычный дисперсионный анализ можно использовать пр... 20.01.2010 - 00:15
mix3d Это радует, спасибо.
В процессе возник еще один в... 20.01.2010 - 11:40
nokh Цитата(mix3d @ 20.01.2010 - 13:40) Э... 21.01.2010 - 23:47
Pinus Цитата(mix3d @ 20.01.2010 - 18:40) В... 22.01.2010 - 00:48
mix3d Уважаемые коллеги, спасибо большое за ваши ответы ... 25.01.2010 - 23:43
Pinus Если в Вашем анализе количественные влияющие факто... 26.01.2010 - 12:07
Pinus Цитата(mix3d @ 26.01.2010 - 06:43) .... 7.02.2010 - 00:57![]() ![]() |