Цитата(mix3d @ 1.09.2009 - 22:41)

Извините, что пришлось открыть новую тему, пробовал задать вопрос в уже существующих, но не дождался, а время как всегда не терпит...
В другом разделе Вы пожелали чтобы вам ответили
модераторы - никто из обычных "духов" форума и не осмелился встревать

.
Цитата(mix3d @ 1.09.2009 - 22:41)

Итак, требуется сравнить (выявить наличие либо отсутствие различий) по показателю (количественный непрерывный) 3 группы пациентов, классифицированные только по наличию у них одной из форм фибрилляции предсердий. При этом на сравниваемый показатель оказывают влияние другие факторы: пол, возраст, наличие АГ и/или ИБС и т.д. Построение модели не требуется.
Я планирую использовать ковариационный анализ (ANCOVA), при этом сравниваемый показатель будет зависимой переменной, а перечисленные факторы независимыми. Вопрос в следующем, необходимо ли все факторы, по которым проводится корректировка включать одновременно либо по отдельности, кроме того, АГ и ИБС кодировать по отдельности (как два фактора), или можно в виде 1 (АГ), 2 (ИБС), 3 (АГ+ИБС) (1 фактор), если известно, что в такой последовательности увеличивается негативное влияние на изучаемый параметр.
Следующее, какую функцию связи использовать - линейную или нелинейную (или попробовать все варианты, выбрать лучший по результатам анализа)?
И, пожалуйста, последнее: не совсем для себя понял по какому p оценивать значимость различий, статистика Вальда для переменной, кодирующей форму фибрилляции предсердий или...?
Большое спасибо!
Да, эта задача решается ковариационным анализом в следующей модели:
Отклик - ваш Показатель;
Качественные предикторы (
факторы) - Группа (3 градации), Пол (2 градации) и Заболевание (3-4 или более градаций);
Количественный предиктор (
ковариата) - Возраст.
Поскольку заболевания - качественный фактор, вы можете закодировать их самым произвольным образом (например 0 - АГ+ИБС, 1 - отсутствие заболевания и т.д. - хотя это и неудобно и лучше упорядочить как у Вас), т.е. коды не несут количественной информации о степени влияния на признак.
ANCOVA - линейная процедура, и хотя теоретически её можно обобщить и на нелинейный отклик, мне неизвестны пакеты, где была бы реализована такая возможность. Поэтому
в случае отчетливо нелинейной зависимости Признака от Возраста единственным выходом из ситуации будет искусственная линеаризация отклика с помощью известного из теоретических соображений преобразования (или с помощью преобразования Бокса-Кокса по методу Зарембки в случае неизвестной из теории, но не слишком сложной нелинейной зависимости). Преобразования никак не помешают интерпретации результатов, но приблизят данные к требованиям статистической модели.
Статистическая значимость межгрупповых различий, а также влияния других предикторов и их взаимодействий оценивается обычным F-критерием (критерием дисперсионного отношения) - это к вопросу о р.
Плюс такого анализа - одновременный учёт всех влияющих факторов и следовательно - наиболее правильная оценка истинных межгрупповых различий. Она будет согласованной (adjusted) на все прочие факторы, как и оценки любого другого фактора.
Минусы анализа: сложность и вероятное нарушение допущений модели. Сложность не столько в техническом плане, сколько в плане верной интерпретации результатов. По сути модель предполагает полную однородность наклонов регрессий Признака от Возраста во всех ячейках комплекса. Т.е., например, для женщин с первой формой фибрилляции и наличием АГ и мужчин с третьей формой фибрилляции и отсутствием АГ и ИБС (не знаю возможно ли такое, но главное - идея понятна) зависимость признака от возраста должна быть линейной, а сами линии - параллельны. Отсутствие однородности наклонов (непараллельность) ведёт к неверному обсчету модели и следовательно - к неверной интерпретации. Поэтому чтобы разобраться "что к чему" на практике потребуется провести не один, а несколько анализов (с исключением или перегруппировкой каких-то факторов, посмотреть наклоны в отдельных ячейках и т.д.). Если даже однородность дисперсий в ANOVA наблюдается далеко не всегда, то однородность ковариаций в таких сложных ANCOVA - вообще редкая вещь, а это также может привести к ошибкам интерпретации
даже при большом числе наблюдений. Но попробовать и поразбираться конечно стоит.