Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Помогите разобраться с дисперсионным анализом
Sadalmelika
сообщение 3.03.2021 - 14:48
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 3.03.2021
Пользователь №: 39577



Добрый день, уважаемые эксперты.
Я прошу помощи в обработке моего материала и использовании дисперсионного анализа.
Дано: есть 2 группы пациентов с АГ (684 человека) и без АГ (556 человек) (то есть фактор 1 - наличие АГ, который определяет принадлежность к группе, и я так понимаю он ранговый), при проведении непараметрического сравнения койко-дней (то есть фактор 2, и он количественный) в двух независимых группах выявлена достоверная разница. Но оказалось, что эти две группы не сопоставимы по возрасту (то есть фактор 3, который количественный), возраст в этих группах также достоверно различается.
Вопрос: как понять разница в койко-днях у пациентов с АГ и без АГ обусловлена наличием этой патологии либо разным возрастом пациентов в этих группах? То есть влияет ли фактор 3 на разницу переменной 2 в двух группах, определяющихся фактором 1? Я так понимаю, что необходимо проведение ANOVA, только какого? Факториального? Где зависимая - наличие АГ, а категориальные это возраст и койко-дни? И как интерпретировать тогда полученные результаты в таблице? Или я неправильно понимаю, что надо в данном случае использовать дисперсионный анализ?
Заранее прошу прощения может быть за немного корявый язык, я пока только пытаюсь разобраться в статистических методах, я ни разу не математик.
Буду очень благодарна любой помощи, совету!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 16.03.2021 - 22:59
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Sadalmelika @ 3.03.2021 - 16:48) *
Добрый день, уважаемые эксперты.
Я прошу помощи в обработке моего материала и использовании дисперсионного анализа.
Дано: есть 2 группы пациентов с АГ (684 человека) и без АГ (556 человек) (то есть фактор 1 - наличие АГ, который определяет принадлежность к группе, и я так понимаю он ранговый), при проведении непараметрического сравнения койко-дней (то есть фактор 2, и он количественный) в двух независимых группах выявлена достоверная разница. Но оказалось, что эти две группы не сопоставимы по возрасту (то есть фактор 3, который количественный), возраст в этих группах также достоверно различается.
Вопрос: как понять разница в койко-днях у пациентов с АГ и без АГ обусловлена наличием этой патологии либо разным возрастом пациентов в этих группах? То есть влияет ли фактор 3 на разницу переменной 2 в двух группах, определяющихся фактором 1? Я так понимаю, что необходимо проведение ANOVA, только какого? Факториального? Где зависимая - наличие АГ, а категориальные это возраст и койко-дни? И как интерпретировать тогда полученные результаты в таблице? Или я неправильно понимаю, что надо в данном случае использовать дисперсионный анализ?
Заранее прошу прощения может быть за немного корявый язык, я пока только пытаюсь разобраться в статистических методах, я ни разу не математик.
Буду очень благодарна любой помощи, совету!

Как уже указал comisora, нужен дисперсионный анализ - ANOVA.

Полагаю, что вам сейчас будет сложно провести полноценный ковариационный анализ (можно считать обобщением дисперсионного и регрессионного анализов). В нём нужно было бы сначала оценить равенство зависимостей от возраста в группах, и если оно одинаковое (нет значимых различий), то рассчитать общую зависимость, скорректировать данные на неё и уже только потом сравнить скорректированные на возраст группы. В случае различий зависимости от возраста в группах такую штуку не провести, поэтому я крайне скептически отношусь к программным модулям, где количественный показатель можно запросто задать в качестве ковариаты.

Учитывая, что данных у вас много, проще использовать не сам возраст, а его коды. Их можно задать с интервалом в 5 или 10 лет. Т.е., например, всех пациентов младше 20 лет отнести к возрастной категории 1, 20-30 лет - к категории 2, 30-40 лет - к 3 и т.д. Затем провести классический двухфакторный дисперсионный анализ (Two-way ANOVA) с взаимодействием факторов "Группа х Возраст".

В результате такого анализа сможете ответить сразу на 3 вопроса:
1) Фактор Группы. Различаются ли группы по койко-дням (т.к. возраст включён в анализ, его эффект при ответе на этот вопрос будет снят)
2) Фактор Возраст. Различаются ли пациенты разных возрастных групп по койко-дням.
3) Взаимодействие факторов Группа х Возраст. Если значимо, значит эти факторы нужно рассматривать совместно, в разных группах возрастная динамика разная.

По поводу счётного характера показателя "койко-день" тоже согласен. Для счётных признаков можно использовать преобразования, но попробуйте сначала с исходными данными.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Sadalmelika
сообщение 5.04.2021 - 12:44
Сообщение #3





Группа: Пользователи
Сообщений: 7
Регистрация: 3.03.2021
Пользователь №: 39577



Цитата(nokh @ 16.03.2021 - 22:59) *
Как уже указал comisora, нужен дисперсионный анализ - ANOVA.

Полагаю, что вам сейчас будет сложно провести полноценный ковариационный анализ (можно считать обобщением дисперсионного и регрессионного анализов). В нём нужно было бы сначала оценить равенство зависимостей от возраста в группах, и если оно одинаковое (нет значимых различий), то рассчитать общую зависимость, скорректировать данные на неё и уже только потом сравнить скорректированные на возраст группы. В случае различий зависимости от возраста в группах такую штуку не провести, поэтому я крайне скептически отношусь к программным модулям, где количественный показатель можно запросто задать в качестве ковариаты.

Учитывая, что данных у вас много, проще использовать не сам возраст, а его коды. Их можно задать с интервалом в 5 или 10 лет. Т.е., например, всех пациентов младше 20 лет отнести к возрастной категории 1, 20-30 лет - к категории 2, 30-40 лет - к 3 и т.д. Затем провести классический двухфакторный дисперсионный анализ (Two-way ANOVA) с взаимодействием факторов "Группа х Возраст".

В результате такого анализа сможете ответить сразу на 3 вопроса:
1) Фактор Группы. Различаются ли группы по койко-дням (т.к. возраст включён в анализ, его эффект при ответе на этот вопрос будет снят)
2) Фактор Возраст. Различаются ли пациенты разных возрастных групп по койко-дням.
3) Взаимодействие факторов Группа х Возраст. Если значимо, значит эти факторы нужно рассматривать совместно, в разных группах возрастная динамика разная.

По поводу счётного характера показателя "койко-день" тоже согласен. Для счётных признаков можно использовать преобразования, но попробуйте сначала с исходными данными.



ДАААА, Вы абсолютно правильно понимаете, что это будет нелегко.... Я правильно понимаю, что для Вашего метода мне надо ввести дополнительный столбик переменной и в ручную закодировать возраст под эти группы? Таким образом из счетной величины возраст перейдет в категориальную и тогда можно будет использовать двухфакторный дисперсионный анализ? Мне кажется у меня полная путаница в голове, но буду стараться распутаться и все же разобраться что к чему... Спасибище огромнейшее за ответ!!)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 5.04.2021 - 22:15
Сообщение #4





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Sadalmelika @ 5.04.2021 - 14:44) *
ДАААА, Вы абсолютно правильно понимаете, что это будет нелегко.... Я правильно понимаю, что для Вашего метода мне надо ввести дополнительный столбик переменной и в ручную закодировать возраст под эти группы? Таким образом из счетной величины возраст перейдет в категориальную и тогда можно будет использовать двухфакторный дисперсионный анализ? Мне кажется у меня полная путаница в голове, но буду стараться распутаться и все же разобраться что к чему... Спасибище огромнейшее за ответ!!)

Да, именно так: перекодировать из количественной в качественную категориальную. Двухфакторный дисперсионный анализ с взаимодействием описан везде, во всех учебниках и в хелпах ко всем пакетам. В работу желательно давать таблицу результатов и график взаимодействивия факторов (независимо от его значимости). Сделаете, можете прикрепить сюда результат, если будут сложности с интерпретацией /оформлением...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему