Выбор метода сравнения групп |
Здравствуйте, гость ( Вход | Регистрация )
Выбор метода сравнения групп |
3.03.2016 - 07:59
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 20.07.2014 Пользователь №: 26530 |
Доброго времени суток!
У меня такой вопрос. Есть 3 группы больных, сгруппированные по возрасту. Оценивается общее состояние больного по 12-ти признакам. Указывается, сколько человек в той или иной группе имеют данный признак. Какими критериями можно сравнить группы по частотам, если каждый больной может иметь более одного признака (они частично пересекаются)? Например, больной может иметь 1-й, 7-й и 10-й признаки. Я так понимаю, что таблицы сопряженности здесь не проходят. |
|
7.03.2016 - 15:31
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
У меня такой вопрос. Есть 3 группы больных, сгруппированные по возрасту. Оценивается общее состояние больного по 12-ти признакам. Указывается, сколько человек в той или иной группе имеют данный признак. Какими критериями можно сравнить группы по частотам, если каждый больной может иметь более одного признака (они частично пересекаются)? Например, больной может иметь 1-й, 7-й и 10-й признаки. Я так понимаю, что таблицы сопряженности здесь не проходят. Во-первых, вопрос содержит вводящую в заблуждение информацию. В нём трижды встречается: "состояние больного", "каждый больной", "больной". А оказывается никакого "больного" вообще нет, а есть только сгруппированные данные, т.е. данные собранные с колоссальной потерей информации. Причём (важно!) с потерей информации как раз о больном, о "каждом больном". Это уже не медицина, а просто статистика. Некачественные данные сложно обработать качественно, а потому способ, предложенный ogurtsov'ым в первом же ответе на ваш вопрос - самый естественный. Хотя к предложенному можно ещё и возраст добавить - всё-таки больше имеющейся информации получится учесть. И для такого анализа у вас есть все исходные данные. Для этого: 1. Забываете про 12 признаков и берёте только первый. Если материал - большая таблица, то всё что не относится к признаку N 1 можно зачеркнуть или стереть - чтобы не отвлекало. Зная общее количество пациентов в каждой из трёх групп и процент (или число) пациентов в каждой возрастной категории с признаком N 1 вычисляете соответствующее число человек без этого признака. Полученную информацию сводите в таблицу сопряжённости с тремя входами: 1) Группа (3 категории) 2) Возрастная категория (Не указали сколько, но допустим 5 категорий. Надеюсь для всех групп эти категории одинаковы). Способ анализа возраста будет зависеть от того как собирался материал. Если на эти категории разбивался уже собранный материал, это - полноценный фактор. Если же специально ставилась цель охватить разные возрастные группы и в каждой такой группе набиралось заранее запланированное число человек (ну типа для репрезентативности) значит взаимодействие этого фактора с другими находится под контролем исследователя и его нельзя исключать из анализа. 3) Признак N 1 (2 категории: есть или нет). 2. Полученную таблицу из 3 х 5? х 2 ячеек анализируете иерархическим логлинейным анализом. Если взаимодействие всех трёх входов 123 окажется незначимым: а) для случая контролируемого возраста сразу делается вывод об отсутствии всяких различий в таблице. б) для случая неконтролируемого возраста - проверяете поочерёдно 12, 13 и 23. Если что-то значимо - то выяснить за счёт чего именно можно по анализу отклонений Фримана - Тьюки или по анализу скорректированных стандартизованных остатков (остатков Хабермана). 3. "Вспоминаете", что есть ещё Признак N 2. По нему - аналогично. И т.д. по всем 12. Таким образом имеете 12 анализов и не менее 12 выводов. Конечно, с ростом числа признаков ошибка I рода тоже будет расти. Но тут что поделаешь? Можно, конечно, поиграться с поправками типа Бонферрони, хотя я их не люблю. Да и при 12 признаках любой даже менее консервативный метод учёта множественности сравнений начисто лишит радости открытия... Пока всё. Если данные - ваши, то вы приобрели определённый опыт, и в следующий раз соберёте их уже по-человечески: строка - пациент, колонка - признак. Для этого есть все предпосылки: что на карточках, что в базах данных информация представлена в несгруппированном виде, т.е. именно по каждому больному индивидуально. При полноценных данных есть возможности для манёвров (я бы начал с канонического анализа соответствий, а самые интересные моменты подкрепил бы обычным хи-квадратом). Если же данные не ваши - ещё проще: вали'те всё на заказчика, это - его просчёты, ну а уж вы-то старались как могли - целых 12 анализов сделали... Сообщение отредактировал nokh - 7.03.2016 - 15:46 |
|
7.03.2016 - 15:58
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 20.07.2014 Пользователь №: 26530 |
...уже по-человечески: строка - пациент, колонка - признак. Для этого есть все предпосылки: что на карточках, что в базах данных информация представлена в несгруппированном виде, т.е. именно по каждому больному индивидуально. Ну да, спасибо! Я ровно так и сделал, о чем писал в последующих постах. Замечания Ogurtsov'a мне сразу показались наиболее дельными. |
|