Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Пути достижения статистической сопоставимости групп больных, медицинская статистика
pavel_
сообщение 17.01.2007 - 18:55
Сообщение #1





Группа: Пользователи
Сообщений: 4
Регистрация: 14.01.2007
Пользователь №: 3146



Всем добрый день (вечер). Подскажите, как быть в конкретной ситуации: группа больных гипертонией была разделена на две подгруппы на основании определенного показателя, полученного при мониторировании АД. Статистический анализ показал различие по большинству основных клинико-демографических характеристик между подгруппами, т.е. подгруппы оказались несопоставимы. Далее я предпринял следующее действие: из известной статистической программы использовал функцию "Simple random sampling/Замер подмножества в случайном порядке", которая случайным образом отобрала 80% (задал произвольным образом) случаев основной группы больных, в результате чего две подгруппы из этой основной группы оказались теперь сопоставимы по клинико-демографическим характеристикам (точнее статистически значимые различия исчезли). Вопрос: Является ли корректным использование данной функции статистической программы. Как описать это в диссертации? Заранее всем спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 23.01.2007 - 18:36
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



1. Любой дисперсионный анализ начинается с оценки модели в целом (в первом вопросе речь шла о дисперсионном, не регресионном анализе, наверное, Вы описались, или речь идет о двух моделях?). В принципе, если у Вас и качественные и количественные влияющие переменные (например, пол, возраст, АД, группа воздействия), то Вы используете множественный дисперсионный анализ с ковариантами (MANCOVA или GLM) - это смесь дисперсионного и линеного регресионного анализоа. Если суммарно модель недостоверно, это означает, что ни один фактор не связан с исходом и на этом анализ заканчивается. Обратите однако внимание на то, что у Вас могут влиять сочетания факторов (например, АД и фактор воздействия). Как указывать сочетания зависит от программы, в которой Вы работаете, обычно что-то вроде SBP treat trea*SBP (т.е. отдельно сист.АД, отедльно лечение, вместе сист. АД и лечение). Лишь в том случае, если суммарная модель достоверна, можно смотреть на влияние отдельных факторов (и если в этом случае влияние, например АД не значимо - это уже не важно).
2. Логистическая модель предполагает качественный (бинарный) зависимый признак. Соответственно, она решает абсолютно иную задачу в отличие от дисперсионного анализа, где зависимый признак - количественный. Иными словами, влияние лечение на АД - задача для дисперсионного анализа, влияние лечения на исход (умер-не умер) - для логистической. Кроме того, для независимых переменных распределение все-таки важно, поэтому просто считать, что с использованием логистической регрессии все легко нельзя.
3. Не совсем понял вопрос, поскольку чем поможет критерий Мэнна-Уитни (для сравнения двух групп) в случае, если существует третий, вмешивающися фактор? (АД). Если Вы их сравните по МУ, то эффект от различий в уровне АД никуда не уйдет. Единственный варинат, который я могу предложить, чтобы воспользоваться МУ, это вначале сделать регресионный анализ (зависимость исхода от АД). Затем сохранить "остатки" (residuals), после этого сделать сравнение этих самых остатков в двух группах. Регресионный анализ исключит влияние АД, соответственно группы будут (надеемся) сопоставимыми (кстати, описанный выше подход, это, что делает втихоря программа дисперсионного анализа с ковариантами).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
pavel_
сообщение 24.01.2007 - 19:07
Сообщение #3





Группа: Пользователи
Сообщений: 4
Регистрация: 14.01.2007
Пользователь №: 3146



Спасибо, плав, за ответ. От дисперсионного анализа, а также от ковариационного (MANCOVA), решил отказаться полностью. Во-первых, две влияющие независимые переменные (качественная и количественная - обе характеризуют АД), оказались между собой статистически связаны, этого, как я понимаю, не допускает дисперсионный анализ. Во-вторых, условия нормального распределения (конечно, логарифмирование помогает) и равенства дисперсий выполнить, как оказалось, нелегко. В третьих, я не учел, наверное, самое главное - деление пациентов на стадии болезни. В этом случае все клинико-демографические показатели у выделенных подгрупп больных "внутри определенной стадии" оказались полностью сопоставимы и я с чистой совестью доказываю свои гипотезы с помощью Манна-Уитни. Кстати, использовал стадию болезни как независимую переменную в многофакторном анализе, но она тоже оказалась связанной с другими независимыми факторами (показателями АД), что вполне объяснимо.
Думаю, что так будет правильно. Тем не менее, благодаря Вам, стал немного разбираться в методах системного анализа и в будущем попробую их использовать. Спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему