Здравствуйте, гость ( Вход | Регистрация )
17.01.2007 - 18:55
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 14.01.2007 Пользователь №: 3146 |
Всем добрый день (вечер). Подскажите, как быть в конкретной ситуации: группа больных гипертонией была разделена на две подгруппы на основании определенного показателя, полученного при мониторировании АД. Статистический анализ показал различие по большинству основных клинико-демографических характеристик между подгруппами, т.е. подгруппы оказались несопоставимы. Далее я предпринял следующее действие: из известной статистической программы использовал функцию "Simple random sampling/Замер подмножества в случайном порядке", которая случайным образом отобрала 80% (задал произвольным образом) случаев основной группы больных, в результате чего две подгруппы из этой основной группы оказались теперь сопоставимы по клинико-демографическим характеристикам (точнее статистически значимые различия исчезли). Вопрос: Является ли корректным использование данной функции статистической программы. Как описать это в диссертации? Заранее всем спасибо.
|
|
|
![]() |
![]() |
![]() |
23.01.2007 - 18:36
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
1. Любой дисперсионный анализ начинается с оценки модели в целом (в первом вопросе речь шла о дисперсионном, не регресионном анализе, наверное, Вы описались, или речь идет о двух моделях?). В принципе, если у Вас и качественные и количественные влияющие переменные (например, пол, возраст, АД, группа воздействия), то Вы используете множественный дисперсионный анализ с ковариантами (MANCOVA или GLM) - это смесь дисперсионного и линеного регресионного анализоа. Если суммарно модель недостоверно, это означает, что ни один фактор не связан с исходом и на этом анализ заканчивается. Обратите однако внимание на то, что у Вас могут влиять сочетания факторов (например, АД и фактор воздействия). Как указывать сочетания зависит от программы, в которой Вы работаете, обычно что-то вроде SBP treat trea*SBP (т.е. отдельно сист.АД, отедльно лечение, вместе сист. АД и лечение). Лишь в том случае, если суммарная модель достоверна, можно смотреть на влияние отдельных факторов (и если в этом случае влияние, например АД не значимо - это уже не важно).
2. Логистическая модель предполагает качественный (бинарный) зависимый признак. Соответственно, она решает абсолютно иную задачу в отличие от дисперсионного анализа, где зависимый признак - количественный. Иными словами, влияние лечение на АД - задача для дисперсионного анализа, влияние лечения на исход (умер-не умер) - для логистической. Кроме того, для независимых переменных распределение все-таки важно, поэтому просто считать, что с использованием логистической регрессии все легко нельзя. 3. Не совсем понял вопрос, поскольку чем поможет критерий Мэнна-Уитни (для сравнения двух групп) в случае, если существует третий, вмешивающися фактор? (АД). Если Вы их сравните по МУ, то эффект от различий в уровне АД никуда не уйдет. Единственный варинат, который я могу предложить, чтобы воспользоваться МУ, это вначале сделать регресионный анализ (зависимость исхода от АД). Затем сохранить "остатки" (residuals), после этого сделать сравнение этих самых остатков в двух группах. Регресионный анализ исключит влияние АД, соответственно группы будут (надеемся) сопоставимыми (кстати, описанный выше подход, это, что делает втихоря программа дисперсионного анализа с ковариантами). |
|
|
![]() |
![]() |
24.01.2007 - 19:07
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 14.01.2007 Пользователь №: 3146 |
Спасибо, плав, за ответ. От дисперсионного анализа, а также от ковариационного (MANCOVA), решил отказаться полностью. Во-первых, две влияющие независимые переменные (качественная и количественная - обе характеризуют АД), оказались между собой статистически связаны, этого, как я понимаю, не допускает дисперсионный анализ. Во-вторых, условия нормального распределения (конечно, логарифмирование помогает) и равенства дисперсий выполнить, как оказалось, нелегко. В третьих, я не учел, наверное, самое главное - деление пациентов на стадии болезни. В этом случае все клинико-демографические показатели у выделенных подгрупп больных "внутри определенной стадии" оказались полностью сопоставимы и я с чистой совестью доказываю свои гипотезы с помощью Манна-Уитни. Кстати, использовал стадию болезни как независимую переменную в многофакторном анализе, но она тоже оказалась связанной с другими независимыми факторами (показателями АД), что вполне объяснимо.
Думаю, что так будет правильно. Тем не менее, благодаря Вам, стал немного разбираться в методах системного анализа и в будущем попробую их использовать. Спасибо. |
|
|
![]() |
![]() |
pavel_ Пути достижения статистической сопоставимости групп больных 17.01.2007 - 18:55
плав Нет, данный подход не легитимен. Статистические ра... 18.01.2007 - 16:06
pavel_ Цитата(плав @ 18.01.2007 - 16:06) 25... 18.01.2007 - 20:39
плав Не совсем понятно. Если зависимая переменная меняе... 18.01.2007 - 22:41
pavel_ Уважаемый плав, спасибо Вам за консультацию. Если ... 19.01.2007 - 19:59
плав На самом деле если две переменные связаны дург с д... 25.01.2007 - 21:45![]() ![]() |