Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Ну очень разное количество наблюдений в группах, хелп, плиз!
fr2007
сообщение 6.03.2007 - 17:04
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 6.03.2007
Пользователь №: 3988



insane.gif Добрый день! Подскажите, пожалуйста, ответ на такой вопрос - имеем большую базу данных по больным (около 5000), а здоровых всего 105 человек. Ну, сделали описательную статистику, гистограммы построили (кстати, оказалось, что ни один из показателей не имеет нормального распределения), а как эти группы сравнивать между собой? А потом еще шеф поставил задачу разделить их на группы по одному из показателей, получается: 186-3980-190 больных и соответственно 4-86-15 человек. Т.е. надо в принципе было бы сравнить 186 и 4 человека, 3980 и 86, 190 и 15. Группу здоровых больше не можем сделать, вот беда какая! Спасибо заранее!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 9.03.2007 - 18:54
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Простой ответ - набрать дополнительно количество здоровых лиц. Объяснение "набрать больше здоровых не можем" не убедительно, поскольку, в отличие от больных, здоровых найти легче.
Деление здоровых необходимо для того, чтобы не сравнивать яблоки с апельсинами. Например, среди больных преобладают пациенты с гиперергической реакцией, а среди здоровых - с нормо. Однако этот показатель не влияет на заболевание. Тогда, если он коррелирует с одним из влияющих Вы можете это не обнаружить (говоря заумно вы тем самым повышаете дисперсию ошибки). Делением на подгруппы Вы повышаете мощность исследования (так что шеф прав). Однако деля небольшую группу на части Вы снижаете мощность исследования ввиду небольшого количества наблюдений. Поэтому или всех больных со всеми здоровыми, либо нормо-здоровых с нормо-больными, гипер с гипер и т.п. Идея о том, что у здоровых "это их индивидуальные особенности", а у больных связанные с болезнью показатели, мягко говоря шаткая.
Поскольку у Вас есть различия между группами больных, то это важный фактор (если он влияет на изучаемый исход). Поэтому я бы предложил игнорировать группу с 4 человеками, (возможно и 15) и проанализировать только 3980/86. Учтите только, что в результате 4хкратного различия в численности надо использовать не обычный дисперсионный анализ, а общую линейную модель (GLM).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему