Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Случай-контроль, размер групп?
Luna
сообщение 11.06.2008 - 13:41
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 11.06.2008
Пользователь №: 5093



Добрый день!
Имеем 16000 человек с диагнозом, т.е. случаев, и 1500 здоровых - контролей. Несоответствие размера групп явное.
При этом имеем несколько факторов риска, влияние которых хотим оценить.
Что посоветуете сделать? Рассматривать имеющуюся численность? Или делать выборки из групп, если да, то какой численностью лучше?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 17.06.2008 - 07:07
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Спасибо за ссылки. Ресурс на Java понравился. Воспользовался им для расчета численности выборок для двух произвольных примеров (разные частоты, ошибки I и II рода). Графики ниже показывают, что после именно n1/n2=4 (см. точку 0,25) ничего кардинально не изменяется. Единственное кардинальное изменение - точка перегиба графика. К сожалению формула для неравных выборок у Флейса слишком сложна и мне не удалось вывести функцию зависимости n2 от n1 при заданных частотах и ошибках, чтобы найти координаты точки перегиба аналитически. На глаз она находится в районе 0,3, возможно между, 0,25 и 0,3. В принципе, ее можно интерполировать, потом попробую - интересно точка ли это или узкая область. Если Вы имели в виду эту точку (область), то после нее смысл анализа не теряется, просто происходит качественная потеря его эффективности . Действительно, для первого примера вместо 66 наблюдений (по 33 в каждой группе) при соотношении опыт : контроль = 1 : 10 потребуется уже 166 наблюдений, во втором примере - вместо 468 - 1189. Если же это ретроспективное исследование и материал уже набран, то не вижу никаких проблем чтобы использовать его целиком. Конечно парный дизайн более рационален, но применительно к данному случаю нельзя заранее решить что будет более эффективно - использовать материал целиком или искать пары. Выход - считать оба варианта.
Идею разнокачественной репрезентативности выборок в случае сильных различий в их объемах понял. Еще почитаю, но похоже что это еще одна внестатистическая обертка, сродни обертки терапевтической значимости поверх значимости статистической.
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему