![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 11.06.2008 Пользователь №: 5093 ![]() |
Добрый день!
Имеем 16000 человек с диагнозом, т.е. случаев, и 1500 здоровых - контролей. Несоответствие размера групп явное. При этом имеем несколько факторов риска, влияние которых хотим оценить. Что посоветуете сделать? Рассматривать имеющуюся численность? Или делать выборки из групп, если да, то какой численностью лучше? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Спасибо за ссылки. Ресурс на Java понравился. Воспользовался им для расчета численности выборок для двух произвольных примеров (разные частоты, ошибки I и II рода). Графики ниже показывают, что после именно n1/n2=4 (см. точку 0,25) ничего кардинально не изменяется. Единственное кардинальное изменение - точка перегиба графика. К сожалению формула для неравных выборок у Флейса слишком сложна и мне не удалось вывести функцию зависимости n2 от n1 при заданных частотах и ошибках, чтобы найти координаты точки перегиба аналитически. На глаз она находится в районе 0,3, возможно между, 0,25 и 0,3. В принципе, ее можно интерполировать, потом попробую - интересно точка ли это или узкая область. Если Вы имели в виду эту точку (область), то после нее смысл анализа не теряется, просто происходит качественная потеря его эффективности . Действительно, для первого примера вместо 66 наблюдений (по 33 в каждой группе) при соотношении опыт : контроль = 1 : 10 потребуется уже 166 наблюдений, во втором примере - вместо 468 - 1189. Если же это ретроспективное исследование и материал уже набран, то не вижу никаких проблем чтобы использовать его целиком. Конечно парный дизайн более рационален, но применительно к данному случаю нельзя заранее решить что будет более эффективно - использовать материал целиком или искать пары. Выход - считать оба варианта.
Идею разнокачественной репрезентативности выборок в случае сильных различий в их объемах понял. Еще почитаю, но похоже что это еще одна внестатистическая обертка, сродни обертки терапевтической значимости поверх значимости статистической. |
|
![]() |
![]() |
![]() ![]() |