![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 11.06.2008 Пользователь №: 5093 ![]() |
Добрый день!
Имеем 16000 человек с диагнозом, т.е. случаев, и 1500 здоровых - контролей. Несоответствие размера групп явное. При этом имеем несколько факторов риска, влияние которых хотим оценить. Что посоветуете сделать? Рассматривать имеющуюся численность? Или делать выборки из групп, если да, то какой численностью лучше? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
... можно делать и наоборот - группа случаев в 2-3 раза больше. Другое дело, что если разница между группами начинает превышать 4 раза (а в посте - почти 10), то смысла в анализе такого соотношения нет... Тоже читал подобные рекомендации, однако там это никак не обосновывалось. По идее, чем больше объемы выборок, тем выше мощность статистического критерия. Почему же тогда теряется смысл в таких сравнениях? По крайней мере с точки зрения статистики здесь все безупречно. А вот использование парного экспериментального плана для пусь похожих, но разных объектов - прием, широко используемый исследователями скорее по договоренности и в силу удобства, но оставляющий вопрос корректности открытым. Буду признателен вам за ссылку, где эти рекомендации обосновываются. |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Тоже читал подобные рекомендации, однако там это никак не обосновывалось. По идее, чем больше объемы выборок, тем выше мощность статистического критерия. Почему же тогда теряется смысл в таких сравнениях? По крайней мере с точки зрения статистики здесь все безупречно. А вот использование парного экспериментального плана для пусь похожих, но разных объектов - прием, широко используемый исследователями скорее по договоренности и в силу удобства, но оставляющий вопрос корректности открытым. Буду признателен вам за ссылку, где эти рекомендации обосновываются. Вы правы относительно размера выборки, но только в том случае, если численность групп составляет 1:1. В противном случае дисперсия в группе (контроля) не меняется и дальнейшее снижение дисперсии в группе (случаев) ни к чему не приводит. Представьте себе ситуацию, что у нас в группе контроля 1 человек. Сколько случаев не набирай, он не будет репрезентативным представителем популяции контролей. Можете самостоятельно поэскпериментировать с формулами расчета выборки (например, взяв Stata, чтобы не считать вручную) и меняя там соотношение групп. Что касается парного дизайна, то (сошлюсь на Armitage и Berry, Statistical Methods in Medical Research) тут усиление мощности происходит от использования парного дизайна. Поскольку парный дизайн аналогичен дизайнам с повторными измерениями, то используя его Вы снижаете дисперсию ошибки за счет парности по вмешивающимся факторам. Простой пример: изучаем влияние холестерина на развитие ИБС. АД также влияет на развитие ИБС. Если мы АД не учитываем, разный его уровень является "шумом", который мешает нам получить информацию о влиянии ХС (Т.е. любые различия между пациентами могут объясняться (1) разным ХС, (2) разным АД). Если мы берем пациентов с одинаковым АД, то единственно, чем они отличаются друг от друга - это уровнем ХС, поэтому любые различия между ними есть следствие (в простейшем случае) действия разного уровня ХС. Строго говоря, большая мощность многомерных методик заключается в модельном удалении эффекта третьих переменных. Однако модель есть модель и ее описать можно с ошибкой. Мы лет 10 назад анализировали относительную эффективность парного дизайна на данных когортного исследования и выяснили, что это мощный метод, но вероятность подбора пар достаточно низка (только около 35% пациентам удалось подобрать пары). Но у нас было примерное равенство лиц с разными уровнями факторов риска. В данном же случае, со значительным преобладанием одной группы мне кажется, что парный дизайн будет эффективнее (но не видя самой базы сказать сложно). |
|
![]() |
![]() |
![]() ![]() |