Цитата(nokh @ 14.06.2008 - 13:58)

Тоже читал подобные рекомендации, однако там это никак не обосновывалось. По идее, чем больше объемы выборок, тем выше мощность статистического критерия. Почему же тогда теряется смысл в таких сравнениях? По крайней мере с точки зрения статистики здесь все безупречно. А вот использование парного экспериментального плана для пусь похожих, но разных объектов - прием, широко используемый исследователями скорее по договоренности и в силу удобства, но оставляющий вопрос корректности открытым. Буду признателен вам за ссылку, где эти рекомендации обосновываются.
Вы правы относительно размера выборки, но только в том случае, если численность групп составляет 1:1. В противном случае дисперсия в группе (контроля) не меняется и дальнейшее снижение дисперсии в группе (случаев) ни к чему не приводит. Представьте себе ситуацию, что у нас в группе контроля 1 человек. Сколько случаев не набирай, он не будет репрезентативным представителем популяции контролей. Можете самостоятельно поэскпериментировать с формулами расчета выборки (например, взяв Stata, чтобы не считать вручную) и меняя там соотношение групп.
Что касается парного дизайна, то (сошлюсь на Armitage и Berry, Statistical Methods in Medical Research) тут усиление мощности происходит от использования парного дизайна. Поскольку парный дизайн аналогичен дизайнам с повторными измерениями, то используя его Вы снижаете дисперсию ошибки за счет парности по вмешивающимся факторам. Простой пример: изучаем влияние холестерина на развитие ИБС. АД также влияет на развитие ИБС. Если мы АД не учитываем, разный его уровень является "шумом", который мешает нам получить информацию о влиянии ХС (Т.е. любые различия между пациентами могут объясняться (1) разным ХС, (2) разным АД). Если мы берем пациентов с одинаковым АД, то единственно, чем они отличаются друг от друга - это уровнем ХС, поэтому любые различия между ними есть следствие (в простейшем случае) действия разного уровня ХС. Строго говоря, большая мощность многомерных методик заключается в модельном удалении эффекта третьих переменных. Однако модель есть модель и ее описать можно с ошибкой. Мы лет 10 назад анализировали относительную эффективность парного дизайна на данных когортного исследования и выяснили, что это мощный метод, но вероятность подбора пар достаточно низка (только около 35% пациентам удалось подобрать пары). Но у нас было примерное равенство лиц с разными уровнями факторов риска. В данном же случае, со значительным преобладанием одной группы мне кажется, что парный дизайн будет эффективнее (но не видя самой базы сказать сложно).