Помогите рассчитать объем выборки! |
Здравствуйте, гость ( Вход | Регистрация )
Помогите рассчитать объем выборки! |
29.10.2008 - 22:25
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Здравствуйте! нужно рассчитать объем выборки для оценки эффективности лечения. при назначении препарата А - эффективность 43%, при отсутствии лечения - у 24% также позитивный эффект. Учитывая, что признаки качественные - пользуемся критерием хи-квадрат макнемара. Допускается уровень ошибки I рода (a) = .05. Ели не ошибаюсь, то в 6 версии программы Статистика есть расчет мощности и объема выборки. Как ею пользоваться для критерия хи-квадрат? (у меня английская версия) Спасибо! А у Вас что, одни и те же лица будут получать два препарата? Просто критерий МакНемара - это критерий для связанных, парных наблюдений. То, что Вы описываете, скорее задача для обычного критерия Хи2 - критерия Пирсона. Далее. Вы не указали нужную Вам мощность исследования. В каком проценте случаев Вы согласны пропустить имеющийся положительный эффект? Например, если Вы согласны рискнуть и не получить положительного результата в 20% случаев (или иметь 20% вероятность пропустить реально существующую эффективность препарата) Вам надо включить в исследование 212 человек, по 106 человек в группе вмешательства и контроля (при использовании критерия хи2 Пирсона - 192 человека всего, критерия Фишера - 212, хи2 максимального правдоподобия - 192). Если же хотите повысить мощность до 90% (т.е. вероятность пропустить только 10%) - то 276 человек (по 138 в группе). Это, правда, рассчитано на основе предположения использования нормальной аппроксимации (что при таком размере выборки делать можно). Если же хотите именно хи2, то рекомендую либо найти книгу Advanced Log-Linear Models Using SAS - там это описано или воспользуйтесь процедурой power в SAS. А у Statistica все описано в help'е |
|
30.10.2008 - 00:03
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Если выборки не связанные:
Power Analysis -Two Proportions, z-test. Но нужно знать размер выборок, чтобы посчитать мощность, если исследование закончено. Для вашего примера, если n1=n2=100, то power=0,817. Или задать мощность, например 0,90 и получить необходимый размер выборок. При равных выборках n1=n2=138, если n1=100, то n2=172. Программа строит также график зависимости мощности от размера n2, если n1 фиксировано. Если выборки не велики, есть возможность использовать поправку на непрерывность. Если все же выборки связанные и использовали хи-кв. Мак-Немара, то интересует разность эффекта, например, при приеме анальгина головная боль проходила в 43% случаев, а без лечения у этих же больных голова пройдет у 24%. В этом случае для 90% мощности необходимо не менее 108 наблюдений в каждой группе. Тогда в Statistica такой путь: Power Analysis and Interval Estimation -Sample Size Calculation ? Two Priportion, Paired Sample |
|
30.10.2008 - 00:40
Сообщение
#18
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Если выборки не связанные: Power Analysis -Two Proportions, z-test. Но нужно знать размер выборок, чтобы посчитать мощность, если исследование закончено. Для вашего примера, если n1=n2=100, то power=0,817. Или задать мощность, например 0,90 и получить необходимый размер выборок. При равных выборках n1=n2=138, если n1=100, то n2=172. Программа строит также график зависимости мощности от размера n2, если n1 фиксировано. Если выборки не велики, есть возможность использовать поправку на непрерывность. Если все же выборки связанные и использовали хи-кв. Мак-Немара, то интересует разность эффекта, например, при приеме анальгина головная боль проходила в 43% случаев, а без лечения у этих же больных голова пройдет у 24%. В этом случае для 90% мощности необходимо не менее 108 наблюдений в каждой группе. Тогда в Statistica такой путь: Power Analysis and Interval Estimation -Sample Size Calculation ? Two Priportion, Paired Sample А по-моему Statistica (как и все программы) использует априорный, а не апостериорный анализ мощности, т.е. отвечает на вопрос "А что будет если в исследовании получатся такие данные?", а не реально анализирует мощность уже законченного исследования. По крайней мере так в большинстве других систем (SAS, SPSS, Stata), а авторы Statistica мне не казались людьми, идущими в первых рядах адаптации новых методик. Там где-нибудь формулы есть? (хотя даже название Power Analysis -Two Proportions, z-test наводит на сомнения - это, похоже, худший вариант - нормальная аппроксимация биномиального распределения, т.е. дисперсия приравнивается p*(1-p) и далее, как количественный показатель), но не знаю... |
|
30.10.2008 - 11:47
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Поскольку анализ мощности в этой программе появился только с 7 версии, то хелпы очень подробные. Можно рассчитать мощность при заданных n1 и n2 или рассчитать необходимые размеры выборок при заданной мощности. По данному примеру, если выборки не связанные, при n1=n2=100, мощность 0,82 или при использовании поправки на непрерывность 0,77.
|
|
30.10.2008 - 11:59
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Поскольку анализ мощности в этой программе появился только с 7 версии, то хелпы очень подробные. Можно рассчитать мощность при заданных n1 и n2 или рассчитать необходимые размеры выборок при заданной мощности. По данному примеру, если выборки не связанные, при n1=n2=100, мощность 0,82 или при использовании поправки на непрерывность 0,77. Не, анализ мощности был еще в 5 версии в модуле индустриальной статистики |
|
30.10.2008 - 12:23
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Да, тогда, я его просто не заметила. В индустриальной статистике я только строила диаграммы и графики выбросов при верификации количественных данных. А анализ мощности давно и удобно сделано в NCSS-PASS, выдается удобная табличка с различными сочетаниями мощности и размера выборки.
|
|
30.10.2008 - 20:36
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 29.10.2008 Пользователь №: 5463 |
Плав и Лена,
спасибо за оперативный ответ. Моя ситуация , к сожалению, эксклюзивная - я планирую исследование. К сожалению - потому что это должно быть правилом, и с планирования работа должна начинаться. На практике ситуация другая - набираем материал, а потом думаем, что получено в итоге. В моей работе несколько групп , получающих монотерапию разными препаратами, затем - второй этап: перемешиваем всех, кто не получил эффекта и делим пополам: монотерапия более мощным препаратом и он же в комбинации другим (предположительно усиливающим положительный эффект и предупреждающим побочные). Естественно, планирую пользоваться критерием хи-квадрат (макнемара на втором этапе). Группы будут сравниваться попарно (имеет ли смысл выбрать самый эффективный - множественные сравнения?). T-критерий все-таки не комильфо. Российский подход таков - для препарата , результативность которого ожидается на уровне 90%, нужно менее 30 человек. В выборках аналогичного дизайна/при данном заболевании самое большое наблюдение 67 человек. Обычно 15-30. То есть, посмотри на товарисча, и делай примерно так же. Выборка на другой препарат ( обеспечивающий 43% успешного лечения): можно проводить 1. сравнение с данными той же группы до лечения и 2. сравнивать с плацебо (не дай бог мне еще в двойное слепое перейти). На плацебо - эффект 24%. Те же самые люди не получили никакого результата за годы заболевания, проведенного без лечения. То есть если формулировать задачу "до и после лечения" у меня может быть выбор 43 vs 0 , или с контрольной группой 43 vs 24. Вот инструкций по хи-квадрат в STATISTICA я не нашла. Кроме того, вроде бы есть ограничения, что ни одно из значений на может быть менее 5 (или нужна поправка йетса)? То есть в таблице сопряженности ниодно из значений не может быть менее 5. Я, не ленясь, пробую варианты выборок в BIOSTAT (простенькая программа, но пока единственная реальная помощь в проверке необходимого объема наблюдений). В случае 43% эффективности достаточно было бы 90 наблюдений. Итак, в чем я, возможно ошибаюсь? ЗЫ спасибо за помощь Сообщение отредактировал Парадокс - 30.10.2008 - 20:37 |
|
30.10.2008 - 20:39
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 29.10.2008 Пользователь №: 5463 |
В моем распоряжении есть STATISTICA и BIOSTAT. Ну и, конечно, майкрософт офис (эксель) и версия STATISTICA 6.0
|
|
30.10.2008 - 22:00
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Представим, что Парадокса высадили на необитаемом острове и дали только калькулятор...
Итак, в наличии: две группы. Одну не лечили (контроль), там положительных исходов Рк=0,24. Другую лечили, там Рл=0,43. Нужно вычислить объем выборки N, чтобы уловить эффект лечения с вероятностью (мощностью, чувствительностью) веtа=0,80. Сделаем две оценки разности долей положительных исходов dP=Рл-Рк. Одну с помощью значимости alfa, другую с помощью мощности веtа. ОЦЕНКА 1. Нулевая гипотеза: доли в двух выборках одинаковы. Объединенная оценка доли равна: Рср=(Рк+Рл)/2=(0,43+0,24)/2=0,34 Величина Z=dP1/S - подчиняется стандартному нормальному распределению, где s - стандартное отклонение, S=sqtr[Pср(1-Рср)(1/N+1/N)]=0,67/sqrt(N) При уровне значимости alfa=0,05 критическое значение Za=1,960. Ему соответствует разность долей: dP1=Za*S=1,960*0,67/sqrt(N)=1,31/sqrt(N) ОЦЕНКА 2. Фактическая разность долей равна: dP2=Рл-Рк=0,43-0,24=0,19 Величина Z=(dP1-dP2)/S - подчиняется стандартному нормальному распределению. Чувствительность веtа=0,80. По таблице стандартного нормального распределения находим Zв, правее которого лежит 80% всех значений: Zв=-0,85. Ему соответствует dP1=dP2+Zв*S=0,19-0,85*0,67/sqrt(N)=0,19-0,57/sqrt(N) Приравняем оценку 1 и 2 для разности долей: 1,31/sqrt(N)=0,19-0,57/sqrt(N) Отсюда находим минимальный объем выборки пациентов в каждой группе N=36. Сообщение отредактировал DoctorStat - 30.10.2008 - 22:02 Просто включи мозги => http://doctorstat.narod.ru
|
|
30.10.2008 - 22:24
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 29.10.2008 Пользователь №: 5463 |
сорри за настойчивость .
Впечатляет кажущаяся простота. Какой программой оптимально пользоваться для моих скромных целей расчета объема выборки? |
|
30.10.2008 - 22:39
Сообщение
#26
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Представим, что Парадокса высадили на необитаемом острове и дали только калькулятор... Итак, в наличии: две группы. Одну не лечили (контроль), там положительных исходов Рк=0,24. Другую лечили, там Рл=0,43. Нужно вычислить объем выборки N, чтобы уловить эффект лечения с вероятностью (мощностью, чувствительностью) веtа=0,80. Сделаем две оценки разности долей положительных исходов dP=Рл-Рк. Одну с помощью значимости alfa, другую с помощью мощности веtа. ОЦЕНКА 1. Нулевая гипотеза: доли в двух выборках одинаковы. Объединенная оценка доли равна: Рср=(Рк+Рл)/2=(0,43+0,24)/2=0,34 Величина Z=dP1/S - подчиняется стандартному нормальному распределению, где s - стандартное отклонение, S=sqtr[Pср(1-Рср)(1/N+1/N)]=0,67/sqrt(N) При уровне значимости alfa=0,05 критическое значение Za=1,960. Ему соответствует разность долей: dP1=Za*S=1,960*0,67/sqrt(N)=1,31/sqrt(N) ОЦЕНКА 2. Фактическая разность долей равна: dP2=Рл-Рк=0,43-0,24=0,19 Величина Z=(dP1-dP2)/S - подчиняется стандартному нормальному распределению. Чувствительность веtа=0,80. По таблице стандартного нормального распределения находим Zв, правее которого лежит 80% всех значений: Zв=-0,85. Ему соответствует dP1=dP2+Zв*S=0,19-0,85*0,67/sqrt(N)=0,19-0,57/sqrt(N) Приравняем оценку 1 и 2 для разности долей: 1,31/sqrt(N)=0,19-0,57/sqrt(N) Отсюда находим минимальный объем выборки пациентов в каждой группе N=36. Проверьте расчеты, в них что-то не так. Существует формула для оценки (с помощью того же биномиального распределния) количества лиц, необходимых для участия в исследовании при заданной мощности исследования: 2*(Za+Zb)^2/d^2, где d - стандартизированный размер эффекта. В данном случае (доли) он будет равен (р2-р1)/sqrt[p*(1-p)]. Соответственно: (Za+Zb)^2=(1.96+0.84)^2=7.8; d^2=(0.43-0.24)^2/[0.34*(1-0.34)]=0.1609 Количество людей: 2*7,8/0,1609=97 человек в группе Мои расчеты подтверждаются тем, что: - система SAS дает 96 человек в группе - Stata дает 106 человек в группе В принципе я не очень понимаю Парадокса - я уже несколькими заметками выше описал потребности в количестве пациентов для этого исследования Добавление. Действительно в обсуждении DoctorStat закралась ошибка - она связана с тем, что при планировании исследования мы должны найти неизвестную нам границу, которая обеспечит одновременно 5% вероятность ошибки I типа и 20% вероятность ошибки второго типа (там этого нет, если использовать приведенную выше логику - что значение границы равно наблюдаемому, то мощность всегда будет 0,5) Итак, рассуждения приводящие к формуле Cohen, которую я цитировал выше: H0: (x-p1)/SE=Za Ha: (p2-x)/SE=Zb Решаем эту систему уравнений: x-p1=Za*SE p2-x=Zb*SE => p2-p1=SE(Za+Zb) и (p2-p1)^2=SE^2*(Za+Zb)^2 Мы знаем, что SE^2=p*(1-p)/n Отсюда (p1-p2)^2=p*(1-p)(Za+Zb)^2/n И тогда n=(Za+Zb)^2*[p*(1-p)]/(p1-p2)^2 |
|
30.10.2008 - 22:51
Сообщение
#27
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Плав и Лена, спасибо за оперативный ответ. Моя ситуация , к сожалению, эксклюзивная - я планирую исследование. К сожалению - потому что это должно быть правилом, и с планирования работа должна начинаться. На практике ситуация другая - набираем материал, а потом думаем, что получено в итоге. В моей работе несколько групп , получающих монотерапию разными препаратами, затем - второй этап: перемешиваем всех, кто не получил эффекта и делим пополам: монотерапия более мощным препаратом и он же в комбинации другим (предположительно усиливающим положительный эффект и предупреждающим побочные). Естественно, планирую пользоваться критерием хи-квадрат (макнемара на втором этапе). Группы будут сравниваться попарно (имеет ли смысл выбрать самый эффективный - множественные сравнения?). T-критерий все-таки не комильфо. Российский подход таков - для препарата , результативность которого ожидается на уровне 90%, нужно менее 30 человек. В выборках аналогичного дизайна/при данном заболевании самое большое наблюдение 67 человек. Обычно 15-30. То есть, посмотри на товарисча, и делай примерно так же. Выборка на другой препарат ( обеспечивающий 43% успешного лечения): можно проводить 1. сравнение с данными той же группы до лечения и 2. сравнивать с плацебо (не дай бог мне еще в двойное слепое перейти). На плацебо - эффект 24%. Те же самые люди не получили никакого результата за годы заболевания, проведенного без лечения. То есть если формулировать задачу "до и после лечения" у меня может быть выбор 43 vs 0 , или с контрольной группой 43 vs 24. Вот инструкций по хи-квадрат в STATISTICA я не нашла. Кроме того, вроде бы есть ограничения, что ни одно из значений на может быть менее 5 (или нужна поправка йетса)? То есть в таблице сопряженности ниодно из значений не может быть менее 5. Я, не ленясь, пробую варианты выборок в BIOSTAT (простенькая программа, но пока единственная реальная помощь в проверке необходимого объема наблюдений). В случае 43% эффективности достаточно было бы 90 наблюдений. Итак, в чем я, возможно ошибаюсь? ЗЫ спасибо за помощь 1) Ситуация не эксклюзивная. У нас в учреждении теперь это требуется от всех аспирантов. Нормальные исследования (т.е. те, которые оказывают воздействие на рынок, а не диссертационные) уже давно планируются 2) Надо прочитать книгу по статистике. Вам, похоже, очень нравится критерий МакНемара, но реально использовать его Вам не удастся. Тот дизайн, который до-после включает в себя, как минимум, три этапа (это перекрестный) двухпериодные дизайны без контроля не используются. Заявления типа "Т-критерий не комильфо" демонстрируют серьезное незнание ситуации (Т-критерий для количественных показателей - наиболее мощный, для качественных его просто нет). Аппроксимация Т-распределением и Т-критерий вещи разные. 3) Читайте инструкции. Скорее всего, достаточно (по BIOSTAT) не 90 наблюдений, а по 90 в группе (т.е. 180), что совпадает со всеми приведенными рассчетами. Хотите от обратного - пожалуйста: если Вы возьмете 90 человек всего (45 в группе)мощность Вашего исследования составит 48%, т.е. более, чем с 50% вероятностью если даже препарат работает, Вы получите р>0,05. |
|
30.10.2008 - 23:42
Сообщение
#28
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Цель четко не сформулирована, но методы статистики перечисляются и даже Т-критерий упоминается.
Я поняла так, что Парадокс планирует провести исследование по оценке второго более мощного препарата. Во первых, по сравнению с плацебо, при этом известно из предварительных данных, что он эффективен в 43% случаев, тогда как плацебо ? в 24%. Чтобы подтвердить различия на 5% уровне значимости, как было уже показано, для высокой мощности вам необходимо не менее 138 наблюдений в каждой группе, а для мощности 0,80 достаточно по 96 наблюдений. Вот если бы эффективность действительно была бы 90%, а при плацебо 24%, то хватило бы и 10 больных в группах. А во вторых есть желание доказать эффективность препарата в одной и той же группе, при условии, что без лечения улучшения нет ни у одного больного, а при лечении у 43%. Различия доказали используя критерий Мак-Немара. При этом, высокая мощность (0,90) достигается уже при n1=n2=16 больных. Так что российский подход, о котором пишет Парадокс, в случае высокого различия в эффекте вполне может подойти. Вот только рандомизация на малом числе объектов может не обеспечить однородность групп сравнения. |
|
31.10.2008 - 00:04
Сообщение
#29
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
По рассматриваемому примеру, при заданной мощности 0,80, n1=n2=96, а используя поправку на непрерывность n1=n2=106, в Statistica 7,0 все это можно сделать и хелпы хорошие.
|
|
31.10.2008 - 00:14
Сообщение
#30
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Цель четко не сформулирована, но методы статистики перечисляются и даже Т-критерий упоминается. Я поняла так, что Парадокс планирует провести исследование по оценке второго более мощного препарата. Во первых, по сравнению с плацебо, при этом известно из предварительных данных, что он эффективен в 43% случаев, тогда как плацебо ? в 24%. Чтобы подтвердить различия на 5% уровне значимости, как было уже показано, для высокой мощности вам необходимо не менее 138 наблюдений в каждой группе, а для мощности 0,80 достаточно по 96 наблюдений. Вот если бы эффективность действительно была бы 90%, а при плацебо 24%, то хватило бы и 10 больных в группах. А во вторых есть желание доказать эффективность препарата в одной и той же группе, при условии, что без лечения улучшения нет ни у одного больного, а при лечении у 43%. Различия доказали используя критерий Мак-Немара. При этом, высокая мощность (0,90) достигается уже при n1=n2=16 больных. Так что российский подход, о котором пишет Парадокс, в случае высокого различия в эффекте вполне может подойти. Вот только рандомизация на малом числе объектов может не обеспечить однородность групп сравнения. Я чего-то не понял. Если при плацебо эффективность 24%, как можно предполагать, что без лечения улучшения нет? Далее, а как рассчитывается количество необходимых пациентов при использовании критерия МакНемара в данном случае? Я вообще не очень понимаю, при чем тут МакНемар. Тест МакНемара предполагает наличие пар наблюдений (ок, один и тот же пациент) и следующие возможности в парах +- -+ ++ -- В данном же случае варианты -+ и -- не рассматриваются по определнию, а -+ это дискордантная пара необходимая для тестирования. Соответственно, тест МакНемара просто не применим. Максимум, что можно использовать - обычный биномиальный тест знаков - два исхода - улучшилось/ухудшилось. |
|