Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Помогите рассчитать объем выборки!

Автор: Юлёна 28.08.2008 - 15:50

добрый день, подскажите, если кто помнит!

проводятся клинические исследования по выявлению эффективности препарата (от ОРВИ и гриппа).
какой должен быть объем выборки, чтобы полученные результаты были достоверны?
какая должна быть по объему контрольная группа?

пожалуйста, если кто-то может помочь, буду ооочень благодарна!

Автор: nokh 30.08.2008 - 08:51

Опишите главные признаки по которым вы будете оценивать эффективность. Грубо их можно разделить на количественные (число койко-дней, продолжительность регистрации к/л симптомов заболевания, температура и др. измерения и т.д.) и качественные (частоты, представляемые в процентах). Расчет объемов выборки для этих двух групп признаков проводится по-разному, но в любом случае понадобится дополнительная информация о величине предполагаемых различий с контролем, а для количественных признаков - еще и об изменчивости показателя.

Автор: Юлёна 1.09.2008 - 10:44

Цитата(nokh @ 30.08.2008 - 09:51) *
Опишите главные признаки по которым вы будете оценивать эффективность. Грубо их можно разделить на количественные (число койко-дней, продолжительность регистрации к/л симптомов заболевания, температура и др. измерения и т.д.) и качественные (частоты, представляемые в процентах). Расчет объемов выборки для этих двух групп признаков проводится по-разному, но в любом случае понадобится дополнительная информация о величине предполагаемых различий с контролем, а для количественных признаков - еще и об изменчивости показателя.

признаки количественные. учитывается наличие/отсутствие какого либо синдрома в баллах (головокружение, озноб, тошнота и т.д.). Сравнение идет по суммам баллов за 6 дней. к сожалению никакой доп информации нет(((


Автор: DrgLena 1.09.2008 - 12:19

....головокружение, озноб, тошнота и т.д - это не количественные переменные, суммировать их все вместе за 6 дней - полный бред!!! Грипп лечи - не лечи, чрез 7 дней пройдет. Если вы предложите способ лечения, чтобы через 2 дня прошли все симптомы, то эффективность составит 7-2 =5 дней. Это можно рассматривать, как желаемый эффект и тогда можно говорить о том, как рассчитать величину групп для получения необходимой статистической мощности исследования.
Если ваша цель облегчить симтомы, которы можно рассматиривать как суррогатные точки исследования, то можно показать, что разность относительных частот больных с наличием симптома до и после лечения в одной группе больше чем в другой, используя для этого соответствующие методы статистики.

Автор: Игорь 1.09.2008 - 17:56

Да, признаки неколичественные.

Для них можно рассчитать, скажем, относительный риск, отношение шансов, разность пропорций. Для их расчета велика или мала численность - не имеет значения. Она берется такая, как есть. Численность будет иметь значение, когда Вы будете считать доверительные интервалы для показателей. Чем больше будет численность, тем точнее интервалы.

Автор: плав 3.09.2008 - 22:01

Цитата(Игорь @ 1.09.2008 - 18:56) *
Да, признаки неколичественные.

Для них можно рассчитать, скажем, относительный риск, отношение шансов, разность пропорций. Для их расчета велика или мала численность - не имеет значения. Она берется такая, как есть. Численность будет иметь значение, когда Вы будете считать доверительные интервалы для показателей. Чем больше будет численность, тем точнее интервалы.

Не совсем так. Вообще-то при планировании исследования необходимо оценить минимальный эффект, ради которого еще стоит проводить исследование и затем набрать столько объектов (пациентов), чтобы этот эффект не пропустить. Например, исследователь можеть считать, что отношение шансов менее 1,2 слишком мало и если такой эффект будет пропущен, то ничего страшного не произойдет. Соответственно, он может рассчитать размер выборки исходя из известной вероятности ошибки 1 типа (0,05), предполагаемой вероятности ошибки 2 типа (например, 0,2) и минимально значимого размера эффекта (1,2 для отношения шансов). Другое дело, что в описании не хватает данных для расчета требуемой численности, но теоретически сделать это можно.

Автор: Докто Светлана 20.09.2008 - 22:14

Цитата(Юлёна @ 28.08.2008 - 15:50) *
добрый день, подскажите, если кто помнит!

проводятся клинические исследования по выявлению эффективности препарата (от ОРВИ и гриппа).
какой должен быть объем выборки, чтобы полученные результаты были достоверны?
какая должна быть по объему контрольная группа?

пожалуйста, если кто-то может помочь, буду ооочень благодарна!

минимум 20-25 человек, уже считается достоверной. Контрольная группа может отличатся, в числе на 6-7 человек больше.

Автор: плав 20.09.2008 - 22:28

Цитата(Докто Светлана @ 20.09.2008 - 23:14) *
минимум 20-25 человек, уже считается достоверной. Контрольная группа может отличатся, в числе на 6-7 человек больше.

Круто! Вот это совет, так совет. А откуда Вы это взяли, указать не можете? Ссылочку может?

Для остальных, кто будет читать этот пост - автор не вполне понимает о чем говорит, благодаря таким "советчикам" можно влипнуть очень сильно

Автор: плав 21.09.2008 - 09:59

Решил добавить пример, чтобы было понятно, почему совет "20-25 человек" является полностью ошибочным. Итак, в реальности препарат снижает тяжесть течения заболевания, но (естественно) не у всех пациентов. Скажем, он действует у 10% обследованных. Берем 25 человек, 10% - 2,5 человека (будем считать 2). Итак, в исследуемой группе 2 пациентам станет лучше, остальные не будут отличаться от контроля. Если Вы теперь подставите эти значения в любую программу анализа или подсчитаете достоверности, то получите р=0,15. Иными словами на этой группе найти различий невозможно (тогда о какой достоверности мы говорим)!
Ситуация осложняется тем, что при взятии выборки количество тех, кому станет лучше может быть и 2 и 5 на 25 человек (возьмите 20 белых и 20 фиолетовых фасолен, перемешайте в мешке, затем засуньте руку в мешок и отберите (не видя) восемь, как Вы думаете, будет 4 белых и 4 фиолетовых? Попробуйте).
Вот по этой причине и делается планирование исследования на основании данных пилотных исследований и/или экспертной оценки предполагаемого результата. Например, в приведенном выше случае мощность исследования с 25 человеками в группе контроля и 25 - во вмешательстве (мощность - вероятность найти эффект препарата, если он существует) составляет только 22% (т.е. только в 22% исследований его удастся обнаружить). Это неприемлимо мало. Мощность должна составлять не менее 80%.
Для такой мощности необходимо 186 человек (суммарно, группа контроля и вмешательства).
Если препарат ожидается более эффективным, то можно обйтись меньшим количеством людей. Например, если препарат помогает каждому пятому (эффективность 20%), то надо 88 человек всего (по 44 в группе).
И еще. Максимальная мощность достигается при одинаковой численности группы контроля и вмешательства. Так что "в группе контроля может быть на 6-7 человек больше" является, мягко говоря, ошибочным заявлением.

Автор: Игорь 5.10.2008 - 16:10

В предыдущих постах подробно все описано.

Но несколько фактов не помешают.
Формулы для расчета различаются для случаев, количественные или качественные характеристики придется измерять.
Вот тут основные формулы есть: http://www.marketresearchworld.net/index2.php?option=com_content&do_pdf=1&id=23
Вот тут пояснения, какие параметры в формулы подставлять: http://www.ifad.org/gender/tools/hfs/anthropometry/ant_3.htm

А вообще есть масса литературы по теме. Введите в строке поиска: sample size. В сети можно найти и множество калькуляторов, которые проделают за вас все вычисления.

Еще есть несколько книг, где вопросы вычисления потребной численности рассмотрены подробно. Как и следовало ожидать, данная проблема остро стоит не только перед медиками, но и перед маркетологами. Это книги: Голубков "Маркетинговые исследования" и Малхотра с аналогичным названием.

Автор: Helen81 29.10.2008 - 01:22

Объем выборки зависит от вида выборки,гранично допустимой ошибки, уровня вероятности.

Автор: Игорь 29.10.2008 - 08:27

Цитата(Helen81 @ 29.10.2008 - 02:22) *
Объем выборки зависит от вида выборки,гранично допустимой ошибки, уровня вероятности.

Совершенно верно. Об этом как раз сказано в предыдущих постах и указанных ссылках.

Но имеется проблема. Часто выборка просто есть, и исследователь не имеет возможности влиять на ее объем. Так сказать, он находится в пассивной роли по отношению к предмету исследования. Например, лечилось 45 пациентов с данной патологий (и взять их негде), а требуется для анализа не менее 250. Либо по финансовым соображениям можно купить 50 животных для эксперимента, а на требуемые 540 просто нет денег.

Автор: Helen81 29.10.2008 - 09:58

Цитата(Игорь @ 29.10.2008 - 09:27) *
Совершенно верно. Об этом как раз сказано в предыдущих постах и указанных ссылках.

Но имеется проблема. Часто выборка просто есть, и исследователь не имеет возможности влиять на ее объем. Так сказать, он находится в пассивной роли по отношению к предмету исследования. Например, лечилось 45 пациентов с данной патологий (и взять их негде), а требуется для анализа не менее 250. Либо по финансовым соображениям можно купить 50 животных для эксперимента, а на требуемые 540 просто нет денег.



И что же можно сделать,чтобы во время защиты "выйти сухим из воды"?

Автор: DoctorStat 29.10.2008 - 11:22

Цитата(Helen81 @ 29.10.2008 - 09:58) *
И что же можно сделать,чтобы во время защиты "выйти сухим из воды"?

Нужно рассчитать чувствительность (мощность) метода для использованного в исследовании фиксированного объема выборки. Мощность показывает: какая часть больных будет выявлена (вылечена) с помощью предлагаемого метода. Если эта часть достаточно велика (>80%), то метод применим, и его результаты значимы. В противном случае, если с помощью этого метода Вы ничего не выявили, то это ни о чем не говорит - просто вероятность что-то найти была слишком мала.

Автор: Парадокс 29.10.2008 - 21:15

Здравствуйте!

нужно рассчитать объем выборки для оценки эффективности лечения. при назначении препарата А - эффективность 43%, при отсутствии лечения - у 24% также позитивный эффект. Учитывая, что признаки качественные - пользуемся критерием хи-квадрат макнемара. Допускается уровень ошибки I рода (a) = .05.

Ели не ошибаюсь, то в 6 версии программы Статистика есть расчет мощности и объема выборки. Как ею пользоваться для критерия хи-квадрат? (у меня английская версия)

Спасибо!

Автор: плав 29.10.2008 - 22:25

Цитата(Парадокс @ 29.10.2008 - 21:15) *
Здравствуйте!

нужно рассчитать объем выборки для оценки эффективности лечения. при назначении препарата А - эффективность 43%, при отсутствии лечения - у 24% также позитивный эффект. Учитывая, что признаки качественные - пользуемся критерием хи-квадрат макнемара. Допускается уровень ошибки I рода (a) = .05.

Ели не ошибаюсь, то в 6 версии программы Статистика есть расчет мощности и объема выборки. Как ею пользоваться для критерия хи-квадрат? (у меня английская версия)

Спасибо!

А у Вас что, одни и те же лица будут получать два препарата? Просто критерий МакНемара - это критерий для связанных, парных наблюдений. То, что Вы описываете, скорее задача для обычного критерия Хи2 - критерия Пирсона.
Далее. Вы не указали нужную Вам мощность исследования. В каком проценте случаев Вы согласны пропустить имеющийся положительный эффект? Например, если Вы согласны рискнуть и не получить положительного результата в 20% случаев (или иметь 20% вероятность пропустить реально существующую эффективность препарата) Вам надо включить в исследование 212 человек, по 106 человек в группе вмешательства и контроля (при использовании критерия хи2 Пирсона - 192 человека всего, критерия Фишера - 212, хи2 максимального правдоподобия - 192). Если же хотите повысить мощность до 90% (т.е. вероятность пропустить только 10%) - то 276 человек (по 138 в группе). Это, правда, рассчитано на основе предположения использования нормальной аппроксимации (что при таком размере выборки делать можно). Если же хотите именно хи2, то рекомендую либо найти книгу Advanced Log-Linear Models Using SAS - там это описано или воспользуйтесь процедурой power в SAS. А у Statistica все описано в help'е

Автор: DrgLena 30.10.2008 - 00:03

Если выборки не связанные:
Power Analysis -Two Proportions, z-test.
Но нужно знать размер выборок, чтобы посчитать мощность, если исследование закончено. Для вашего примера, если n1=n2=100, то power=0,817. Или задать мощность, например 0,90 и получить необходимый размер выборок. При равных выборках n1=n2=138, если n1=100, то n2=172. Программа строит также график зависимости мощности от размера n2, если n1 фиксировано. Если выборки не велики, есть возможность использовать поправку на непрерывность.
Если все же выборки связанные и использовали хи-кв. Мак-Немара, то интересует разность эффекта, например, при приеме анальгина головная боль проходила в 43% случаев, а без лечения у этих же больных голова пройдет у 24%. В этом случае для 90% мощности необходимо не менее 108 наблюдений в каждой группе.
Тогда в Statistica такой путь:
Power Analysis and Interval Estimation -Sample Size Calculation ? Two Priportion, Paired Sample

Автор: плав 30.10.2008 - 00:40

Цитата(DrgLena @ 30.10.2008 - 00:03) *
Если выборки не связанные:
Power Analysis -Two Proportions, z-test.
Но нужно знать размер выборок, чтобы посчитать мощность, если исследование закончено. Для вашего примера, если n1=n2=100, то power=0,817. Или задать мощность, например 0,90 и получить необходимый размер выборок. При равных выборках n1=n2=138, если n1=100, то n2=172. Программа строит также график зависимости мощности от размера n2, если n1 фиксировано. Если выборки не велики, есть возможность использовать поправку на непрерывность.
Если все же выборки связанные и использовали хи-кв. Мак-Немара, то интересует разность эффекта, например, при приеме анальгина головная боль проходила в 43% случаев, а без лечения у этих же больных голова пройдет у 24%. В этом случае для 90% мощности необходимо не менее 108 наблюдений в каждой группе.
Тогда в Statistica такой путь:
Power Analysis and Interval Estimation -Sample Size Calculation ? Two Priportion, Paired Sample

А по-моему Statistica (как и все программы) использует априорный, а не апостериорный анализ мощности, т.е. отвечает на вопрос "А что будет если в исследовании получатся такие данные?", а не реально анализирует мощность уже законченного исследования. По крайней мере так в большинстве других систем (SAS, SPSS, Stata), а авторы Statistica мне не казались людьми, идущими в первых рядах адаптации новых методик. Там где-нибудь формулы есть? (хотя даже название Power Analysis -Two Proportions, z-test наводит на сомнения - это, похоже, худший вариант - нормальная аппроксимация биномиального распределения, т.е. дисперсия приравнивается p*(1-p) и далее, как количественный показатель), но не знаю...

Автор: DrgLena 30.10.2008 - 11:47

Поскольку анализ мощности в этой программе появился только с 7 версии, то хелпы очень подробные. Можно рассчитать мощность при заданных n1 и n2 или рассчитать необходимые размеры выборок при заданной мощности. По данному примеру, если выборки не связанные, при n1=n2=100, мощность 0,82 или при использовании поправки на непрерывность 0,77.

Автор: плав 30.10.2008 - 11:59

Цитата(DrgLena @ 30.10.2008 - 11:47) *
Поскольку анализ мощности в этой программе появился только с 7 версии, то хелпы очень подробные. Можно рассчитать мощность при заданных n1 и n2 или рассчитать необходимые размеры выборок при заданной мощности. По данному примеру, если выборки не связанные, при n1=n2=100, мощность 0,82 или при использовании поправки на непрерывность 0,77.

Не, анализ мощности был еще в 5 версии в модуле индустриальной статистики

Автор: DrgLena 30.10.2008 - 12:23

Да, тогда, я его просто не заметила. В индустриальной статистике я только строила диаграммы и графики выбросов при верификации количественных данных. А анализ мощности давно и удобно сделано в NCSS-PASS, выдается удобная табличка с различными сочетаниями мощности и размера выборки.

Автор: Парадокс 30.10.2008 - 20:36

Плав и Лена,

спасибо за оперативный ответ.
Моя ситуация , к сожалению, эксклюзивная - я планирую исследование. К сожалению - потому что это должно быть правилом, и с планирования работа должна начинаться. На практике ситуация другая - набираем материал, а потом думаем, что получено в итоге.

В моей работе несколько групп , получающих монотерапию разными препаратами, затем - второй этап: перемешиваем всех, кто не получил эффекта и делим пополам: монотерапия более мощным препаратом и он же в комбинации другим (предположительно усиливающим положительный эффект и предупреждающим побочные). Естественно, планирую пользоваться критерием хи-квадрат (макнемара на втором этапе). Группы будут сравниваться попарно (имеет ли смысл выбрать самый эффективный - множественные сравнения?). T-критерий все-таки не комильфо.

Российский подход таков - для препарата , результативность которого ожидается на уровне 90%, нужно менее 30 человек. В выборках аналогичного дизайна/при данном заболевании самое большое наблюдение 67 человек. Обычно 15-30. То есть, посмотри на товарисча, и делай примерно так же.

Выборка на другой препарат ( обеспечивающий 43% успешного лечения): можно проводить 1. сравнение с данными той же группы до лечения и 2. сравнивать с плацебо (не дай бог мне еще в двойное слепое перейти). На плацебо - эффект 24%. Те же самые люди не получили никакого результата за годы заболевания, проведенного без лечения. То есть если формулировать задачу "до и после лечения" у меня может быть выбор 43 vs 0 , или с контрольной группой 43 vs 24.

Вот инструкций по хи-квадрат в STATISTICA я не нашла. Кроме того, вроде бы есть ограничения, что ни одно из значений на может быть менее 5 (или нужна поправка йетса)? То есть в таблице сопряженности ниодно из значений не может быть менее 5.

Я, не ленясь, пробую варианты выборок в BIOSTAT (простенькая программа, но пока единственная реальная помощь в проверке необходимого объема наблюдений). В случае 43% эффективности достаточно было бы 90 наблюдений.

Итак, в чем я, возможно ошибаюсь?

ЗЫ спасибо за помощь smile.gif

Автор: Парадокс 30.10.2008 - 20:39

В моем распоряжении есть STATISTICA и BIOSTAT. Ну и, конечно, майкрософт офис (эксель) и версия STATISTICA 6.0

Автор: DoctorStat 30.10.2008 - 22:00

Представим, что Парадокса высадили на необитаемом острове и дали только калькулятор...
Итак, в наличии: две группы. Одну не лечили (контроль), там положительных исходов Рк=0,24. Другую лечили, там Рл=0,43. Нужно вычислить объем выборки N, чтобы уловить эффект лечения с вероятностью (мощностью, чувствительностью) веtа=0,80. Сделаем две оценки разности долей положительных исходов dP=Рл-Рк. Одну с помощью значимости alfa, другую с помощью мощности веtа.

ОЦЕНКА 1.
Нулевая гипотеза: доли в двух выборках одинаковы. Объединенная оценка доли равна:
Рср=(Рк+Рл)/2=(0,43+0,24)/2=0,34
Величина Z=dP1/S - подчиняется стандартному нормальному распределению, где
s - стандартное отклонение, S=sqtr[Pср(1-Рср)(1/N+1/N)]=0,67/sqrt(N)
При уровне значимости alfa=0,05 критическое значение Za=1,960. Ему соответствует разность долей: dP1=Za*S=1,960*0,67/sqrt(N)=1,31/sqrt(N)

ОЦЕНКА 2.
Фактическая разность долей равна: dP2=Рл-Рк=0,43-0,24=0,19
Величина Z=(dP1-dP2)/S - подчиняется стандартному нормальному распределению.
Чувствительность веtа=0,80. По таблице стандартного нормального распределения находим Zв, правее которого лежит 80% всех значений: Zв=-0,85. Ему соответствует dP1=dP2+Zв*S=0,19-0,85*0,67/sqrt(N)=0,19-0,57/sqrt(N)

Приравняем оценку 1 и 2 для разности долей:
1,31/sqrt(N)=0,19-0,57/sqrt(N)
Отсюда находим минимальный объем выборки пациентов в каждой группе N=36.

Автор: Парадокс 30.10.2008 - 22:24

smile.gif сорри за настойчивость .
Впечатляет кажущаяся простота.

Какой программой оптимально пользоваться для моих скромных целей расчета объема выборки?

Автор: плав 30.10.2008 - 22:39

Цитата(DoctorStat @ 30.10.2008 - 22:00) *
Представим, что Парадокса высадили на необитаемом острове и дали только калькулятор...
Итак, в наличии: две группы. Одну не лечили (контроль), там положительных исходов Рк=0,24. Другую лечили, там Рл=0,43. Нужно вычислить объем выборки N, чтобы уловить эффект лечения с вероятностью (мощностью, чувствительностью) веtа=0,80. Сделаем две оценки разности долей положительных исходов dP=Рл-Рк. Одну с помощью значимости alfa, другую с помощью мощности веtа.

ОЦЕНКА 1.
Нулевая гипотеза: доли в двух выборках одинаковы. Объединенная оценка доли равна:
Рср=(Рк+Рл)/2=(0,43+0,24)/2=0,34
Величина Z=dP1/S - подчиняется стандартному нормальному распределению, где
s - стандартное отклонение, S=sqtr[Pср(1-Рср)(1/N+1/N)]=0,67/sqrt(N)
При уровне значимости alfa=0,05 критическое значение Za=1,960. Ему соответствует разность долей: dP1=Za*S=1,960*0,67/sqrt(N)=1,31/sqrt(N)

ОЦЕНКА 2.
Фактическая разность долей равна: dP2=Рл-Рк=0,43-0,24=0,19
Величина Z=(dP1-dP2)/S - подчиняется стандартному нормальному распределению.
Чувствительность веtа=0,80. По таблице стандартного нормального распределения находим Zв, правее которого лежит 80% всех значений: Zв=-0,85. Ему соответствует dP1=dP2+Zв*S=0,19-0,85*0,67/sqrt(N)=0,19-0,57/sqrt(N)

Приравняем оценку 1 и 2 для разности долей:
1,31/sqrt(N)=0,19-0,57/sqrt(N)
Отсюда находим минимальный объем выборки пациентов в каждой группе N=36.


Проверьте расчеты, в них что-то не так. Существует формула для оценки (с помощью того же биномиального распределния) количества лиц, необходимых для участия в исследовании при заданной мощности исследования:
2*(Za+Zb)^2/d^2, где d - стандартизированный размер эффекта.
В данном случае (доли) он будет равен (р2-р1)/sqrt[p*(1-p)].
Соответственно: (Za+Zb)^2=(1.96+0.84)^2=7.8; d^2=(0.43-0.24)^2/[0.34*(1-0.34)]=0.1609
Количество людей: 2*7,8/0,1609=97 человек в группе
Мои расчеты подтверждаются тем, что:
- система SAS дает 96 человек в группе
- Stata дает 106 человек в группе

В принципе я не очень понимаю Парадокса - я уже несколькими заметками выше описал потребности в количестве пациентов для этого исследования

Добавление. Действительно в обсуждении DoctorStat закралась ошибка - она связана с тем, что при планировании исследования мы должны найти неизвестную нам границу, которая обеспечит одновременно 5% вероятность ошибки I типа и 20% вероятность ошибки второго типа (там этого нет, если использовать приведенную выше логику - что значение границы равно наблюдаемому, то мощность всегда будет 0,5)
Итак, рассуждения приводящие к формуле Cohen, которую я цитировал выше:
H0: (x-p1)/SE=Za
Ha: (p2-x)/SE=Zb
Решаем эту систему уравнений:
x-p1=Za*SE
p2-x=Zb*SE
=>
p2-p1=SE(Za+Zb)
и
(p2-p1)^2=SE^2*(Za+Zb)^2

Мы знаем, что
SE^2=p*(1-p)/n
Отсюда
(p1-p2)^2=p*(1-p)(Za+Zb)^2/n
И тогда
n=(Za+Zb)^2*[p*(1-p)]/(p1-p2)^2

Автор: плав 30.10.2008 - 22:51

Цитата(Парадокс @ 30.10.2008 - 20:36) *
Плав и Лена,

спасибо за оперативный ответ.
Моя ситуация , к сожалению, эксклюзивная - я планирую исследование. К сожалению - потому что это должно быть правилом, и с планирования работа должна начинаться. На практике ситуация другая - набираем материал, а потом думаем, что получено в итоге.

В моей работе несколько групп , получающих монотерапию разными препаратами, затем - второй этап: перемешиваем всех, кто не получил эффекта и делим пополам: монотерапия более мощным препаратом и он же в комбинации другим (предположительно усиливающим положительный эффект и предупреждающим побочные). Естественно, планирую пользоваться критерием хи-квадрат (макнемара на втором этапе). Группы будут сравниваться попарно (имеет ли смысл выбрать самый эффективный - множественные сравнения?). T-критерий все-таки не комильфо.

Российский подход таков - для препарата , результативность которого ожидается на уровне 90%, нужно менее 30 человек. В выборках аналогичного дизайна/при данном заболевании самое большое наблюдение 67 человек. Обычно 15-30. То есть, посмотри на товарисча, и делай примерно так же.

Выборка на другой препарат ( обеспечивающий 43% успешного лечения): можно проводить 1. сравнение с данными той же группы до лечения и 2. сравнивать с плацебо (не дай бог мне еще в двойное слепое перейти). На плацебо - эффект 24%. Те же самые люди не получили никакого результата за годы заболевания, проведенного без лечения. То есть если формулировать задачу "до и после лечения" у меня может быть выбор 43 vs 0 , или с контрольной группой 43 vs 24.

Вот инструкций по хи-квадрат в STATISTICA я не нашла. Кроме того, вроде бы есть ограничения, что ни одно из значений на может быть менее 5 (или нужна поправка йетса)? То есть в таблице сопряженности ниодно из значений не может быть менее 5.

Я, не ленясь, пробую варианты выборок в BIOSTAT (простенькая программа, но пока единственная реальная помощь в проверке необходимого объема наблюдений). В случае 43% эффективности достаточно было бы 90 наблюдений.

Итак, в чем я, возможно ошибаюсь?

ЗЫ спасибо за помощь smile.gif


1) Ситуация не эксклюзивная. У нас в учреждении теперь это требуется от всех аспирантов. Нормальные исследования (т.е. те, которые оказывают воздействие на рынок, а не диссертационные) уже давно планируются
2) Надо прочитать книгу по статистике. Вам, похоже, очень нравится критерий МакНемара, но реально использовать его Вам не удастся. Тот дизайн, который до-после включает в себя, как минимум, три этапа (это перекрестный) двухпериодные дизайны без контроля не используются. Заявления типа "Т-критерий не комильфо" демонстрируют серьезное незнание ситуации (Т-критерий для количественных показателей - наиболее мощный, для качественных его просто нет). Аппроксимация Т-распределением и Т-критерий вещи разные.
3) Читайте инструкции. Скорее всего, достаточно (по BIOSTAT) не 90 наблюдений, а по 90 в группе (т.е. 180), что совпадает со всеми приведенными рассчетами. Хотите от обратного - пожалуйста: если Вы возьмете 90 человек всего (45 в группе)мощность Вашего исследования составит 48%, т.е. более, чем с 50% вероятностью если даже препарат работает, Вы получите р>0,05.



Автор: DrgLena 30.10.2008 - 23:42

Цель четко не сформулирована, но методы статистики перечисляются и даже Т-критерий упоминается.
Я поняла так, что Парадокс планирует провести исследование по оценке второго более мощного препарата. Во первых, по сравнению с плацебо, при этом известно из предварительных данных, что он эффективен в 43% случаев, тогда как плацебо ? в 24%. Чтобы подтвердить различия на 5% уровне значимости, как было уже показано, для высокой мощности вам необходимо не менее 138 наблюдений в каждой группе, а для мощности 0,80 достаточно по 96 наблюдений. Вот если бы эффективность действительно была бы 90%, а при плацебо 24%, то хватило бы и 10 больных в группах.
А во вторых есть желание доказать эффективность препарата в одной и той же группе, при условии, что без лечения улучшения нет ни у одного больного, а при лечении у 43%. Различия доказали используя критерий Мак-Немара. При этом, высокая мощность (0,90) достигается уже при n1=n2=16 больных.
Так что российский подход, о котором пишет Парадокс, в случае высокого различия в эффекте вполне может подойти. Вот только рандомизация на малом числе объектов может не обеспечить однородность групп сравнения.

Автор: DrgLena 31.10.2008 - 00:04

По рассматриваемому примеру, при заданной мощности 0,80, n1=n2=96, а используя поправку на непрерывность n1=n2=106, в Statistica 7,0 все это можно сделать и хелпы хорошие.

Автор: плав 31.10.2008 - 00:14

Цитата(DrgLena @ 30.10.2008 - 23:42) *
Цель четко не сформулирована, но методы статистики перечисляются и даже Т-критерий упоминается.
Я поняла так, что Парадокс планирует провести исследование по оценке второго более мощного препарата. Во первых, по сравнению с плацебо, при этом известно из предварительных данных, что он эффективен в 43% случаев, тогда как плацебо ? в 24%. Чтобы подтвердить различия на 5% уровне значимости, как было уже показано, для высокой мощности вам необходимо не менее 138 наблюдений в каждой группе, а для мощности 0,80 достаточно по 96 наблюдений. Вот если бы эффективность действительно была бы 90%, а при плацебо 24%, то хватило бы и 10 больных в группах.
А во вторых есть желание доказать эффективность препарата в одной и той же группе, при условии, что без лечения улучшения нет ни у одного больного, а при лечении у 43%. Различия доказали используя критерий Мак-Немара. При этом, высокая мощность (0,90) достигается уже при n1=n2=16 больных.
Так что российский подход, о котором пишет Парадокс, в случае высокого различия в эффекте вполне может подойти. Вот только рандомизация на малом числе объектов может не обеспечить однородность групп сравнения.

Я чего-то не понял. Если при плацебо эффективность 24%, как можно предполагать, что без лечения улучшения нет?
Далее, а как рассчитывается количество необходимых пациентов при использовании критерия МакНемара в данном случае? Я вообще не очень понимаю, при чем тут МакНемар. Тест МакНемара предполагает наличие пар наблюдений (ок, один и тот же пациент) и следующие возможности в парах
+-
-+
++
--
В данном же случае варианты -+ и -- не рассматриваются по определнию, а -+ это дискордантная пара необходимая для тестирования.
Соответственно, тест МакНемара просто не применим. Максимум, что можно использовать - обычный биномиальный тест знаков - два исхода - улучшилось/ухудшилось.

Автор: nokh 31.10.2008 - 02:21

Цитата(Парадокс @ 31.10.2008 - 01:24) *
Какой программой оптимально пользоваться для моих скромных целей расчета объема выборки?

http://statpages.org/proppowr.html При 0,43 и 0,24, альфа=0,05 и бета=0,20 дает по 106 в группах.

Автор: DrgLena 31.10.2008 - 11:21

Ну плацебо на то и плацебо, что его эффект имеется по сравнению с отсутствием лечения, пилюльку то больной получает.
Вот ваши объяснения по М-Н я не поняла.
Значение критерия МакНемара рассчитывается по формуле:
хи2 = (|B-C|-1)^2/(B+C).

Т.е. интересует только разница по диагонали, и даже если в=0, расчет критерия возможен.
Если можно подробней про М-Н, поскольку мощность исследования при этом очень важна, т.к. в формулу вообще не входит а и d, т.е. объем выборки не важен.
А если бы до лечения жалобы были не у всех больных, то тогда критерий применим?
Программа Statistica предлагает анализ мощности и расчет размера выборок, в том числе и при использовании критерия М-Н и естественно они не совпадают, с расчетами для не связанных выборок.


Автор: Игорь 31.10.2008 - 13:30

Глава 4 книги Fleiss J.L., Levin B., Paik M.C. Statistical methods for rates and proportions - Wiley, 2003.

Автор: DrgLena 31.10.2008 - 14:20

К сожалению, под рукой только Петри "Наглядная статистики в медицине" и русский вариант в переводе Леонова и английский вариант. Там написано, что две группы могут быть связанными или зависимыми,т.е. каждый пациент может быть обследован в двух различных состояниях, условиях. Каждый пациент классифицируется согласно тому, имеется ли определенное свойство в обоих сотсояниях, только в одном состоянии или ни в одном из них. (табл 24.2). Или The two groups are related or dependent, e.g. each individual
may be measured in two different circumstances. Every individual is classified according to whether the characteristic is present in both circumstances, one circumstance only, or in neither (Table 24.2).
Я понимаю, что у меня где то логическое заблуждение, но и у Ребровой тоже не внятно написано про этот критерий, поэтому и не доходит.

Автор: DrgLena 31.10.2008 - 14:26

Мак-Немар отвлек от темы, про размер выборки, можно ручками посчитать, M.Bland предлагает для двух долей:
=(1,96+0,84)^2*(0,43*(1-0,43)+(0,24*(1-0,24)))/0,19^2=93
1,96 для альфа =0,05
0,84 для мощности 80%

Автор: плав 31.10.2008 - 17:47

Цитата(DrgLena @ 31.10.2008 - 14:26) *
Мак-Немар отвлек от темы, про размер выборки, можно ручками посчитать, M.Bland предлагает для двух долей:
=(1,96+0,84)^2*(0,43*(1-0,43)+(0,24*(1-0,24)))/0,19^2=93
1,96 для альфа =0,05
0,84 для мощности 80%

Так это та формула, которую я выше писал и даже объяснил, как она получается (оригинально, по-моему, это работа Cohen).
Что касается Мак-Немара там проблема в том, что критерий МакНемара предполагает наличие двух независимых исходов. Поэтому чаще всего его используют для парных дизайнов с разными людьми (например, подобрали пары - один с новым лечением, другой - со старым, а затем смотрим, у как наступало ухудшение). Варианты:
++ у обоих улучшение (не интересно)
-- у обоих ухудшение (не интересно)
+- улучшения у леченного новым, ухудшение у леченного старым (в пользу Ha, то, что в формулах обозначается b)
-+ улучшение у леченного старым, ухудшение у леченного новым (в пользу Ho, то, что в формулах обозначается c)
Соответственно, если мы берем одного человека и состояние до-после и исход есть-нет, то что мы имеем
-+ до было плохо, стало хорошо
-- до было плохо и осталось плохо
Других вариантов просто - по дизайну - быть не может (соответственно, с нет, величины для формулы, нет).
Вот я и спрашиваю, как в этой ситуации применить МакНемара. Вот если бы популяция состояла из пациентов с разной степенью тяжести, тогда можно и у одного человека:
-- было плохо и осталось плохо
++ было хорошо и осталось хорошо
+- было хорошо, стало плохо
-+ было плохо стало хорошо
А то, что в этой ситуации можно применять другие подходы - это да.

Автор: DrgLena 31.10.2008 - 19:24

Очевидно, нам попадаются разные примеры использования критерия М-Н.
Мне все же ближе то, что связанные выборки - это одни и те же больные, например до и после воздействия. Часто, при описании этого критерия примеры приводят по диагностике двумя методами, но у одних и тех же больных. Поскольку табличку я пришпилить не могу (не получается), поясню примерчиком. Есть группа из 20 больных, из которых до лечения жалоба была у 18, а у 2 не было. После лечения, в этой же группе больных жалоба сохранялась у 11, а 9 больных жалоб не предъявляли (но у 2-х и не было). Тогда таблица для расчета критерия М-Н будет a=2, b=7, c=0, d=11. Интересующая разница b-с=7 и величина критерия=5,14 р=0,023. Это верно? Я проверила этот ручной расчет с работой программы. В одной переменной проставила 2 "0" и 18 "1", а в другой переменной 9 "0" и 11 "1" и получила таке же значение критерия и р по b-c.

Автор: плав 31.10.2008 - 20:44

В том случае, если жалобы могли появиться - тогда да, МакНемара использовать можно:
++ были жалобы и сохранились
+- были жалобы и исчезли
-+ не было жалоб и появились
-- не было жалоб и не появилось
Но вот если один вариант не возможен (появление жалоб невозможно, если их не было вначале), то МакНемаром пользоваться нельзя. Он обязательно требует возможности в рамках эксперимента всех четырех типов отклика (рассчитывается из допущения такой возможности).

Автор: DrgLena 31.10.2008 - 20:47

Спасибо!!

Но все же, я не смогла найти нужную информацию, возможно, она в ссылке Игоря, не доступной мне. Нигде не написано, что не может быть нулевого значения в клетке b или c, критерий с нулевым значением считается во всех программах и калькуляторах в сети, не рассчитывается, естественно только соответствующее значение OR.

http://www.graphpad.com/quickcalcs/McNemar1.cfm
http://faculty.vassar.edu/lowry/propcorr.html
http://ourworld.compuserve.com/homepages/jsuebersax/mcnemar.htm

Только в последней ссылке есть замечание, относительно величины b и c.
Если можно дайте ссылку на ограничение при нулевом значении одной из величин, поскольку у нас часто используют этот критерий при сравнении диагностики новых методов с «золотым стандартом», при котором все случаи диагностируются.

Автор: Парадокс 1.11.2008 - 16:50

Доктор Стат, Лена, nokh, Плав и Игорь - спасибо за помощь.

Благодаря вашей дискуссии мне проще вникнуть в детали предстоящей работы. В принципе, порядок формирования групп (примерное число наблюдений) при подсчетах различными методами не слишком отличается.
Если не ошибаюсь, для медицинских исследований, t-критерий не подходит, нужны непараметрические методы. Если я планирую перемешивать пациентов на втором этапе - критерий Мак-Немара сам собой отпадает, предстоит пользоваться хи-квадрат. Полагаю также, разумно будет воспользоваться таблицами для рандомизации.

Автор: nokh 2.11.2008 - 13:11

Цитата(Парадокс @ 1.11.2008 - 19:50) *
Если не ошибаюсь, для медицинских исследований, t-критерий не подходит, нужны непараметрические методы.

Ошибаетесь. Любой статистический критерий имеет ограничения и всегда стоит непростой вопрос соответствия матемамической модели реальным данным. Просто неправильное использование t-критерия перешло всякие границы разумного, а сейчас этот процесс вплотную подбирается и к классическим непараметрическим методам. Если признак в генеральной совокупности распределен нормально, а выбока случайная - нет ничего лучше t-критерия Стьюдента, т.к. это самый мощный критерий. Это уже многократно звучало на форуме. Для его непараметрического аналога - критерия Манна-Уитни - при заданной мощности потребуется больше наблюдений. Но и здесь есть ограничения - распределения должны принадлежать к одному типу, а зачастую в контроле и опыте, у здоровых и больных и т.д. мы имеем симметричное и асимметричное распределения или разную степень асимметрии.


Автор: Игорь 2.11.2008 - 19:06

Цитата(DrgLena @ 31.10.2008 - 20:47) *
Но все же, я не смогла найти нужную информацию, возможно, она в ссылке Игоря, не доступной мне.

В Интернете есть совершенно невинный сайт http://ebdb.ru. Никаких авторских прав данный сайт сам не нарушает. Боже упаси! smile.gif
А Мак-Немар (как аппроксимация хи-квадрат, так и точная версия) есть в модуле "Точные критерии" программы AtteStat.

Автор: DrgLena 3.11.2008 - 16:36

Игорь! это жестоко. Вы меня отослали к книге с весьма привлекательным для меня названием Fleiss J.L., Levin B., Paik M.C. Statistical methods for rates and proportions - Wiley, 2003.
Вот только жаль, что на сайте, который вы привели, есть только линк на gigapedia.org, а оттуда на amazon, где цена 101$. Но тем не менее, ночной поиск дал результат. Книга у меня есть. И если у вас тоже 3-е издание, то и вы найдете ответ на мой вопрос, он на стр. 379, вернее там табличка с нулевым значением в одной из клеток.
Спасибо вам большое за ссылку, хотелось именно самой разобраться.

Автор: nokh 3.11.2008 - 19:27

Цитата(DrgLena @ 3.11.2008 - 19:36) *
Вот только жаль, что на сайте, который вы привели, есть только линк на gigapedia.org, а оттуда на amazon, где цена 101$...

А мне ресурс очень понравился, вот уж спасибо Игорю так спасибо! Весь день под впечатлением и до сих пор не отошел rotate.gif На гигипедии нужно смотреть не комменты, а линки! http://gigapedia.org/browse.category:64.html
Кстати более раннее издание книги Флейса есть на русском (в библиотеке брал): Флейс Дж. Статистические методы для изучения таблиц долей и пропорций (Пер. с англ.). Москва: Финансы и статистика, 1989, 319 с.

Автор: плав 3.11.2008 - 20:40

Цитата(DrgLena @ 3.11.2008 - 16:36) *
Игорь! это жестоко. Вы меня отослали к книге с весьма привлекательным для меня названием Fleiss J.L., Levin B., Paik M.C. Statistical methods for rates and proportions - Wiley, 2003.
Вот только жаль, что на сайте, который вы привели, есть только линк на gigapedia.org, а оттуда на amazon, где цена 101$. Но тем не менее, ночной поиск дал результат. Книга у меня есть. И если у вас тоже 3-е издание, то и вы найдете ответ на мой вопрос, он на стр. 379, вернее там табличка с нулевым значением в одной из клеток.
Спасибо вам большое за ссылку, хотелось именно самой разобраться.

Проблема не с наличием нуля в ячейке с, а принципиальной невозможностью иметь пары типа с. Если пара типа с принципиально возможна, т.е. могут быть первым значением пары 0 или 1 и вторым значением пары 0 и 1, т.е. все 4 типа пар принципиально существуют - тогда метод подходит. Если же нет, как когда берут больных и смотрят, что с ними происходит, то тогда метод не применим.

Автор: DrgLena 3.11.2008 - 22:10

"На гигипедии нужно смотреть не комменты, а линки! http://gigapedia.org/browse.category:64.html"
Линки и смотрела, они, конечно интересные, но дешевле на gigapedia нужная книга не становится, хотя я и зарегисрированный пользователь. Или там можно скачать бесплатно?

Автор: Игорь 3.11.2008 - 22:59

Цитата(DrgLena @ 3.11.2008 - 23:10) *
Или там можно скачать бесплатно?

smile.gif Вы сами ответили. Неужели же я стал бы давать ссылку на Амазон? Мыслится как - человек ознакомится с книгой и купит, если понравится. Или не купит. Кстати, действительно нужные (классику жанра) мне доводилось покупать. Русский Флейс у меня есть. Но он гораздо хуже 3-го английского издания.

Автор: DrgLena 3.11.2008 - 23:08

У указанной Игорем книге, в 13 главе, рассматривается критерий М-Н, причем подробно разбирается несколько ситуаций, где критерий применим. Последний пример, как раз описывает ту ситуацию, которая меня заинтересовала. Т.е. предполагается, что новое лечение может принести пльзу именно тем больным, которым не помогло стандартное лечение. При этом, естественно, число больных, которым не помогло ни новое ни стандартное лечение может быть равно "0". Этот нуль занимает свое место и в формуле для расчета s.e , которая используется для построения ДИ для разности долей и для оценки веротяности успеха у больных с неэффективным стандартным лечением.

Автор: плав 4.11.2008 - 00:45

Цитата(DrgLena @ 3.11.2008 - 23:08) *
У указанной Игорем книге, в 13 главе, рассматривается критерий М-Н, причем подробно разбирается несколько ситуаций, где критерий применим. Последний пример, как раз описывает ту ситуацию, которая меня заинтересовала. Т.е. предполагается, что новое лечение может принести пльзу именно тем больным, которым не помогло стандартное лечение. При этом, естественно, число больных, которым не помогло ни новое ни стандартное лечение может быть равно "0". Этот нуль занимает свое место и в формуле для расчета s.e , которая используется для построения ДИ для разности долей и для оценки веротяности успеха у больных с неэффективным стандартным лечением.

Похоже, то ли я что-то не понимаю, то ли мы чего-то не то обсуждаем. Естественно, можно МН сравнивать два лечения
++ стало лучше на новом и старом
+- стало лучше на новом, на старом нет (b)
-+ стало лучше на старом, на новом - нет (с)
-- не стало лучше ни на новом, ни на старом
Четыре теоретически возможных варианта. Какое в выборке значение этих частот - не важно. Важно, что теоретически оно может быть не равным нулю. А в примере выше двух методов нет.Есть только один, т.е.
-+ помогло
-- не помогло
В такой ситуации МН не применим, хотя это - тоже парный дизайн.
А о чем Вы говорите?

Автор: DrgLena 4.11.2008 - 01:18

"Какое в выборке значение этих частот - не важно."
Именно это, я и имела ввиду, т.е. что может быть и нулевое значение.

Автор: Па адокс 9.02.2012 - 14:59

ДОброго всем дня!

как рассчитать объем выборки для исследования случай-контроль (сравниваются клинические проявления у больных и в популяции). Скажем, больных 4% населения, но отдельные симптомы заболевания есть и у 96% здоровых ...

Автор: Па адокс 9.02.2012 - 15:18

у 68% здоровых нет никаких симптомов

симптом 1 есть у 13% здоровых и 99% больных
симптом 2 есть у 9% здоровых и 75% больных
симптом 3 есть у 6% здоровых и 60% больных


Вообщем, мне надо рассчитать объем выборки для сравнения чувствительности и специфичности клинических и лабораторных признаков больных и здоровых...

Автор: Па адокс 10.02.2012 - 17:36

неинтересный вопрос? или нет мыслей?

Автор: DrgLena 10.02.2012 - 20:28

То, как вы задали свой вопрос свидетельствует о том, что вы ничего не прочитали по этой теме даже на этом форуме.
Почитайте хоть что то на тему Power Analysis, тогда вы поймете, что объем выборки рассчитывают при планировании исследования, исходя из своего выбора уровня ошибки 1 и 2 рода и желаемого различия в группах.
Терминология чувствительность и специфичность относится к диагностическим тестам. Если какие либо два симптома вы рассматриваете, как диагностические тесты, то можно поставить себе задачу доказать что один из них будет обладать большей чувствительностью чем другой. Например, 99% будет больше, чем 75% если в группе будет не меньше 39 больных (односторонняя гипотеза, что достаточно, если есть пилотные исследования, или 50 наблюдений для проверки двухсторонней гипотезы), при этом желаемая статистическая мощность будет не менее 0,80, а уровень альфа ошибки не более 0,05.
А если вы будете сравнивать 75% и 60%, то для доказательства статистически значимости различий в 15% нужно как минимум 106 наблюдений.
А специфичность анализируйте в группе здоровых аналогично, сравнивая доли в связанных выборках.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)