Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V  < 1 2 3 4 >  
Добавить ответ в эту темуОткрыть тему
> Помогите рассчитать объем выборки!
плав
сообщение 29.10.2008 - 22:25
Сообщение #16





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Парадокс @ 29.10.2008 - 21:15) *
Здравствуйте!

нужно рассчитать объем выборки для оценки эффективности лечения. при назначении препарата А - эффективность 43%, при отсутствии лечения - у 24% также позитивный эффект. Учитывая, что признаки качественные - пользуемся критерием хи-квадрат макнемара. Допускается уровень ошибки I рода (a) = .05.

Ели не ошибаюсь, то в 6 версии программы Статистика есть расчет мощности и объема выборки. Как ею пользоваться для критерия хи-квадрат? (у меня английская версия)

Спасибо!

А у Вас что, одни и те же лица будут получать два препарата? Просто критерий МакНемара - это критерий для связанных, парных наблюдений. То, что Вы описываете, скорее задача для обычного критерия Хи2 - критерия Пирсона.
Далее. Вы не указали нужную Вам мощность исследования. В каком проценте случаев Вы согласны пропустить имеющийся положительный эффект? Например, если Вы согласны рискнуть и не получить положительного результата в 20% случаев (или иметь 20% вероятность пропустить реально существующую эффективность препарата) Вам надо включить в исследование 212 человек, по 106 человек в группе вмешательства и контроля (при использовании критерия хи2 Пирсона - 192 человека всего, критерия Фишера - 212, хи2 максимального правдоподобия - 192). Если же хотите повысить мощность до 90% (т.е. вероятность пропустить только 10%) - то 276 человек (по 138 в группе). Это, правда, рассчитано на основе предположения использования нормальной аппроксимации (что при таком размере выборки делать можно). Если же хотите именно хи2, то рекомендую либо найти книгу Advanced Log-Linear Models Using SAS - там это описано или воспользуйтесь процедурой power в SAS. А у Statistica все описано в help'е
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 30.10.2008 - 00:03
Сообщение #17





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Если выборки не связанные:
Power Analysis -Two Proportions, z-test.
Но нужно знать размер выборок, чтобы посчитать мощность, если исследование закончено. Для вашего примера, если n1=n2=100, то power=0,817. Или задать мощность, например 0,90 и получить необходимый размер выборок. При равных выборках n1=n2=138, если n1=100, то n2=172. Программа строит также график зависимости мощности от размера n2, если n1 фиксировано. Если выборки не велики, есть возможность использовать поправку на непрерывность.
Если все же выборки связанные и использовали хи-кв. Мак-Немара, то интересует разность эффекта, например, при приеме анальгина головная боль проходила в 43% случаев, а без лечения у этих же больных голова пройдет у 24%. В этом случае для 90% мощности необходимо не менее 108 наблюдений в каждой группе.
Тогда в Statistica такой путь:
Power Analysis and Interval Estimation -Sample Size Calculation ? Two Priportion, Paired Sample
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 30.10.2008 - 00:40
Сообщение #18





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 30.10.2008 - 00:03) *
Если выборки не связанные:
Power Analysis -Two Proportions, z-test.
Но нужно знать размер выборок, чтобы посчитать мощность, если исследование закончено. Для вашего примера, если n1=n2=100, то power=0,817. Или задать мощность, например 0,90 и получить необходимый размер выборок. При равных выборках n1=n2=138, если n1=100, то n2=172. Программа строит также график зависимости мощности от размера n2, если n1 фиксировано. Если выборки не велики, есть возможность использовать поправку на непрерывность.
Если все же выборки связанные и использовали хи-кв. Мак-Немара, то интересует разность эффекта, например, при приеме анальгина головная боль проходила в 43% случаев, а без лечения у этих же больных голова пройдет у 24%. В этом случае для 90% мощности необходимо не менее 108 наблюдений в каждой группе.
Тогда в Statistica такой путь:
Power Analysis and Interval Estimation -Sample Size Calculation ? Two Priportion, Paired Sample

А по-моему Statistica (как и все программы) использует априорный, а не апостериорный анализ мощности, т.е. отвечает на вопрос "А что будет если в исследовании получатся такие данные?", а не реально анализирует мощность уже законченного исследования. По крайней мере так в большинстве других систем (SAS, SPSS, Stata), а авторы Statistica мне не казались людьми, идущими в первых рядах адаптации новых методик. Там где-нибудь формулы есть? (хотя даже название Power Analysis -Two Proportions, z-test наводит на сомнения - это, похоже, худший вариант - нормальная аппроксимация биномиального распределения, т.е. дисперсия приравнивается p*(1-p) и далее, как количественный показатель), но не знаю...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 30.10.2008 - 11:47
Сообщение #19





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Поскольку анализ мощности в этой программе появился только с 7 версии, то хелпы очень подробные. Можно рассчитать мощность при заданных n1 и n2 или рассчитать необходимые размеры выборок при заданной мощности. По данному примеру, если выборки не связанные, при n1=n2=100, мощность 0,82 или при использовании поправки на непрерывность 0,77.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 30.10.2008 - 11:59
Сообщение #20





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 30.10.2008 - 11:47) *
Поскольку анализ мощности в этой программе появился только с 7 версии, то хелпы очень подробные. Можно рассчитать мощность при заданных n1 и n2 или рассчитать необходимые размеры выборок при заданной мощности. По данному примеру, если выборки не связанные, при n1=n2=100, мощность 0,82 или при использовании поправки на непрерывность 0,77.

Не, анализ мощности был еще в 5 версии в модуле индустриальной статистики
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 30.10.2008 - 12:23
Сообщение #21





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Да, тогда, я его просто не заметила. В индустриальной статистике я только строила диаграммы и графики выбросов при верификации количественных данных. А анализ мощности давно и удобно сделано в NCSS-PASS, выдается удобная табличка с различными сочетаниями мощности и размера выборки.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Парадокс
сообщение 30.10.2008 - 20:36
Сообщение #22





Группа: Пользователи
Сообщений: 6
Регистрация: 29.10.2008
Пользователь №: 5463



Плав и Лена,

спасибо за оперативный ответ.
Моя ситуация , к сожалению, эксклюзивная - я планирую исследование. К сожалению - потому что это должно быть правилом, и с планирования работа должна начинаться. На практике ситуация другая - набираем материал, а потом думаем, что получено в итоге.

В моей работе несколько групп , получающих монотерапию разными препаратами, затем - второй этап: перемешиваем всех, кто не получил эффекта и делим пополам: монотерапия более мощным препаратом и он же в комбинации другим (предположительно усиливающим положительный эффект и предупреждающим побочные). Естественно, планирую пользоваться критерием хи-квадрат (макнемара на втором этапе). Группы будут сравниваться попарно (имеет ли смысл выбрать самый эффективный - множественные сравнения?). T-критерий все-таки не комильфо.

Российский подход таков - для препарата , результативность которого ожидается на уровне 90%, нужно менее 30 человек. В выборках аналогичного дизайна/при данном заболевании самое большое наблюдение 67 человек. Обычно 15-30. То есть, посмотри на товарисча, и делай примерно так же.

Выборка на другой препарат ( обеспечивающий 43% успешного лечения): можно проводить 1. сравнение с данными той же группы до лечения и 2. сравнивать с плацебо (не дай бог мне еще в двойное слепое перейти). На плацебо - эффект 24%. Те же самые люди не получили никакого результата за годы заболевания, проведенного без лечения. То есть если формулировать задачу "до и после лечения" у меня может быть выбор 43 vs 0 , или с контрольной группой 43 vs 24.

Вот инструкций по хи-квадрат в STATISTICA я не нашла. Кроме того, вроде бы есть ограничения, что ни одно из значений на может быть менее 5 (или нужна поправка йетса)? То есть в таблице сопряженности ниодно из значений не может быть менее 5.

Я, не ленясь, пробую варианты выборок в BIOSTAT (простенькая программа, но пока единственная реальная помощь в проверке необходимого объема наблюдений). В случае 43% эффективности достаточно было бы 90 наблюдений.

Итак, в чем я, возможно ошибаюсь?

ЗЫ спасибо за помощь smile.gif

Сообщение отредактировал Парадокс - 30.10.2008 - 20:37
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Парадокс
сообщение 30.10.2008 - 20:39
Сообщение #23





Группа: Пользователи
Сообщений: 6
Регистрация: 29.10.2008
Пользователь №: 5463



В моем распоряжении есть STATISTICA и BIOSTAT. Ну и, конечно, майкрософт офис (эксель) и версия STATISTICA 6.0
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 30.10.2008 - 22:00
Сообщение #24





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Представим, что Парадокса высадили на необитаемом острове и дали только калькулятор...
Итак, в наличии: две группы. Одну не лечили (контроль), там положительных исходов Рк=0,24. Другую лечили, там Рл=0,43. Нужно вычислить объем выборки N, чтобы уловить эффект лечения с вероятностью (мощностью, чувствительностью) веtа=0,80. Сделаем две оценки разности долей положительных исходов dP=Рл-Рк. Одну с помощью значимости alfa, другую с помощью мощности веtа.

ОЦЕНКА 1.
Нулевая гипотеза: доли в двух выборках одинаковы. Объединенная оценка доли равна:
Рср=(Рк+Рл)/2=(0,43+0,24)/2=0,34
Величина Z=dP1/S - подчиняется стандартному нормальному распределению, где
s - стандартное отклонение, S=sqtr[Pср(1-Рср)(1/N+1/N)]=0,67/sqrt(N)
При уровне значимости alfa=0,05 критическое значение Za=1,960. Ему соответствует разность долей: dP1=Za*S=1,960*0,67/sqrt(N)=1,31/sqrt(N)

ОЦЕНКА 2.
Фактическая разность долей равна: dP2=Рл-Рк=0,43-0,24=0,19
Величина Z=(dP1-dP2)/S - подчиняется стандартному нормальному распределению.
Чувствительность веtа=0,80. По таблице стандартного нормального распределения находим Zв, правее которого лежит 80% всех значений: Zв=-0,85. Ему соответствует dP1=dP2+Zв*S=0,19-0,85*0,67/sqrt(N)=0,19-0,57/sqrt(N)

Приравняем оценку 1 и 2 для разности долей:
1,31/sqrt(N)=0,19-0,57/sqrt(N)
Отсюда находим минимальный объем выборки пациентов в каждой группе N=36.

Сообщение отредактировал DoctorStat - 30.10.2008 - 22:02


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Парадокс
сообщение 30.10.2008 - 22:24
Сообщение #25





Группа: Пользователи
Сообщений: 6
Регистрация: 29.10.2008
Пользователь №: 5463



smile.gif сорри за настойчивость .
Впечатляет кажущаяся простота.

Какой программой оптимально пользоваться для моих скромных целей расчета объема выборки?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 30.10.2008 - 22:39
Сообщение #26





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DoctorStat @ 30.10.2008 - 22:00) *
Представим, что Парадокса высадили на необитаемом острове и дали только калькулятор...
Итак, в наличии: две группы. Одну не лечили (контроль), там положительных исходов Рк=0,24. Другую лечили, там Рл=0,43. Нужно вычислить объем выборки N, чтобы уловить эффект лечения с вероятностью (мощностью, чувствительностью) веtа=0,80. Сделаем две оценки разности долей положительных исходов dP=Рл-Рк. Одну с помощью значимости alfa, другую с помощью мощности веtа.

ОЦЕНКА 1.
Нулевая гипотеза: доли в двух выборках одинаковы. Объединенная оценка доли равна:
Рср=(Рк+Рл)/2=(0,43+0,24)/2=0,34
Величина Z=dP1/S - подчиняется стандартному нормальному распределению, где
s - стандартное отклонение, S=sqtr[Pср(1-Рср)(1/N+1/N)]=0,67/sqrt(N)
При уровне значимости alfa=0,05 критическое значение Za=1,960. Ему соответствует разность долей: dP1=Za*S=1,960*0,67/sqrt(N)=1,31/sqrt(N)

ОЦЕНКА 2.
Фактическая разность долей равна: dP2=Рл-Рк=0,43-0,24=0,19
Величина Z=(dP1-dP2)/S - подчиняется стандартному нормальному распределению.
Чувствительность веtа=0,80. По таблице стандартного нормального распределения находим Zв, правее которого лежит 80% всех значений: Zв=-0,85. Ему соответствует dP1=dP2+Zв*S=0,19-0,85*0,67/sqrt(N)=0,19-0,57/sqrt(N)

Приравняем оценку 1 и 2 для разности долей:
1,31/sqrt(N)=0,19-0,57/sqrt(N)
Отсюда находим минимальный объем выборки пациентов в каждой группе N=36.


Проверьте расчеты, в них что-то не так. Существует формула для оценки (с помощью того же биномиального распределния) количества лиц, необходимых для участия в исследовании при заданной мощности исследования:
2*(Za+Zb)^2/d^2, где d - стандартизированный размер эффекта.
В данном случае (доли) он будет равен (р2-р1)/sqrt[p*(1-p)].
Соответственно: (Za+Zb)^2=(1.96+0.84)^2=7.8; d^2=(0.43-0.24)^2/[0.34*(1-0.34)]=0.1609
Количество людей: 2*7,8/0,1609=97 человек в группе
Мои расчеты подтверждаются тем, что:
- система SAS дает 96 человек в группе
- Stata дает 106 человек в группе

В принципе я не очень понимаю Парадокса - я уже несколькими заметками выше описал потребности в количестве пациентов для этого исследования

Добавление. Действительно в обсуждении DoctorStat закралась ошибка - она связана с тем, что при планировании исследования мы должны найти неизвестную нам границу, которая обеспечит одновременно 5% вероятность ошибки I типа и 20% вероятность ошибки второго типа (там этого нет, если использовать приведенную выше логику - что значение границы равно наблюдаемому, то мощность всегда будет 0,5)
Итак, рассуждения приводящие к формуле Cohen, которую я цитировал выше:
H0: (x-p1)/SE=Za
Ha: (p2-x)/SE=Zb
Решаем эту систему уравнений:
x-p1=Za*SE
p2-x=Zb*SE
=>
p2-p1=SE(Za+Zb)
и
(p2-p1)^2=SE^2*(Za+Zb)^2

Мы знаем, что
SE^2=p*(1-p)/n
Отсюда
(p1-p2)^2=p*(1-p)(Za+Zb)^2/n
И тогда
n=(Za+Zb)^2*[p*(1-p)]/(p1-p2)^2
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 30.10.2008 - 22:51
Сообщение #27





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Парадокс @ 30.10.2008 - 20:36) *
Плав и Лена,

спасибо за оперативный ответ.
Моя ситуация , к сожалению, эксклюзивная - я планирую исследование. К сожалению - потому что это должно быть правилом, и с планирования работа должна начинаться. На практике ситуация другая - набираем материал, а потом думаем, что получено в итоге.

В моей работе несколько групп , получающих монотерапию разными препаратами, затем - второй этап: перемешиваем всех, кто не получил эффекта и делим пополам: монотерапия более мощным препаратом и он же в комбинации другим (предположительно усиливающим положительный эффект и предупреждающим побочные). Естественно, планирую пользоваться критерием хи-квадрат (макнемара на втором этапе). Группы будут сравниваться попарно (имеет ли смысл выбрать самый эффективный - множественные сравнения?). T-критерий все-таки не комильфо.

Российский подход таков - для препарата , результативность которого ожидается на уровне 90%, нужно менее 30 человек. В выборках аналогичного дизайна/при данном заболевании самое большое наблюдение 67 человек. Обычно 15-30. То есть, посмотри на товарисча, и делай примерно так же.

Выборка на другой препарат ( обеспечивающий 43% успешного лечения): можно проводить 1. сравнение с данными той же группы до лечения и 2. сравнивать с плацебо (не дай бог мне еще в двойное слепое перейти). На плацебо - эффект 24%. Те же самые люди не получили никакого результата за годы заболевания, проведенного без лечения. То есть если формулировать задачу "до и после лечения" у меня может быть выбор 43 vs 0 , или с контрольной группой 43 vs 24.

Вот инструкций по хи-квадрат в STATISTICA я не нашла. Кроме того, вроде бы есть ограничения, что ни одно из значений на может быть менее 5 (или нужна поправка йетса)? То есть в таблице сопряженности ниодно из значений не может быть менее 5.

Я, не ленясь, пробую варианты выборок в BIOSTAT (простенькая программа, но пока единственная реальная помощь в проверке необходимого объема наблюдений). В случае 43% эффективности достаточно было бы 90 наблюдений.

Итак, в чем я, возможно ошибаюсь?

ЗЫ спасибо за помощь smile.gif


1) Ситуация не эксклюзивная. У нас в учреждении теперь это требуется от всех аспирантов. Нормальные исследования (т.е. те, которые оказывают воздействие на рынок, а не диссертационные) уже давно планируются
2) Надо прочитать книгу по статистике. Вам, похоже, очень нравится критерий МакНемара, но реально использовать его Вам не удастся. Тот дизайн, который до-после включает в себя, как минимум, три этапа (это перекрестный) двухпериодные дизайны без контроля не используются. Заявления типа "Т-критерий не комильфо" демонстрируют серьезное незнание ситуации (Т-критерий для количественных показателей - наиболее мощный, для качественных его просто нет). Аппроксимация Т-распределением и Т-критерий вещи разные.
3) Читайте инструкции. Скорее всего, достаточно (по BIOSTAT) не 90 наблюдений, а по 90 в группе (т.е. 180), что совпадает со всеми приведенными рассчетами. Хотите от обратного - пожалуйста: если Вы возьмете 90 человек всего (45 в группе)мощность Вашего исследования составит 48%, т.е. более, чем с 50% вероятностью если даже препарат работает, Вы получите р>0,05.


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 30.10.2008 - 23:42
Сообщение #28





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цель четко не сформулирована, но методы статистики перечисляются и даже Т-критерий упоминается.
Я поняла так, что Парадокс планирует провести исследование по оценке второго более мощного препарата. Во первых, по сравнению с плацебо, при этом известно из предварительных данных, что он эффективен в 43% случаев, тогда как плацебо ? в 24%. Чтобы подтвердить различия на 5% уровне значимости, как было уже показано, для высокой мощности вам необходимо не менее 138 наблюдений в каждой группе, а для мощности 0,80 достаточно по 96 наблюдений. Вот если бы эффективность действительно была бы 90%, а при плацебо 24%, то хватило бы и 10 больных в группах.
А во вторых есть желание доказать эффективность препарата в одной и той же группе, при условии, что без лечения улучшения нет ни у одного больного, а при лечении у 43%. Различия доказали используя критерий Мак-Немара. При этом, высокая мощность (0,90) достигается уже при n1=n2=16 больных.
Так что российский подход, о котором пишет Парадокс, в случае высокого различия в эффекте вполне может подойти. Вот только рандомизация на малом числе объектов может не обеспечить однородность групп сравнения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 31.10.2008 - 00:04
Сообщение #29





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



По рассматриваемому примеру, при заданной мощности 0,80, n1=n2=96, а используя поправку на непрерывность n1=n2=106, в Statistica 7,0 все это можно сделать и хелпы хорошие.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 31.10.2008 - 00:14
Сообщение #30





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 30.10.2008 - 23:42) *
Цель четко не сформулирована, но методы статистики перечисляются и даже Т-критерий упоминается.
Я поняла так, что Парадокс планирует провести исследование по оценке второго более мощного препарата. Во первых, по сравнению с плацебо, при этом известно из предварительных данных, что он эффективен в 43% случаев, тогда как плацебо ? в 24%. Чтобы подтвердить различия на 5% уровне значимости, как было уже показано, для высокой мощности вам необходимо не менее 138 наблюдений в каждой группе, а для мощности 0,80 достаточно по 96 наблюдений. Вот если бы эффективность действительно была бы 90%, а при плацебо 24%, то хватило бы и 10 больных в группах.
А во вторых есть желание доказать эффективность препарата в одной и той же группе, при условии, что без лечения улучшения нет ни у одного больного, а при лечении у 43%. Различия доказали используя критерий Мак-Немара. При этом, высокая мощность (0,90) достигается уже при n1=n2=16 больных.
Так что российский подход, о котором пишет Парадокс, в случае высокого различия в эффекте вполне может подойти. Вот только рандомизация на малом числе объектов может не обеспечить однородность групп сравнения.

Я чего-то не понял. Если при плацебо эффективность 24%, как можно предполагать, что без лечения улучшения нет?
Далее, а как рассчитывается количество необходимых пациентов при использовании критерия МакНемара в данном случае? Я вообще не очень понимаю, при чем тут МакНемар. Тест МакНемара предполагает наличие пар наблюдений (ок, один и тот же пациент) и следующие возможности в парах
+-
-+
++
--
В данном же случае варианты -+ и -- не рассматриваются по определнию, а -+ это дискордантная пара необходимая для тестирования.
Соответственно, тест МакНемара просто не применим. Максимум, что можно использовать - обычный биномиальный тест знаков - два исхода - улучшилось/ухудшилось.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V  < 1 2 3 4 >
Добавить ответ в эту темуОткрыть тему