Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Требования к размеру выборки, где почитать

Автор: psychologist 15.06.2014 - 15:36

Скажите, нет ли сводной таблицы, где написан метод и ограничения по выборке

Например, в частности меня интересует:
Сколько минимально должно быть в выборке людей, чтобы проведение Пирсоновского и Спирмановского корр. анализа было корректным.
Хи-квадрата

Некоторые данные у меня есть. Например дисперсионный анализ надо проводить на выборке не менее в 60 ч-к и чтобы в одной группе было не менее 5
Факторный анализ требует испытуемых в 3 раза больше чем переменных

Автор: TheThing 17.06.2014 - 11:05

Цитата(psychologist @ 15.06.2014 - 15:36) *
Скажите, нет ли сводной таблицы, где написан метод и ограничения по выборке

Например, в частности меня интересует:
Сколько минимально должно быть в выборке людей, чтобы проведение Пирсоновского и Спирмановского корр. анализа было корректным.
Хи-квадрата

Некоторые данные у меня есть. Например дисперсионный анализ надо проводить на выборке не менее в 60 ч-к и чтобы в одной группе было не менее 5
Факторный анализ требует испытуемых в 3 раза больше чем переменных


Какую величину эффекта Вы ожидаете обнаружить при проведении корреляции Пирсона или Спирмана? Если, например, 0.2 - то и минимальная выборка должна быть больше, чем если величину 0.5.

Если хотите конкретных значений, попробуйте это:
http://www.statstodo.com/SSizCorr_Pgm.php

Можно также скачать прогу GPower, там рассчитывается размер выборки для многих критериев (конечно при указании мощности, альфы и т.д.)
Можно построить стандартные ошибки для коэф. корреляции по формулам и увидеть, что приблизительно стандартная ошибка "скейлится" от размера выборки как 1/sqrt(n). Например, для коэф. корреляции 0.5, размер выборки 200 даст SE в 0.06, но для размера выборки в 50 - SE практически удвоится. Все зависит от Ваших предпочтений smile.gif

Автор: anserovtv 18.06.2014 - 09:55

Для определения минимального объема выборки (выборок) при указанном уровне мощности критерия (обычно 0,8) и др. или при вычислении мощности критерия для данного объема выборки (для данных объемов выборок) и др.
применяются и другие программы, не только G*Power.
Во многих известных статистических пакетах имеются расширения с такими функциями. Например, в SPSS - расширение SamplePower.
Можно скачать демоверсию.
Но в этих программах представлены не все статистические критерии.
Есть мнение, что в многомерных методах наблюдений должно быть больше чем переменных в 6-8 раз.
Существуют и другие подходы к оценке порога минимальности объема выборки.
Данная тема на форуме обсуждалась и совсем недавно. Поищите.

http://gruener.userpage.fu-berlin.de/Sample_Power_Product_Sheet.pdf
http://www.indiana.edu/~statmath/stat/all/power/power.pdf

Автор: малой 18.06.2014 - 17:58

Добрый день! Помогите пожалуйста делетанту )))
Не могу разобраться с методикой К.А. Отдельновой. Будет ли достигнута 95,0% точность исследования, если вся выборка 270 человек (основная группа, группа сравнения и контрольная - каждая по 90 человек)? И что значит t (на рисунке обвел кружком)?

 

Автор: anserovtv 18.06.2014 - 18:33

Такую таблицу вижу первый раз в жизни, скорее всего, это - устаревший подход. Почему в таблице не указана мощность критерия?
t - это статистика (эмпирическое или критическое значение критерия) в параметрическом t-критерии Стьюдента для сравнения средних двух (независимых) выборок.
В таблице указан, скорее всего, объем каждой выборки. У вас - 90. (Оцените категорию вашего исследования по первому столбцу таблицы).
Еще нужны и проверка нормальности в каждой вашей выборке и
проверка равенства дисперсий в каждом попарном сравнении.

Автор: малой 18.06.2014 - 18:37

Понятно. Спасибо. Посоветуйте пожалуйста современный учебник по основам статистики на русском языке.

Автор: anserovtv 18.06.2014 - 19:08

Учебников много. но в разных отраслях науки применяются разные.
Единого подхода нет и единой лексики тоже нет.
Я бы начал с учебников и задачников для студентов:
Гмурман В.Е. Учебник и задачник. (Некоторые вещи несколько устарели.)
Вентцель Е.С. Учебник и задачник. (Некоторые вещи несколько устарели.)
Вадзинский Р. Статистические вычисления в среде Excel.
Наследов А.Д. Матметоды...
Последние два читайте подробно!

В последнем есть и ручные вычисления и вычисления на компьютере.
Также на форуме есть много ссылок и на другие книги.
Полезно параллельно изучать и руководство пользователя (по методам!) для того пакета программ, который вы будете в дальнейшем использовать.

Автор: малой 18.06.2014 - 20:17

Спасибо

Автор: anserovtv 19.06.2014 - 11:26

Цитата(малой @ 18.06.2014 - 18:58) *
Будет ли достигнута 95,0% точность исследования, если вся выборка 270 человек (основная группа, группа сравнения и контрольная - каждая по 90 человек)?

Попытался понять эту таблицу и исследовать ее с помощью анализа мощности критерия.
Вот что у меня получилось:
1) В таблице совсем не учитывалась мощность критерия:
при точности 0.1 (последняя строка) и уровне значимости 0,05 (т. е. P=0,95) при указанном объеме выборок (400) мощность критерия всего 0,5;
при точности 0.1 (последняя строка) и уровне значимости 0,01 (т. е. P=0,99) при указанном объеме выборок (900) мощность критерия всего 0,4.
Точность в таблице - это, скорее всего, стандартизованная разность средних:
разность выборочных средних значений (из большего вычитаем меньшее), деленная на общее стандартное отклонение
(в таблице - при значимых различиях между средними, т. е. когда нулевая гипотеза отвергается).
2) В настоящее время в анализе мощности для этого критерия применяют стандартизованный средний эффект (оценку стандартизованной разности), для которого есть общепризнанные градации:
1. Малый эффект (Es = .20)
2. Средний эффект (Es = .50)
3. Большой эффект ( Es = .80)
http://www.statsoft.ru/solutions/ExamplesBase/branches/detail.php?ELEMENT_ID=636
В вашем исследовании (90+90 , p= 0,05) для того, чтобы мощность критерия была не ниже 0,8, нужно чтобы Es был не менее 0,37.
См. прикр. файл.
P.S. Анализ мощности представлен и в пакете STATISTICA.

 анализ_мощности.bmp ( 1,08 мегабайт ) : 1045
 

Автор: малой 19.06.2014 - 15:49

Спасибо. Буду разбираться.

Автор: psychologist 19.06.2014 - 18:29

Спасибо, коллеги. Я нашел такую замечательную книжку
Sample Size Calculations in Clinical Research
Second Edition
Там тоже для себя можно многое почерпнуть

Автор: aspir_h 21.06.2014 - 11:58

Ув. коллеги! Методики расчета объема выборки и оценки мощности для использования параметрических критериев можно найти, однако, я не встречал таковые для непараметрических критериев, например для ДА Краскела-Уоллиса, Манна-Уитни и т.д. Подскажите пожалуйста, как быть при применении вышесказанных критериев. Заранее спасибо!

Автор: 100$ 21.06.2014 - 21:41

Цитата(aspir_h @ 21.06.2014 - 12:58) *
Ув. коллеги! Методики расчета объема выборки и оценки мощности для использования параметрических критериев можно найти, однако, я не встречал таковые для непараметрических критериев, например для ДА Краскела-Уоллиса, Манна-Уитни и т.д. Подскажите пожалуйста, как быть при применении вышесказанных критериев. Заранее спасибо!


Эта информация собирается по крупицам, в основном, из научных статей (вроде вот http://www.mi.ras.ru/noc/lectures/14chibisov.pdf), посвященных изучению именно статистических свойств критерия. К примеру, известно, что асимптотическая мощность критерия Ван дер Вардена и Манна-Уитни составляет 3/3,1415926~95% мощности критерия Стьюдента. Соответственно, если на выборке объемом n= 95 вы достигаете (Стьюдентом) определенной мощности, то при применении критерия Ван дер Вардена и Манна-Уитни необходимо взять выборку объемом 95/,95=100.

Автор: hot_assay 24.06.2014 - 07:33

Глубокоуважаемые коллеги!
Хотел бы проконсультироваться по следующему вопросу.
В большинстве руководств и рекомендаций рассматриваются примеры расчёта размера выборок для цели сравнения ДВУХ групп пациентов.
Как меняется алгоритм расчёта, если сравнивается не ДВЕ, а большее число (ТРИ, ЧЕТЫРЕ и т.п.) независимых групп?

Заранее благодарю!

Автор: anserovtv 26.06.2014 - 17:31

Анализ мощности при сравнении нескольких (более двух) независимых выборок
(в рамках однофакторного дисперсионного анализа ANOVA) также представлен, например, в программе G*Power.
Ссылку я давал
http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3/download-and-register/Dokumente/GPower_3.1.5.zip
В STATISTICA представлены и еще два случая: для двухфакторного ANOVA и для заданного контраста.
Все это есть и в IBM SPSS SamlePower.


 анализ_мощности_в_Statistica.bmp ( 290,25 килобайт ) : 972
 

Автор: hot_assay 26.06.2014 - 19:07

Спасибо!

Автор: anserovtv 27.06.2014 - 07:20

Цитата(aspir_h @ 21.06.2014 - 12:58) *
Ув. коллеги! Методики расчета объема выборки и оценки мощности для использования параметрических критериев можно найти, однако, я не встречал таковые для непараметрических критериев, например для ДА Краскела-Уоллиса, Манна-Уитни и т.д. Подскажите пожалуйста, как быть при применении вышесказанных критериев. Заранее спасибо!

Анализ мощности некоторых непараметрических критериев (Вилкоксона) для сравнения средних
для одной выборки (!) ,
для двух независимых выборок,
для двух зависимых выборок
также представлен в программе G*Power.
http://www.gpower.hhu.de/fileadmin/redaktion/Fakultaeten/Mathematisch-Naturwissenschaftliche_Fakultaet/Psychologie/AAP/gpower/GPowerManual.pdf

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)