Цитата(DrAsya @ 11.01.2009 - 21:06)

Спасибо за быстрый ответ!
Сначала о несущественном)
Есс-но, делать какие-то открытия, за которые дают Нобелевскую премию, я не планирую. Да и много ли из проводимых сейчас исследований могут претендовать на подобное? Дело тут, в многих случаях, не в умственных способностях отдельно взятого аспиранта, а в соответствующих условиях для работы. Конечно, гении творят в любых условиях. Но я - не гений ;-) Тема предложена научным руководителем.
Насчет смысла в работе - исследование из разряда популяционных, т. е я планирую оценить факторы риска нескольких нац. групп. В паспорте вообще-то национальность не обозначена. Так что я попросту спрошу (и про бабушек-дедушек не поленюсь). НЕ планируется доказать, что одни здоровые, другие - не очень, планируется изучить и посмотреть, кто здоровые, кто не очень! Кроме того, планируется изучить потребность в высокотехнологичной помощи в данном, конкретно взятом регионе.
Относительно ожидаемых величин. Допустим, я найду таковых для русских... А как быть с прочими?
Очень прошу, если есть варианты, поделиться! Критика, плиз, конструктивная! Люблю критику)
Для разнообразия сегодня конструктивная

1) Если известны показатели для одной группы (русских) примите ее как "контрольную". Скажем, ХС=5,5 ммоль/л, стандартное отклонение 1 ммоль/л
Соответственно, теперь, если надо, скажем, для бурят, то выдвигаете гипотезу - ХС у бурят выше на 0,5 ммоль/л. Или, что лучше - не хотелось бы пропустить различия в 0,3 ммоль/л. Далее надо определиться с уровнем значимости (обычно 0,05) и мощностью исследования (т.е. вероятностью не пропустить различия, если они существуют, минимальный уровень 80%)
Теперь у Вас есть все, что нужно для оценки численности выборки для данного фактора риска:
ХС (контроль) - 5,5 ммоль/л
ХС (буряты) - 5,8 ммоль/л (5,5+0,3)
Стандартное отклонение (одинаковое в двух группах) - 1,0
Простейшая формула N=2*C/d^2, где С - коэффициент, зависящий от мощности исследования и уровня достоверности (для р=0,05 и мощности 0,8 примерно 8), d - размер эффекта (разность средних деленная на стандартное отклонение).
Подставляем, получаем 2*8/(0,3)^2=178 человек в каждой группе
Далее, есть качественные показатели, например, курение. Тут также надо оценить распространенность (ожидаемую) курения в двух группах. Скажем у русских 0,6, у бурят ожидаем 0,7.
Общая формула N=2*C*p*(1-p)/(p2-p1)^2, тут р - полусумма распространенностей, р2 и р1 - распространенности в национальных группах.
Получаем
2*8*0,65*0,35/0,05^2=1456 человек в каждой группе
Аналогично для других факторов риска.
Если же надо оценить саму распространенность (не сравнение), то тогда надо определиться с какой точностью. Доверительный интервал как раз описывает интервал истинного (популяционного) значения, который совместим с Вашими выборочными данными.
Полуширина 95% интервала для количественного показателя (примерно)
2*SD/sqrt(N), соответственно, N=4*SD^2/w, где w -ширина интервала.
Для примера с ХС, хотим найти популяционную среднюю с точностью +/-0,1 ммоль/л
N=4*1/0,1^2=400 человек (надо обследовать 400 человек)
Для качественного показателя (примерно)
N=4*(p*(1-p))^2/w^2
Эта величина достигает макксимума при р=0,5, соответственно можно упростить, что максимальный размер выборки
1/w^2
Соответственно, если надо оценить распространенность курения у бурят с точностью +/-5% понадобится
1/0,05^2=400 человек
Конечно, формулы примерные, лучше пользоваться компьютерными программами, но идея, надеюсь, понятна.