Цитата(genbytu @ 16.11.2011 - 17:02)

Уважаемые коллеги, изучение статистики только начал, поэтому извиняюсь за глупый вопрос.
Есть 2 группы пациентов. Первая группа 49 пациентов получающих внутриартериальную химиотерапию, вторая 68 пациентов получающих системную химиотерапию. Оценка эффективности химиотерапии по шкале RECIST:
Полный ответ
Частичный ответ
Стабилизация
Прогрессирование
Частичный ответ получили у 22 пациентов первой группы и у 18 пациентов 2-й группы, стабилизацию у 17 и 19 соответственно и т.д. Как мне посчитать достоверность с учетом количества наблюдений?
в рамках шутки и разминки можно например бутстрепом

докажем насколько случайно 22 "частичный ответ" в первой группе
делаем общую группу 49+68 случаев из них 22+18 дали "частичный ответ"
Код
> c(c(rep(1,22),rep(0,49-22)), c(rep(1,18),rep(0,68-18)))
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[38] 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0
[75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[112] 0 0 0 0 0 0
> level2 <- c(c(rep(1,22),rep(0,49-22)), c(rep(1,18),rep(0,68-18)))
делаем из такой общей группы случайную выборку размером в группу где было 22 значения "частичный", вот несколько таких выборок
Код
> sample(level2, 49, replace = FALSE)
[1] 0 1 0 1 1 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 1 1 0 0 1 1 0 0 1 0 0 0
[39] 1 1 0 0 0 0 0 0 0 1 1
> sample(level2, 49, replace = FALSE)
[1] 0 1 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 1 0 1 1 0 0 0 0 1 1 0 0 1 0
[39] 0 0 0 1 0 0 1 0 1 0 0
> sample(level2, 49, replace = FALSE)
[1] 1 0 0 0 1 0 1 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 1 0 1 0 1 0 0 1 0 1 0 0 1 1 0
[39] 0 0 1 0 1 0 0 1 1 0 1
подсчитываем сколько из них оказались "частичный ответ"
Код
> sum(sample(level2, 49, replace = FALSE))
[1] 10
> sum(sample(level2, 49, replace = FALSE))
[1] 17
> sum(sample(level2, 49, replace = FALSE))
[1] 15
> sum(sample(level2, 49, replace = FALSE))
[1] 17
> sum(sample(level2, 49, replace = FALSE))
[1] 17
теперь посмотрим сколько выпадает случаев "частичный ответ" в 10 попытках
Код
> replicate(10,sum(sample(level2, 49, replace = FALSE)))
[1] 17 18 19 21 15 13 18 17 16 20
> replicate(10,sum(sample(level2, 49, replace = FALSE)))
[1] 14 13 20 14 16 16 15 16 19 20
> replicate(10,sum(sample(level2, 49, replace = FALSE)))
[1] 19 19 16 18 15 19 20 17 18 19
построим гистограмму для 100000 попыток
Код
> hist(replicate(100000,sum(sample(level2, 49, replace = FALSE))))
результат в первом присоединенном рисунке
теперь посчитаем какая доля значений равна или больше полученного в эксперименте значения 22
фактически это вероятность ошибки (для одностороннего критерия)
Код
> sum(replicate(100000,sum(sample(level2, 49, replace = FALSE)))>=22)/100000
[1] 0.03056
> sum(replicate(100000,sum(sample(level2, 49, replace = FALSE)))>=22)/100000
[1] 0.02906
> sum(replicate(100000,sum(sample(level2, 49, replace = FALSE)))>=22)/100000
[1] 0.03029
ну и теперь построим гистограмму для 100 таких измерений и узнаем интервальную оценку вероятности ошибки для одностороннего критерия
Код
> hist(replicate(100,sum(replicate(100000,sum(sample(level2, 49, replace = FALSE)))>=22)/100000))