Цитата(nastushka @ 30.06.2015 - 07:43)

Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет.
очень просто
Код
> c(rep(1, 36*2), rep(0,64*2))
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[38] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0
[75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[112] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[149] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[186] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
> d<-c(rep(1, 36*2), rep(0,64*2))
> sample(d, replace=TRUE)
[1] 0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 0 1 0
[38] 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 1 1 0 1 0 1 1 0 0 0 0 0 0 0 0 0
[75] 0 0 1 1 1 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0
[112] 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0
[149] 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 0 0 1 1
[186] 1 1 0 1 0 0 0 0 1 0 0 0 0 1 0
> sum(sample(d, replace=TRUE))
[1] 79
> sum(sample(d, replace=TRUE))
[1] 67
> sum(sample(d, replace=TRUE))
[1] 73
> sum(sample(d, replace=TRUE))
[1] 77
> hist(replicate(100000, sum(sample(d, replace=TRUE)))/200)
получив распределение можем его перцентили нужные посчитать
Код
> quantile(replicate(100000, sum(sample(d, replace=TRUE)))/200, probs=c(0.025,0.5,0.975))
2.5% 50% 97.5%
0.295000 0.360000 0.425125
> quantile(replicate(100000, sum(sample(d, replace=TRUE)))/200, probs=c(0.025,0.5,0.975))
2.5% 50% 97.5%
0.295 0.360 0.425