Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Статистика по одному качественному признаку
nastushka
сообщение 30.06.2015 - 07:43
Сообщение #1





Группа: Пользователи
Сообщений: 76
Регистрация: 27.04.2014
Пользователь №: 26375



Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 30.06.2015 - 20:59
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(nastushka @ 30.06.2015 - 07:43) *
Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет.



очень просто

Код
> c(rep(1, 36*2), rep(0,64*2))
  [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[38] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0
[75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[112] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[149] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[186] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
> d<-c(rep(1, 36*2), rep(0,64*2))
> sample(d, replace=TRUE)
  [1] 0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 0 1 0
[38] 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 1 1 0 1 0 1 1 0 0 0 0 0 0 0 0 0
[75] 0 0 1 1 1 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0
[112] 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0
[149] 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 0 0 1 1
[186] 1 1 0 1 0 0 0 0 1 0 0 0 0 1 0
> sum(sample(d, replace=TRUE))
[1] 79
> sum(sample(d, replace=TRUE))
[1] 67
> sum(sample(d, replace=TRUE))
[1] 73
> sum(sample(d, replace=TRUE))
[1] 77
> hist(replicate(100000, sum(sample(d, replace=TRUE)))/200)


получив распределение можем его перцентили нужные посчитать

Код
> quantile(replicate(100000, sum(sample(d, replace=TRUE)))/200, probs=c(0.025,0.5,0.975))
    2.5%      50%    97.5%
0.295000 0.360000 0.425125
> quantile(replicate(100000, sum(sample(d, replace=TRUE)))/200, probs=c(0.025,0.5,0.975))
2.5%   50% 97.5%
0.295 0.360 0.425

Эскизы прикрепленных изображений
Прикрепленное изображение
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nastushka
сообщение 2.07.2015 - 17:47
Сообщение #3





Группа: Пользователи
Сообщений: 76
Регистрация: 27.04.2014
Пользователь №: 26375



А это как? где тут p-value заведомый?))
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 2.07.2015 - 20:03
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(nastushka @ 2.07.2015 - 17:47) *
А это как? где тут p-value заведомый?))


Как где?! В два раза по два с половиной процента конечно.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 2.07.2015 - 21:24
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(nastushka @ 30.06.2015 - 09:43) *
Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет.

Вы давайте уже заканчивайте с хард-роком... Ну или дозированно как-то ... А то так и останетесь в 70-х и следующим вопросом будет "а где же здесь t-критерий Стьюдента?" И пол важен: и в социологии, и в медицине.
Ну а серьёзно, значение p - это косвенная оценка вероятности нулевой гипотезы (более грамотное определение найдите самостоятельно). Какова ваша нулевая гипотеза?
1) Что нашёлся хоть один, кто слушает?
2) Что тех кто любит - больше, а не 50 х 50?
3) Что 1/3 респондентов не нравится ваш рок?
Для этих трёх гипотез из массы возможных будут абсолютно разные р. Чтобы их получить нужно на основе гипотезы рассчитать ожидаемые частоты и сравнить их с наблюдаемыми, можно с помощью критерия типа хи-квадрат. А без гипотезы вы можете только описать данные и оценить надёжность полученной точечной оценки частот, дополнив её доверительным интервалом, например 95%-ным, что собственно вам и советуют.

PS. Вашему двухсотому не повезло frown.gif . Добавьте меня 201-м: голосую за панк-рок, а за сайкобилли - двумя руками super.gif ! http://www.youtube.com/watch?v=95iLugjJ2kM
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nastushka
сообщение 3.07.2015 - 09:03
Сообщение #6





Группа: Пользователи
Сообщений: 76
Регистрация: 27.04.2014
Пользователь №: 26375



А все поняла. nokh, ну ВЫ в ударе:) Да просто курс социологии 32 часа. Вот и решила посмотреть.)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему