Статистика по одному качественному признаку

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Статистика по одному качественному признаку

Опции

nastushka Просмотр профиля	30.06.2015 - 07:43 Сообщение #1
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375	Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет.

p2004r

30.06.2015 - 20:59

Сообщение #2

Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699

Цитата(nastushka @ 30.06.2015 - 07:43)

Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет.

очень просто

Код

> c(rep(1, 36*2), rep(0,64*2))
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[38] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0
[75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[112] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[149] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
[186] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
> d<-c(rep(1, 36*2), rep(0,64*2))
> sample(d, replace=TRUE)
[1] 0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 0 1 0
[38] 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 1 1 0 1 0 1 1 0 0 0 0 0 0 0 0 0
[75] 0 0 1 1 1 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0
[112] 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0
[149] 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 0 0 1 1
[186] 1 1 0 1 0 0 0 0 1 0 0 0 0 1 0
> sum(sample(d, replace=TRUE))
[1] 79
> sum(sample(d, replace=TRUE))
[1] 67
> sum(sample(d, replace=TRUE))
[1] 73
> sum(sample(d, replace=TRUE))
[1] 77
> hist(replicate(100000, sum(sample(d, replace=TRUE)))/200)

получив распределение можем его перцентили нужные посчитать

Код

> quantile(replicate(100000, sum(sample(d, replace=TRUE)))/200, probs=c(0.025,0.5,0.975))
2.5% 50% 97.5%
0.295000 0.360000 0.425125
> quantile(replicate(100000, sum(sample(d, replace=TRUE)))/200, probs=c(0.025,0.5,0.975))
2.5% 50% 97.5%
0.295 0.360 0.425

Эскизы прикрепленных изображений

http://r-statistics.livejournal.com/

Ответить с цитированием данного сообщения

nastushka Просмотр профиля	2.07.2015 - 17:47 Сообщение #3
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375	А это как? где тут p-value заведомый?))

p2004r Просмотр профиля	2.07.2015 - 20:03 Сообщение #4
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(nastushka @ 2.07.2015 - 17:47) А это как? где тут p-value заведомый?)) Как где?! В два раза по два с половиной процента конечно. http://r-statistics.livejournal.com/

nokh Просмотр профиля	2.07.2015 - 21:24 Сообщение #5
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(nastushka @ 30.06.2015 - 09:43) Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет. Вы давайте уже заканчивайте с хард-роком... Ну или дозированно как-то ... А то так и останетесь в 70-х и следующим вопросом будет "а где же здесь t-критерий Стьюдента?" И пол важен: и в социологии, и в медицине. Ну а серьёзно, значение p - это косвенная оценка вероятности нулевой гипотезы (более грамотное определение найдите самостоятельно). Какова ваша нулевая гипотеза? 1) Что нашёлся хоть один, кто слушает? 2) Что тех кто любит - больше, а не 50 х 50? 3) Что 1/3 респондентов не нравится ваш рок? Для этих трёх гипотез из массы возможных будут абсолютно разные р. Чтобы их получить нужно на основе гипотезы рассчитать ожидаемые частоты и сравнить их с наблюдаемыми, можно с помощью критерия типа хи-квадрат. А без гипотезы вы можете только описать данные и оценить надёжность полученной точечной оценки частот, дополнив её доверительным интервалом, например 95%-ным, что собственно вам и советуют. PS. Вашему двухсотому не повезло . Добавьте меня 201-м: голосую за панк-рок, а за сайкобилли - двумя руками ! http://www.youtube.com/watch?v=95iLugjJ2kM

nastushka Просмотр профиля	3.07.2015 - 09:03 Сообщение #6
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375	А все поняла. nokh, ну ВЫ в ударе:) Да просто курс социологии 32 часа. Вот и решила посмотреть.)

« Предыдущая тема · Медицинская статистика · Следующая тема »

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум