Статистика по одному качественному признаку |
Здравствуйте, гость ( Вход | Регистрация )
Статистика по одному качественному признаку |
30.06.2015 - 07:43
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375 |
Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет.
|
|
30.06.2015 - 20:59
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет. очень просто Код > c(rep(1, 36*2), rep(0,64*2)) [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 [38] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 [75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 [112] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 [149] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 [186] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 > d<-c(rep(1, 36*2), rep(0,64*2)) > sample(d, replace=TRUE) [1] 0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 1 1 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 0 1 0 [38] 0 0 1 1 0 0 0 0 0 1 0 0 1 0 1 0 0 1 0 0 0 1 1 0 1 0 1 1 0 0 0 0 0 0 0 0 0 [75] 0 0 1 1 1 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 1 0 0 0 1 0 0 [112] 0 1 0 1 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 [149] 0 1 0 0 0 1 0 0 0 1 0 1 0 0 0 1 0 1 1 0 1 0 1 0 1 0 0 0 0 0 0 1 1 0 0 1 1 [186] 1 1 0 1 0 0 0 0 1 0 0 0 0 1 0 > sum(sample(d, replace=TRUE)) [1] 79 > sum(sample(d, replace=TRUE)) [1] 67 > sum(sample(d, replace=TRUE)) [1] 73 > sum(sample(d, replace=TRUE)) [1] 77 > hist(replicate(100000, sum(sample(d, replace=TRUE)))/200) получив распределение можем его перцентили нужные посчитать Код > quantile(replicate(100000, sum(sample(d, replace=TRUE)))/200, probs=c(0.025,0.5,0.975))
2.5% 50% 97.5% 0.295000 0.360000 0.425125 > quantile(replicate(100000, sum(sample(d, replace=TRUE)))/200, probs=c(0.025,0.5,0.975)) 2.5% 50% 97.5% 0.295 0.360 0.425 |
|
2.07.2015 - 17:47
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375 |
А это как? где тут p-value заведомый?))
|
|
2.07.2015 - 20:03
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
А это как? где тут p-value заведомый?)) Как где?! В два раза по два с половиной процента конечно. |
|
2.07.2015 - 21:24
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Добрый день) Не знаю как правильно суть вопроса сформулировать. Смотрите, если у меня всего один признак. Например, только один вопрос. К примеру вы любите хард рок(пол не важен) просто в экселе одна колонка с ответами да и нет. Можно провести таблицы частот и увидеть что 36% опрошенных не любят рок, а 64% любят (из 200 чел). Но это описательная статистика. Как мне понять стат.значимы эти результаты или нет. Вы давайте уже заканчивайте с хард-роком... Ну или дозированно как-то ... А то так и останетесь в 70-х и следующим вопросом будет "а где же здесь t-критерий Стьюдента?" И пол важен: и в социологии, и в медицине. Ну а серьёзно, значение p - это косвенная оценка вероятности нулевой гипотезы (более грамотное определение найдите самостоятельно). Какова ваша нулевая гипотеза? 1) Что нашёлся хоть один, кто слушает? 2) Что тех кто любит - больше, а не 50 х 50? 3) Что 1/3 респондентов не нравится ваш рок? Для этих трёх гипотез из массы возможных будут абсолютно разные р. Чтобы их получить нужно на основе гипотезы рассчитать ожидаемые частоты и сравнить их с наблюдаемыми, можно с помощью критерия типа хи-квадрат. А без гипотезы вы можете только описать данные и оценить надёжность полученной точечной оценки частот, дополнив её доверительным интервалом, например 95%-ным, что собственно вам и советуют. PS. Вашему двухсотому не повезло . Добавьте меня 201-м: голосую за панк-рок, а за сайкобилли - двумя руками ! http://www.youtube.com/watch?v=95iLugjJ2kM |
|
3.07.2015 - 09:03
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 76 Регистрация: 27.04.2014 Пользователь №: 26375 |
А все поняла. nokh, ну ВЫ в ударе:) Да просто курс социологии 32 часа. Вот и решила посмотреть.)
|
|