Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: prop.test как тут быть
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
kont
Коллеги, смотрите, как пользоваться проп.тестом, если у нас всего двупольная таблица ,я знаю! Но что делать, если возможных градаций 3?
Код
    полный ответ    Стабилизация    Частичный ответ
Группа    n    n    n
R    0    2    28
T    1    1    28

Т.е. в каждой группе по 30, всего 60.
И тут я впал в ступор, я не могу понять, а как составить таблицу для трех градаций, чтобы посмотреть межгрупповое различие. Мне просто нужно ещё и 95% ДИ рассчитать.
Может кто подскажет
DoctorStat
Цитата(kont @ 18.02.2017 - 18:07) *
И тут я впал в ступор, я не могу понять, а как составить таблицу для трех градаций, чтобы посмотреть межгрупповое различие. Мне просто нужно ещё и 95% ДИ рассчитать.
Зашел на сайт on-line калькулятора хи-квадрат, вбил значения и получил ответ (смотри картинку 1). Хи-квадрат - приближенный метод, поэтому его нужно перепроверять точным методом Фишера (смотри картинку 2 - результат работы моей программы). На уровне значимости p=0,05 результаты совпадают.
100$
Цитата(kont @ 18.02.2017 - 18:07) *
Коллеги, смотрите, как пользоваться проп.тестом, если у нас всего двупольная таблица ,я знаю! Но что делать, если возможных градаций 3?
Код
    полный ответ    Стабилизация    Частичный ответ
Группа    n    n    n
R    0    2    28
T    1    1    28

Т.е. в каждой группе по 30, всего 60.
И тут я впал в ступор, я не могу понять, а как составить таблицу для трех градаций, чтобы посмотреть межгрупповое различие. Мне просто нужно ещё и 95% ДИ рассчитать.
Может кто подскажет


А почему бы не со всей пролетарской прямотой? По-нашему, по рабоче-крестьянски?

> data<-as.table(matrix(c(0,2,28,1,1,28),ncol=3,byrow=T))
> chisq.test(data)

Pearson's Chi-squared test

data: data
X-squared = 1.3333, df = 2, p-value = 0.5134
DrgLena
А prop.test это что такое ? И выборки одного размера, может они связанные ?
kont
Коллеги, спасибо! Помогло! DrgLena prop.test это функция сравнения долей на языке R. Правда когда у нас 3 градации в факторе, 95%ДИ не считает ни хи-квадрат , ни по - пролетарски Фишер.

> x=matrix(c(0,2,28,1,1,28),ncol=3,byrow=T)
> x
[,1] [,2] [,3]
[1,] 0 2 28
[2,] 1 1 28
> fisher.test(x)

Fisher's Exact Test for Count Data

data: x
p-value = 1
alternative hypothesis: two.sided

Если 2х2, то ДИ высчитывается.
100$
Цитата(kont @ 19.02.2017 - 11:59) *
Коллеги, спасибо! Помогло! DrgLena prop.test это функция сравнения долей на языке R. Правда когда у нас 3 градации в факторе, 95%ДИ не считает ни хи-квадрат , ни по - пролетарски Фишер.

> x=matrix(c(0,2,28,1,1,28),ncol=3,byrow=T)
> x
[,1] [,2] [,3]
[1,] 0 2 28
[2,] 1 1 28
> fisher.test(x)

Fisher's Exact Test for Count Data

data: x
p-value = 1
alternative hypothesis: two.sided

Если 2х2, то ДИ высчитывается.


/С искренним любопытством/
А какой, стесняюсь спросить, доверительный интервал может выдать точный метод Фишера, если он по определению выдает вероятность (к тому же одностороннюю!) заполнения таблицы сопряженности? А для вычисления двусторонней вероятности надо генерировать таблицы по определенным правилам. Н-р, для расширения точного теста Фишера на таблицы RxC (известного как критерий Фримана-Холтона), их надо генерить, н-р, по алгоритму Пэтфилда (Patefield, algorithm AS 159). Жду ответа, аки соловей лета.
kont
Про Фишера, соглашусь, а скажите в SPSS в кросс-табах можно сгненерить 95%, когда используешь Хи-квадрат. Я просто не видел там никогда этого, но может не туда смотрел.
100$
Цитата(kont @ 19.02.2017 - 21:19) *
Про Фишера, соглашусь, а скажите в SPSS в кросс-табах можно сгненерить 95%, когда используешь Хи-квадрат. Я просто не видел там никогда этого, но может не туда смотрел.


/ворчливо/ Еще бы вы не согласились...

/со все нарастающим любопытством/ А ДИ к чему? Ко всей таблице? К хи-квадрату? К Карлу Пирсону? Прям теряюсь в догадках.
leo_biostat
Цитата(kont @ 18.02.2017 - 18:07) *
Коллеги, смотрите, как пользоваться проп.тестом, если у нас всего двупольная таблица ,я знаю! Но что делать, если возможных градаций 3?
Код
    полный ответ    Стабилизация    Частичный ответ
Группа    n    n    n
R    0    2    28
T    1    1    28

Т.е. в каждой группе по 30, всего 60.
И тут я впал в ступор, я не могу понять, а как составить таблицу для трех градаций, чтобы посмотреть межгрупповое различие. Мне просто нужно ещё и 95% ДИ рассчитать.
Может кто подскажет



KONT, привет!
Полагаю, Вы уже прочитали высланный Вам по почте детальный результат анализа этой таблицы сопряжённости.
Поэтому вновь обращаю Ваше внимание, и внимание других читателей, на следующий важный факт, приводя отдельные фрагменты высланного результата.
"
WARNING: 67% of the cells have expected counts less than 5.
(Asymptotic) Chi-Square may not be a valid test.
"
То есть при анализе таблиц сопряжённости с такими деталями, проблематично получить продуктивный и надёжный результат.

Далее, в этом же результате привёл следующий фрагмент:

"
Statistics for Table of A by B

Pearson Chi-Square Test
----------------------------------
Chi-Square 1.3333
DF 2
Asymptotic Pr > ChiSq 0.5134

Monte Carlo Estimate for the Exact Test

Pr >= ChiSq 1.0000
99% Lower Conf Limit 1.0000
99% Upper Conf Limit 1.0000

Number of Samples 10000000
Initial Seed 527377001

"

То есть по методу Монте-Карло с 1 млн выборок, получаем 99%-ные ДИ для уровней стат. значимости равные 1.

Интересно сравнить с результатами этого же метода Монте-Карло при 100 выборках. Вот что получим:
"

Statistics for Table of A by B

Pearson Chi-Square Test
----------------------------------
Chi-Square 1.3333
DF 2
Asymptotic Pr > ChiSq 0.5134

Monte Carlo Estimate for the Exact Test

Pr >= ChiSq 1.0000
99% Lower Conf Limit 0.9550
99% Upper Conf Limit 1.0000

Number of Samples 100
Initial Seed 611244001

"

То есть уже при 100 выборках метод Монте-Карло подтверждает отсутствие взаимосвязи пары признаков.

Итак, когда большой процент малых значений ожидаемых (расчётных) частот, следует использовать метод Монте-Карло.

P.S.
Все приведённые выше результаты получены не с помощью пакета SPSS.


А вот какие подобные результаты для таблицы без малых значений расчётных частот, получены в SPSS.

Вот сама таблица:


Комбинационная таблица VAR4A * VAR13A
Количество
VAR13A Всего
1 2 3 4
VAR4A 0 19 21 22 9 71
1 11 9 8 21 49
Всего 30 30 30 30 120



Нажмите для просмотра прикрепленного файла


Но для подобной таблицы, где нет расчётных частот менее 5, ДИ получаются уже иные (см. рисунок ниже):

Нажмите для просмотра прикрепленного файла








DrgLena
Если клинический ответ представляет собой упорядоченные категории (полный ответ, стабилизация и частичный ответ), то и подход к анализу подобных таблиц сопряженности должен быть соответствующий. Обсуждаемая таблица сама по себе несет достаточную информацию для клинициста. Частичный ответ пребладает в обеих группах и абсолютно совпадает по частоте. 28/30 и все что нужно описать. К чему тут еще и 95% ДИ к долям, особенно к 1/30 или 2/30 или 0/30 (нижняя граница будет с минусом). Я думаю, автор поста к этим долям и хочет посчитать ДИ, а вовсе не те ДИ, которые leobiostat привел, изощряясь в разных техниках.
DoctorStat
Цитата(DrgLena @ 23.02.2017 - 11:09) *
Я думаю, автор поста к этим долям и хочет посчитать ДИ
Даже если категории не упорядочены, можно вычислить ДИ для доли в каждой категории. Выше с помощью тестов хи-квадрат и Фишера была показана независимость двух выборок, следовательно, мы можем их объединить в одну:
полный ответ Стабилизация Частичный ответ
1 3 56
Получается одна выборка из неизвестной генеральной совокупности, частоты (доли) которой нужно оценить . Выборочные доли P_i на основании ЦПТ подчиняются нормальному распределению. Формулу для стандартного отклонения для частот Sigma_i можно найти в учебниках. Тогда 95 %-доверительный интервал i-ой доли равен = P_i +/- 2*Sigma_i
nokh
Набейте в гугле Clopper-Pearson CI calculator и считайте ДИ в любом приглянувшемся. Например в этом: http://epitools.ausvet.com.au/content.php?page=CIProportion
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.