Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Достоверность различия в SPSS 17
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
ElenaSh
Подскажите, пожалуйста, как подсчитать, достоверны ли различия между группами при разных методах лечения?

К примеру:
у меня 4 группы больных:
1гр. - 74 чел., из них у 52 бесплодие, после лечения родили 18 человек;
2гр. - 32 чел., из них у 22 бесплодие, после лечения родили 5 человек;
3гр. - 35 чел., из них у 24 бесплодие, после лечения родили 7 человек;
4гр. - 54чел., из них у 37 бесплодие, после лечения родили 4 человека.

p2004r
Цитата(ElenaSh @ 7.01.2012 - 17:14) *
Подскажите, пожалуйста, как подсчитать, достоверны ли различия между группами при разных методах лечения?

К примеру:
у меня 4 группы больных:
1гр. - 74 чел., из них у 52 бесплодие, после лечения родили 18 человек;
2гр. - 32 чел., из них у 22 бесплодие, после лечения родили 5 человек;
3гр. - 35 чел., из них у 24 бесплодие, после лечения родили 7 человек;
4гр. - 54чел., из них у 37 бесплодие, после лечения родили 4 человека.


в 1й группе больных бесплодием женщин, числом 22 после лечения способом ?1 родило 5.

во 2й группе числом 52 после способа ?2 родило 18.

Код
> h<-ES.h(18/52,5/22)
> pwr.2p2n.test(n1=52,n2=22,h=h,sig.level=0.05,alternative="two.sided")

difference of proportion power calculation for binomial distribution (arcsine transformation)

h = 0.2641646
n1 = 52
n2 = 22
sig.level = 0.05
power = 0.1798009
alternative = two.sided

NOTE: different sample sizes


мощность теста получается всего 0.18 --- величина эффекта слишком мала для такого размера выборок. Тест сработает даже если эффект гарантированно есть только в 18 случаях из 100. Но мы помним что и так приняли условие что тест сработает в 5 случаях из 100 даже если мы подадим в него чисто случайные выборки из тех же генсовокупностей.
p2004r
Цитата(ElenaSh @ 7.01.2012 - 17:14) *
Подскажите, пожалуйста, как подсчитать, достоверны ли различия между группами при разных методах лечения?

К примеру:
у меня 4 группы больных:
1гр. - 74 чел., из них у 52 бесплодие, после лечения родили 18 человек;
2гр. - 32 чел., из них у 22 бесплодие, после лечения родили 5 человек;
3гр. - 35 чел., из них у 24 бесплодие, после лечения родили 7 человек;
4гр. - 54чел., из них у 37 бесплодие, после лечения родили 4 человека.


можно бутстрепом смоделировать

Код
# моделируем совокупность из которой будеи делать выборки
> data<-c(rep(0,74-52),rep(1,52-18),rep(2,18), rep(0,32-22),rep(1,22-5),rep(2,5), rep(0,35-24),rep(1,24-7),rep(2,7), rep(0,54-37),rep(1,37-4),rep(2,4))
> data
  [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[38] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
[75] 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 0 0 0 0 0
[112] 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 0 0 0 0 0 0 0
[149] 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[186] 1 1 1 1 1 1 2 2 2 2

# 0 небесплодная, 1-бесплодная невылеченная 1 - бесплодная вылеченная

> gr1 <- t(replicate(10000,as.vector(table(sample(data, 74 ,replace = TRUE)))))

## первая группа
# матожидание числа вылеченных
> mean(gr1[,3])
[1] 12.9137
# оценки 5% двустороннего доверительного интервала
> gr1[,3][order(gr1[,3])[250]]
[1] 7
> gr1[,3][order(gr1[,3])[10000-250]]
[1] 20
# матожидание числа бесплодных
> mean(gr1[,3]+gr1[,2])
[1] 51.2528
# оценки 5% двустороннего доверительного интервала
> (gr1[,3]+gr1[,2])[order(gr1[,3]+gr1[,2])[10000-250]]
[1] 59
> (gr1[,3]+gr1[,2])[order(gr1[,3]+gr1[,2])[250]]
[1] 43


## 2я группа
> gr2 <- t(replicate(10000,as.vector(table(factor(sample(data, 32 ,replace = TRUE), levels=c(0,1,2))))))

## вылеченные
> mean(gr2[,3])
[1] 5.5496
> gr2[,3][order(gr2[,3])[10000-250]]
[1] 10
> gr2[,3][order(gr2[,3])[250]]
[1] 2
## всего бесплодных
> mean(gr2[,3]+gr2[,2])
[1] 22.151
# дов.интервал
> (gr2[,3]+gr2[,2])[order(gr2[,3]+gr2[,2])[10000-250]]
[1] 27
> (gr2[,3]+gr2[,2])[order(gr2[,3]+gr2[,2])[250]]
[1] 17

## 3я группа
> gr3 <- t(replicate(10000,as.vector(table(factor(sample(data, 35 ,replace = TRUE), levels=c(0,1,2))))))
> mean(gr3[,3])
[1] 6.1233
> gr3[,3][order(gr3[,3])[10000-250]]
[1] 11
> gr3[,3][order(gr3[,3])[250]]
[1] 2
> mean(gr3[,3]+gr3[,2])
[1] 24.2219
> (gr3[,3]+gr3[,2])[order(gr3[,3]+gr3[,2])[10000-250]]
[1] 29
> (gr3[,3]+gr3[,2])[order(gr3[,3]+gr3[,2])[250]]
[1] 19

## 4я группа
> gr4 <- t(replicate(10000,as.vector(table(factor(sample(data, 54 ,replace = TRUE), levels=c(0,1,2))))))
> mean(gr4[,3])
[1] 9.4148
> gr4[,3][order(gr4[,3])[10000-250]]
[1] 15
> gr4[,3][order(gr4[,3])[250]]
[1] 4
> mean(gr4[,3]+gr4[,2])
[1] 37.3952
> (gr4[,3]+gr4[,2])[order(gr4[,3]+gr4[,2])[10000-250]]
[1] 44
> (gr4[,3]+gr4[,2])[order(gr4[,3]+gr4[,2])[250]]
[1] 31


бесплодие как таковое по группам на удивление равномерно распределилось.

в 4й группе лечение дало странный эффект в снижении числа забеременевших почти до 5% границы достоверности smile.gif

в 1 группе тенденция к повышению числа вылеченных

их к стати имеет смысл сравнивать на различия долей вылеченных (мощность критерия достаточна)

Код
> h<-ES.h(18/52,4/37)
> pwr.2p2n.test(n1=52,n2=37,h=h,sig.level=0.05,alternative="two.sided")

     difference of proportion power calculation for binomial distribution (arcsine transformation)

              h = 0.5879686
             n1 = 52
             n2 = 37
      sig.level = 0.05
          power = 0.780478
    alternative = two.sided

NOTE: different sample sizes


PS наверное 4я это контроль?
nokh
Цитата(ElenaSh @ 7.01.2012 - 19:14) *
Подскажите, пожалуйста, как подсчитать, достоверны ли различия между группами при разных методах лечения?

К примеру:
у меня 4 группы больных:
1гр. - 74 чел., из них у 52 бесплодие, после лечения родили 18 человек;
2гр. - 32 чел., из них у 22 бесплодие, после лечения родили 5 человек;
3гр. - 35 чел., из них у 24 бесплодие, после лечения родили 7 человек;
4гр. - 54чел., из них у 37 бесплодие, после лечения родили 4 человека.

Задача сформулирована некорректно и пока не имеет решения. На основании имеющейся информации можно лишь сравнить группы на различия по частотам встречаемости бесплодия, да и то только если способ формирования выборок это позволяет.
Если после лечения рожали только исходно бесплодные, то зачем нам тогда информация по общему числу людей в группах? Она - лишняя. Если после лечения рожали небесплодные - то зачем информация по бесплодным? Если рожали и те, и другие, то нужна информация о том сколько в каждой группе родили небесплодные и сколько - бесплодные. В последнем случае задача решается путём логлинейного анализа таблицы сопряженности с тремя входами: "Группа", "Наличие бесплодия" и "Факт родов".
p2004r
Цитата(nokh @ 7.01.2012 - 20:20) *
Если после лечения рожали только исходно бесплодные, то зачем нам тогда информация по общему числу людей в группах? Она - лишняя.


я подозреваю процесс требует участия двух человек smile.gif

группы могут быть взяты в разных регионах для которых нужна проверка на одинаковый уровень бесплодия именно женщин. у остальных например может быть бесплоден муж.
DoctorStat
Цитата(ElenaSh @ 7.01.2012 - 18:14) *
Подскажите, пожалуйста, как подсчитать, достоверны ли различия между группами при разных методах лечения?
Необходима дополнительная информация по каждой группе:
1. Кто бесплоден: мужчина, женщина или оба?
2. Кого лечили: мужчину, женщину или обоих?

ElenaSh
Исходно % бесплодных был одинаков во всех группах, для этого указываю общее количество больных. После лечения учитывала роды только у бесплодных больных женщин (мужской фактор у всех исключен).
Подскажите, пожалуйста, как применять в данном случае таблицы сопряженности?
ElenaSh
Цитата(p2004r @ 7.01.2012 - 23:01) *
можно бутстрепом смоделировать

Код
# моделируем совокупность из которой будеи делать выборки
> data<-c(rep(0,74-52),rep(1,52-18),rep(2,18), rep(0,32-22),rep(1,22-5),rep(2,5), rep(0,35-24),rep(1,24-7),rep(2,7), rep(0,54-37),rep(1,37-4),rep(2,4))
> data
  [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[38] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
[75] 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 0 0 0 0 0
[112] 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 0 0 0 0 0 0 0
[149] 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[186] 1 1 1 1 1 1 2 2 2 2

# 0 небесплодная, 1-бесплодная невылеченная 1 - бесплодная вылеченная

> gr1 <- t(replicate(10000,as.vector(table(sample(data, 74 ,replace = TRUE)))))

## первая группа
# матожидание числа вылеченных
> mean(gr1[,3])
[1] 12.9137
# оценки 5% двустороннего доверительного интервала
> gr1[,3][order(gr1[,3])[250]]
[1] 7
> gr1[,3][order(gr1[,3])[10000-250]]
[1] 20
# матожидание числа бесплодных
> mean(gr1[,3]+gr1[,2])
[1] 51.2528
# оценки 5% двустороннего доверительного интервала
> (gr1[,3]+gr1[,2])[order(gr1[,3]+gr1[,2])[10000-250]]
[1] 59
> (gr1[,3]+gr1[,2])[order(gr1[,3]+gr1[,2])[250]]
[1] 43


## 2я группа
> gr2 <- t(replicate(10000,as.vector(table(factor(sample(data, 32 ,replace = TRUE), levels=c(0,1,2))))))

## вылеченные
> mean(gr2[,3])
[1] 5.5496
> gr2[,3][order(gr2[,3])[10000-250]]
[1] 10
> gr2[,3][order(gr2[,3])[250]]
[1] 2
## всего бесплодных
> mean(gr2[,3]+gr2[,2])
[1] 22.151
# дов.интервал
> (gr2[,3]+gr2[,2])[order(gr2[,3]+gr2[,2])[10000-250]]
[1] 27
> (gr2[,3]+gr2[,2])[order(gr2[,3]+gr2[,2])[250]]
[1] 17

## 3я группа
> gr3 <- t(replicate(10000,as.vector(table(factor(sample(data, 35 ,replace = TRUE), levels=c(0,1,2))))))
> mean(gr3[,3])
[1] 6.1233
> gr3[,3][order(gr3[,3])[10000-250]]
[1] 11
> gr3[,3][order(gr3[,3])[250]]
[1] 2
> mean(gr3[,3]+gr3[,2])
[1] 24.2219
> (gr3[,3]+gr3[,2])[order(gr3[,3]+gr3[,2])[10000-250]]
[1] 29
> (gr3[,3]+gr3[,2])[order(gr3[,3]+gr3[,2])[250]]
[1] 19

## 4я группа
> gr4 <- t(replicate(10000,as.vector(table(factor(sample(data, 54 ,replace = TRUE), levels=c(0,1,2))))))
> mean(gr4[,3])
[1] 9.4148
> gr4[,3][order(gr4[,3])[10000-250]]
[1] 15
> gr4[,3][order(gr4[,3])[250]]
[1] 4
> mean(gr4[,3]+gr4[,2])
[1] 37.3952
> (gr4[,3]+gr4[,2])[order(gr4[,3]+gr4[,2])[10000-250]]
[1] 44
> (gr4[,3]+gr4[,2])[order(gr4[,3]+gr4[,2])[250]]
[1] 31


бесплодие как таковое по группам на удивление равномерно распределилось.

в 4й группе лечение дало странный эффект в снижении числа забеременевших почти до 5% границы достоверности smile.gif

в 1 группе тенденция к повышению числа вылеченных

их к стати имеет смысл сравнивать на различия долей вылеченных (мощность критерия достаточна)

Код
> h<-ES.h(18/52,4/37)
> pwr.2p2n.test(n1=52,n2=37,h=h,sig.level=0.05,alternative="two.sided")

     difference of proportion power calculation for binomial distribution (arcsine transformation)

              h = 0.5879686
             n1 = 52
             n2 = 37
      sig.level = 0.05
          power = 0.780478
    alternative = two.sided

NOTE: different sample sizes


PS наверное 4я это контроль?




Спасибо. 4-я группа контроль,верно. http://forum.disser.ru/style_images/disser...icons/icon1.gif
К сожалению, я не могу интерпретировать ваши рекомендации.
DoctorStat
Цитата(ElenaSh @ 8.01.2012 - 07:16) *
Исходно % бесплодных был одинаков во всех группах, для этого указываю общее количество больных. После лечения учитывала роды только у бесплодных больных женщин (мужской фактор у всех исключен).
Подскажите, пожалуйста, как применять в данном случае таблицы сопряженности?
Если вы предпочитаете таблицу сопряженности, то в прикрепленном файле находится лист электронной таблицы Excel с анализом хи-квадрат (ячейка P-VALUE=0,079) и гистограммой частот только для больных рожениц. Как видно, все ожидаемые частоты больше 5 и, значит, можно применять приближенный тест хи-квадрат. Интерпретация результатов: на уровне значимости 0,05 четыре группы больных не отличаются по частоте родов. При получении результата использована программа doctorstat.
p2004r
Цитата(ElenaSh @ 8.01.2012 - 06:20) *
Спасибо. 4-я группа контроль,верно. http://forum.disser.ru/style_images/disser...icons/icon1.gif
К сожалению, я не могу интерпретировать ваши рекомендации.


это спарта бутстреп smile.gif

1) выборки проводились в предположении что никаких различий между группами нет.

2) оказывается что 4я группа отличается от остальных (скорее всего достоверно).

3) попарно есть смысл определить отличие только 4й от 1й для этого различия достаточен размер групп.

4) частота женского бесплодия одинакова во всех группах.

расчеты выполнены в R. вот ссылка на русское руководство http://m7876.wiki.zoho.com/Introduction-to-R.html
ElenaSh
[quote name='DoctorStat' date='8.01.2012 - 13:36' post='12735']
Если вы предпочитаете таблицу сопряженности, то в прикрепленном файле находится лист электронной таблицы Excel с анализом хи-квадрат (ячейка P-VALUE=0,079) и гистограммой частот только для больных рожениц. Как видно, все ожидаемые частоты больше 5 и, значит, можно применять приближенный тест хи-квадрат. Интерпретация результатов: на уровне значимости 0,05 четыре группы больных не отличаются по частоте родов. При получении результата использована программа doctorstat.
[/quote

Спасибо огромное! Буду дальше работать smile.gif
ElenaSh
Цитата(p2004r @ 8.01.2012 - 15:11) *
это спарта бутстреп smile.gif

1) выборки проводились в предположении что никаких различий между группами нет.

2) оказывается что 4я группа отличается от остальных (скорее всего достоверно).

3) попарно есть смысл определить отличие только 4й от 1й для этого различия достаточен размер групп.

4) частота женского бесплодия одинакова во всех группах.

расчеты выполнены в R. вот ссылка на русское руководство http://m7876.wiki.zoho.com/Introduction-to-R.html



Спасибо! Начинаю разбираться!
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.