Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Достоверность
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
elle10890
Зравствуйте! Помогите пожалуйста! Нужно подсчитать достоверность.
Было выявлено, что диабет оказывает более выраженное влияние на качество жизни у мальчиков, по сравнению с девочками. Качество жизни мальчиков в среднем -3,9 +- 1,1; девочек - 0,9 +- 0,7.
Liz
Скорее, наоборот :)
Larina Tatjana
Цитата(elle10890 @ 10.03.2013 - 03:57) *
Зравствуйте! Помогите пожалуйста! Нужно подсчитать достоверность.
Было выявлено, что диабет оказывает более выраженное влияние на качество жизни у мальчиков, по сравнению с девочками. Качество жизни мальчиков в среднем -3,9 +- 1,1; девочек - 0,9 +- 0,7.


Здравствуйте, elle10890!

Если Вы действительно хотите получить помощь от форумчан, то опишите свой вопрос более детально. Например, что Вы подразумеваете под "достоверностью"? Ведь реально в статистике нет "достоверности". Далее, что такое "3,9 +- 1,1" и "0,9 +- 0,7"? Если речь идёт о качестве жизни, значит Вы используете балльную шкалу. А для балльных шкал нет средних значений, как и ошибок среднего .

Вывод: опишите более подробно свою проблему, если конечно, не побоитесь при этом "засветить" своё незнание элементарных понятий статистики.

Пишите. Иначе - каков вопрос, таков и ответ wt.gif

Татьяна
nokh
Цитата(elle10890 @ 9.03.2013 - 23:27) *
Зравствуйте! Помогите пожалуйста! Нужно подсчитать достоверность.
Было выявлено, что диабет оказывает более выраженное влияние на качество жизни у мальчиков, по сравнению с девочками. Качество жизни мальчиков в среднем -3,9 +- 1,1; девочек - 0,9 +- 0,7.

В теории вероятностей под достоверным событием понимается событие с вероятностью P=1, а под невозможным - событие с вероятностью P=0. Поскольку в статистическом оценивании, базирующемся на теории вероятностей, нет ни P=1, ни P=0, а всегда 0<P<1, ни достоверность, ни невозможность вы посчитать не сможете.
Современное статистическое оценвание - это англо-саксонское изобретение, и в нём рассчитывается statistical significance. Это - не "достоверность", это - статистическая значимость; в вашем случае - статистическая значимость различий. Если у вас только две группы (мальчики и девочки), то почитайте про t-критерий Стьюдента, критерий Манна-Уитни и условия их применимости. Один из них будет близок к оптимальному. Также почитайте про стандартную ошибку, которую принято приводить после знака +/-, когда она уместна и уместна ли вообще.
Larina Tatjana
Цитата(elle10890 @ 10.03.2013 - 03:57) *
Зравствуйте! Помогите пожалуйста! Нужно подсчитать достоверность.
Было выявлено, что диабет оказывает более выраженное влияние на качество жизни у мальчиков, по сравнению с девочками. Качество жизни мальчиков в среднем -3,9 +- 1,1; девочек - 0,9 +- 0,7.


В дополнение к тому, что написал NOKH, рекомендую почитать статью Н. Зорина "Достоверность" или "Статистическая значимость" - 12 лет спустя" (http://www.hta-rus.ru/files/s15_1352793575.pdf) - привожу в приложении. Там же дается ссылка на известный сайт, где впервые была опубликована его статья "О НЕПРАВИЛЬНОМ УПОТРЕБЛЕНИИ ТЕРМИНА "ДОСТОВЕРНОСТЬ" В РОССИЙСКИХ НАУЧНЫХ ПСИХИАТРИЧЕСКИХ И ОБЩЕМЕДИЦИНСКИХ СТАТЬЯХ".

Татьяна
DrgLena
Ну, вот, сайту 15 лет и посещаемость высокая, а Зорин пишет, что лучше не стало, не смотря на ультиматумы, карательные меры и кунсткамеры. А это значит, что деятельность не туда направлена. Ее бы в мирное русло направить.

Почему же Зорин с психиатрии начал наводить порядок в терминологии, причем привлек столь тяжелую артиллерию, что это выглядит как расстрел воробьев из пушки. Начать можно было с советских учебников, таких как БИОМЕТРИЯ Лакина (не путать с БИОМЕТРИКОЙ Леонова), который использует в описании примеров именно такую крамольную терминологию, ?разница между контролем и опытом оказывается статистически недостоверной?. wt.gif
Ма га ита
Цитата(Larina Tatjana @ 10.03.2013 - 08:32) *
Здравствуйте, elle10890!

Если Вы действительно хотите получить помощь от форумчан, то опишите свой вопрос более детально. Например, что Вы подразумеваете под "достоверностью"? Ведь реально в статистике нет "достоверности". Далее, что такое "3,9 +- 1,1" и "0,9 +- 0,7"? Если речь идёт о качестве жизни, значит Вы используете балльную шкалу. А для балльных шкал нет средних значений, как и ошибок среднего .

Вывод: опишите более подробно свою проблему, если конечно, не побоитесь при этом "засветить" своё незнание элементарных понятий статистики.

Пишите. Иначе - каков вопрос, таков и ответ wt.gif

Татьяна




Татьяна, подскажите и мне . Если необходимо сравнить 2 группы по бальным шкалам между собой ( 1 мин, 3 макс) и изза малой выобрки ( n=11,12) мы можем использовать только непараметр критерии- то есть медиану и квартили,но в программе статистика выходят какие то очень кривые данные, можем ли мы как то еще их сравнить?
p2004r
Цитата(Ма га ита @ 12.04.2013 - 16:40) *
Татьяна, подскажите и мне . Если необходимо сравнить 2 группы по бальным шкалам между собой ( 1 мин, 3 макс) и изза малой выобрки ( n=11,12) мы можем использовать только непараметр критерии- то есть медиану и квартили,но в программе статистика выходят какие то очень кривые данные, можем ли мы как то еще их сравнить?


я не Татьяна, но могу сказать что вполне можно попробовать бутстреп оценку для той же медианы посчитать (хотя да, группы маленькие)
100$
Нет, я все-таки спрошу: а с каких пор медиана и квартили (т.е. обычные порядковые статистики) вдруг стали статистическими критериями (т.е. способами проверки статистических гипотез)? Я так много пропустил?
p2004r
Цитата(100$ @ 13.04.2013 - 11:48) *
Нет, я все-таки спрошу: а с каких пор медиана и квартили (т.е. обычные порядковые статистики) вдруг стали статистическими критериями (т.е. способами проверки статистических гипотез)? Я так много пропустил?


наверное все таки доверительный интервал для медианы (или даже разницы медиан двух групп) вполне себе критерий?
100$
Цитата(p2004r @ 13.04.2013 - 13:41) *
наверное все таки доверительный интервал для медианы (или даже разницы медиан двух групп) вполне себе критерий?


Не-а. ДИ к проверке гипотез вообще не имеют никакого отношения.
p2004r
Цитата(100$ @ 13.04.2013 - 14:10) *
Не-а. ДИ к проверке гипотез вообще не имеют никакого отношения.


и так, следите за руками smile.gif

есть две "группы" в каждой считаем медиану. берем разницу этих медиан. для этого параметра считаем доверительный интервал бутсрепом. 0 вошел в доверительный интервал.

вопрос --- это не имеет отношения к проверке гипотез?
100$
Цитата(p2004r @ 15.04.2013 - 12:46) *
и так, следите за руками smile.gif

есть две "группы" в каждой считаем медиану. берем разницу этих медиан. для этого параметра считаем доверительный интервал бутсрепом. 0 вошел в доверительный интервал.

вопрос --- это не имеет отношения к проверке гипотез?


Все равно формально говоря, эта процедура статистическим критерием не является. Уровень значимости неизвестен. Это примерно из той же оперы, когда на гистограмму накладывается теоретическая кривая плотности распределения, а исследователь на глаз констатирует нормальность, вместо того, чтобы проверить оную нормальность критерием Шапиро-Уилка.

Но ради вас свой предыдущий пост излагаю в следующей редакции: "ДИ к проверке гипотез не имеют непосредственного отношения". smile.gif
DrgLena
Я, конечно тоже не Татьяна Ларина (В.П.), но свои 5 коп. хочется внести. Предлагаю, для данных изложенных в последнем вопросе, статистическое обобщение вообще отменить, а представить в одной табличке все значения в двух группах, можно даже отсортировать, чтобы каждому было понятно, сколько 1, 2 и 3 в каждой группе. По правилам оформления результатов медицинских научных работ (Lang, Secic) при столь малом количестве наблюдений, даже процентное выражение выедет к потере информации. Не претендую на достовредность моего предложения.

А доверительный интервал бутсрепом для разности медиан на таких данных таки да смахивает на шаманство. Убогие данные нужно отправлять на доработку, т.е. нужно материал набирать, чтобы было что обобщать. Медианы могут не различаться, а ранговые критерии могут показать, что различия статистически значимы.
p2004r
Цитата(100$ @ 16.04.2013 - 00:51) *
Все равно формально говоря, эта процедура статистическим критерием не является. Уровень значимости неизвестен. Это примерно из той же оперы, когда на гистограмму накладывается теоретическая кривая плотности распределения, а исследователь на глаз констатирует нормальность, вместо того, чтобы проверить оную нормальность критерием Шапиро-Уилка.

Но ради вас свой предыдущий пост излагаю в следующей редакции: "ДИ к проверке гипотез не имеют непосредственного отношения". smile.gif


чего? 95% интервал для показателя не имеет "уровня значимости"? smile.gif да _любой_ "критерий" основан на том "попадает он или нет", просто некий добрый дядя посчитал таблицу критических значений.
p2004r
Цитата(DrgLena @ 16.04.2013 - 12:54) *
А доверительный интервал бутсрепом для разности медиан на таких данных таки да смахивает на шаманство. Убогие данные нужно отправлять на доработку, т.е. нужно материал набирать, чтобы было что обобщать. Медианы могут не различаться, а ранговые критерии могут показать, что различия статистически значимы.


ну ну... медианы значит не отличаются? smile.gif давайте проверим.

Код
> x<- rnorm(14, mean=10, sd=3)
> y<- rnorm(14, mean=14, sd=3)
> wilcox.test(x,y)

    Wilcoxon rank sum test

data:  x and y
W = 17, p-value = 5.973e-05
alternative hypothesis: true location shift is not equal to 0

> quantile(replicate(10000,{median(sample(x,replace=T))-median(sample(y, replace=T))}), probs=c(0.025,0.975))
     2.5%     97.5%
-7.852886 -2.356706
> quantile(replicate(10000,{median(sample(x,replace=T))-median(sample(y, replace=T))}), probs=c(0.025,0.975))
     2.5%     97.5%
-7.960661 -2.496009

# попробуем различить разницу средних в 1
> y<- rnorm(14, mean=11, sd=3)
> quantile(replicate(10000,{median(sample(x,replace=T))-median(sample(y, replace=T))}), probs=c(0.025,0.975))
     2.5%     97.5%
-3.435269  2.403256
> quantile(replicate(10000,{median(sample(x,replace=T))-median(sample(y, replace=T))}), probs=c(0.025,0.975))
     2.5%     97.5%
-3.646714  2.342995
> wilcox.test(x,y)

    Wilcoxon rank sum test

data:  x and y
W = 82, p-value = 0.4824
alternative hypothesis: true location shift is not equal to 0

# разница средних в двойку
> y<- rnorm(14, mean=12, sd=3)
> quantile(replicate(10000,{median(sample(x,replace=T))-median(sample(y, replace=T))}), probs=c(0.025,0.975))
      2.5%      97.5%
-5.2140838 -0.2325372
> wilcox.test(x,y)

    Wilcoxon rank sum test

data:  x and y
W = 44, p-value = 0.01225
alternative hypothesis: true location shift is not equal to 0


могу для нескольких тысяч выборок померить

Код
> myboot<- function() {y<- rnorm(14, mean=12, sd=2); x<- rnorm(14, mean=10, sd=3); quantile(replicate(50000,{median(sample(x,replace=T))-median(sample(y, replace=T))}), probs=c(0.025,0.975))}
> res<-t(replicate(10, myboot()))
> res
           2.5%       97.5%
[1,] -3.104478  0.14690058
[2,] -6.622822  0.05973764
[3,] -6.067967  0.96743764
[4,] -3.457648  0.26662474
[5,] -3.285487 -0.16331415
[6,] -4.390996  0.06133141
[7,] -4.249600  0.09326860
[8,] -4.590740  1.95287078
[9,] -3.746031  2.56287750
[10,] -4.196681  1.75849708

> mybootwilk<- function() {y<- rnorm(14, mean=12, sd=2); x<- rnorm(14, mean=10, sd=3); wilcox.test(x,y)$p.value}
> median(replicate(10000, mybootwilk()))
[1] 0.05561668
> median(replicate(10000, mybootwilk()))
[1] 0.05561668
# уточняем p

> myboot<- function() {y<- rnorm(14, mean=12, sd=2); x<- rnorm(14, mean=10, sd=3); quantile(replicate(50000,{median(sample(x,replace=T))-median(sample(y, replace=T))}), probs=c(0.0275,1-0.0275))}
> res<-t(replicate(10, myboot()))
> res
          2.75%     97.25%
[1,] -4.098519  1.7192591
[2,] -3.987215 -0.6221029
[3,] -4.101456  1.8097771
[4,] -5.788873 -1.1529228
[5,] -3.936034  0.9987194
[6,] -5.046146  0.5629243
[7,] -4.713068  0.9795264
[8,] -6.540963 -2.9175392
[9,] -5.028686 -1.4414632
[10,] -4.000477 -0.1035011


вполне себе совпадает мощность теста рангового с мощностью бутстрепа разности медиан.
DrgLena
Давайте конкретно, я пишу, что медианы могут совпадать, но это не значит, что нет различий в группах. Например, есть две группы с оценками 1,2,3 балла.
1 гр. n=10 ( 1 балл у 9 больных и у одного 2 балла) ? итог лечения, например
2 гр. n=7 (1 балл у 4 больных и у трех больных 3 балла)

Вы сможете сделать вывод, что эффективность лечения в двух группах одинакова ? 1 ? полное выздоровление, 3 ? инвалидность. Это к примеру, я не знаю, что они баллами обозначают. Я представила все данные, в которых есть максимальная информация для читателя. Да, медианы совпадают, но рецензент на основании этого не должен соглашаться с выводом автора, что методики по эффективности лечения одинаковы.
Или, диссертант хочет доказать, что эффективность первой методики выше? Тогда, перебирая непараметрические критерии в любой программе можно найти критерий Уалда-Вольфовица, по которому есть желанное р<0,05 , правда он может не знать, что данный тест не пригоден для переменных с малым числом категорий. Что же должен делать рецензент?
p2004r
Цитата(DrgLena @ 17.04.2013 - 11:41) *
Давайте конкретно, я пишу, что медианы могут совпадать, но это не значит, что нет различий в группах. Например, есть две группы с оценками 1,2,3 балла.
1 гр. n=10 ( 1 балл у 9 больных и у одного 2 балла) ? итог лечения, например
2 гр. n=7 (1 балл у 4 больных и у трех больных 3 балла)

Вы сможете сделать вывод, что эффективность лечения в двух группах одинакова ? 1 ? полное выздоровление, 3 ? инвалидность. Это к примеру, я не знаю, что они баллами обозначают. Я представила все данные, в которых есть максимальная информация для читателя. Да, медианы совпадают, но рецензент на основании этого не должен соглашаться с выводом автора, что методики по эффективности лечения одинаковы.
Или, диссертант хочет доказать, что эффективность первой методики выше? Тогда, перебирая непараметрические критерии в любой программе можно найти критерий Уалда-Вольфовица, по которому есть желанное р<0,05 , правда он может не знать, что данный тест не пригоден для переменных с малым числом категорий. Что же должен делать рецензент?


А что делать? Все не значимо, даже для таких вырожденных случаев. Просто чуть сложнее доверительный интервал оценивать приходится. Вот тремя способами оценка получена, во всех трех интервалы взаимопоглощаются -> на уровне значимости 0.95 отличий нет.

Код
> library(boot)
> my.median<-function(data,i) median(data[i])
> x<-c(rep(1,9),2)
> boot.ci(boot(x, my.median,R=100000), conf=0.95, type = c("norm", "basic", "perc"))
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 100000 bootstrap replicates

CALL :
boot.ci(boot.out = boot(x, my.median, R = 1e+05), conf = 0.95,
    type = c("norm", "basic", "perc"))

Intervals :
Level      Normal              Basic              Percentile    
95%   ( 0.9538,  1.0444 )   ( 1.0000,  1.0000 )   ( 1.0000,  1.0000 )  
Calculations and Intervals on Original Scale
> y<-c(rep(1,4),rep(3,3))
> boot.ci(boot(y, my.median,R=100000), conf=0.95, type = c("norm", "basic", "perc"))
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 100000 bootstrap replicates

CALL :
boot.ci(boot.out = boot(y, my.median, R = 1e+05), conf = 0.95,
    type = c("norm", "basic", "perc"))

Intervals :
Level      Normal              Basic              Percentile    
95%   (-1.5491,  2.1744 )   (-1.0000,  1.0000 )   ( 1.0000,  3.0000 )  
Calculations and Intervals on Original Scale
DrgLena
А какой смысл городить ДИ к абсолютно равным медианам? Нужно просто показать, на каком уровне значимости имеются различия, пусть будет больше 5%, как, например, дает анализ таблицы сопряженности для этих данных. Но делать вывод о равенстве двух методик нельзя. В данном случае меня устроит вывод, что выялены различия в этих убогих группах только на 6% уровне. Но, если увеличить выборки, удвоив каждую (при таких же оценках), то получится оценка хи кв р=0,004. А это значит, что нужно данные добирать, а не делать неверные выводы на основании того , что медианы равны. Могу ошибаться...
p2004r

для того чтобы сделать такие выводы достаточно провести оценку по ожидаемой величине эффекта _до_ исследования. а все эти до исследования очень нехорошо. некоторые вон заставляют "достоверный" эксперимент дважды проводить. smile.gif кстати классное требование, раз просто отстреливать "тестировщиков" не разрешают smile.gif
DrgLena
Цитата(p2004r @ 18.04.2013 - 21:32) *
для того чтобы сделать такие выводы достаточно провести оценку по ожидаемой величине эффекта _до_ исследования.

Согласна, а потому подобные работы можно рассматривать только, как предварительные, на основании который и можно планировать проведение клинических испытаний, рассчитав необходимое число наблюдений.
anserovtv
Цитата(Ма га ита @ 12.04.2013 - 17:40) *
Татьяна, подскажите и мне . Если необходимо сравнить 2 группы по бальным шкалам между собой ( 1 мин, 3 макс) и изза малой выобрки ( n=11,12) мы можем использовать только непараметр критерии- то есть медиану и квартили,но в программе статистика выходят какие то очень кривые данные, можем ли мы как то еще их сравнить?

Если я правильно понял, бальные шкалы - это категории /номинативная переменная / и их ровно 3.
Для сравнения групп нужно использовать критерий хи-квадрат для таблиц сопряженности /сравнение распределений/ , одна из переменных - группирующая.При этом в SPSS будут генерированы и кластеризованные столбиковые диаграммы.Такие методы применяются часто в психологии.Таблица будет иметь размерность 2 на 3 или наоборот.
Если переменные непрерывны, то применяется двухвыборочный критерий Колмогорова-Смирнова для независимых выборок.

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.