Здравствуйте, гость ( Вход | Регистрация )
19.04.2014 - 23:34
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 15 Регистрация: 4.09.2013 Пользователь №: 25228 |
Добрый день, уважаемые коллеги. Подскажите пожалуйста, каким образом можно обработать результаты проведенного исследования.
Цель исследования заключалась в том, чтобы доказать, что в определенной больнице кодироание диагнозов по МКБ осуществляется некорректно. Для этого была выбрана группа интересующих нас диагнозов за последние два года, таким образом получилось что-то подобное: КодМКБ1 - 150 человек КодМКБ2 - 3 человека КодМКБ3 - 250 человек и т.д. Далее в течение трех месяцев детально обследовались люди, которые лежали в тот момент в стационаре, им ставился корректный диагноз, соответственно получился еще один ряд значений: КодМКБ1 - 0 человек КодМКБ2 - 20 человек и т.д. Можно ли сделать вывод на основании подобных данных о корректности кодировки диагноза за последние два года и если да, то каким образом провести анализ. |
|
|
![]() |
![]() |
![]() |
23.04.2014 - 20:18
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
(У вас - зависимые выборки, т.к. один и тот же человек присутствует одновремнно в двух диагностиках. Критерии типа хи-квадрат здесь не уместны, зависимые частоты сравниваются критериями на симметрию. Суть примерно такова. Создаётся таблица, где по строкам располагаются диагнозы истинные, а в колонках - те же названия для диагнозов, но выставленных в клинике. Она заполняется абсолютными частотами (в штуках) конкретных случаев диагностики (не сгруппированных как у вас). Если клиника выставляет диагнозы со 100%-ной точностью, то все значения окажутся на диагонали такой таблицы. Если есть ошибки диагностики, то чем их больше, тем меньше будет значений на диагонали таблицы (истинный и выставленный диагнозы совпадают), и тем больше их станет над и под диагональю (истинный и выставленный диагнозы не совпадают). Такая таблица позволит наглядно отобразить какие диагнозы выставляются неправильно и с чем путаются. Обсчитать статистическую значимость различий в диагностике целиком по такой таблице можно с помощью критерия Бокера (Bowker's test of symmetry). Однако не будет ответа по отдельным диагнозам.
Далее можно разделить задачу на несколько - по числу конкретных диагнозов. Принцип организации таблиц - тот же, но только строк и столбцов -2: КодМКБ1 и Прочие коды - одна таблица, КодМКБ2 и Прочие коды - вторая таблица и т.д. Такие таблицы обычно анализируют критерием Мак-Немара (McNemar's test); материалов в сети много, обсуждался и на этом фуруме. Т.о. для статистического анализа выших данных нужны правильно заполненные таблицы. Если сведёте данные как надо - поищем программу. А по приведённым вами суммарным данным можно посчитать только % несоответствий по каждому диагнозу, нельзя даже сказать что с чем и как часто путается.) >p2004r. Идея рандомизационного теста понятна, но идея очень голая, её бы одеть в какой-нибудь код:) Задача понята мной неверно, пост не стираю, но беру в скобки. Сообщение отредактировал nokh - 25.04.2014 - 00:22 |
|
|
![]() |
![]() |
23.04.2014 - 22:00
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
>p2004r. Идея рандомизационного теста понятна, но идея очень голая, её бы одеть в какой-нибудь код:) Пусть за два года получили 10 диагнозов A , 50 B, 150 C. Код > > data <- factor(c(rep("A", 10), ## исходные данные за два года rep("B", 50), rep("C", 150))) > apply(replicate(10000, ## число перевыборок из исходной совокупности table(sample(data, ## исходная совокупность за два года 30))), ## размер контрольной выборки 1, ## считать по строкам quantile, probs = c(2.5, 50, 98.5)/100) ## считать на указанные перцентили A B C 2.5% 0 3 17 50% 1 7 21 98.5% 4 12 26 чёртова табуляция По сути дела quantile() считают по строчкам вот такого результата перевыборок: Код > replicate(10, table(sample(data, 30))) [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] A 2 1 2 2 3 1 0 1 0 3 B 11 6 2 10 7 7 9 7 6 8 C 17 23 26 18 20 22 21 22 24 19 PS опять 98.5 написал PPS надо приучить себя к практике писать 100-5/2 PPPS у sample() пропустил ключ replace = TRUE Сообщение отредактировал p2004r - 24.04.2014 - 10:21 ![]() |
|
|
![]() |
![]() |
dr.MIG Две группы, как анализировать 19.04.2014 - 23:34
p2004r Цитата(dr.MIG @ 19.04.2014 - 23:34) ... 20.04.2014 - 16:29
100$ Цитата(p2004r @ 20.04.2014 - 17:29) ... 23.04.2014 - 20:59
p2004r Цитата(nokh @ 23.04.2014 - 20:18) У ... 23.04.2014 - 22:23
dr.MIG Цитата(p2004r @ 23.04.2014 - 23:23) ... 24.04.2014 - 21:27
nokh Цитата(p2004r @ 24.04.2014 - 01:23) ... 24.04.2014 - 22:14
p2004r Цитата(nokh @ 24.04.2014 - 22:14) Не... 24.04.2014 - 23:56
nokh Что-то я затупил! Прошу прощения! Видимо... 25.04.2014 - 00:14
p2004r Цитата(nokh @ 25.04.2014 - 00:14) Чт... 25.04.2014 - 10:47
p2004r Цитата(nokh @ 25.04.2014 - 00:14) Чт... 25.04.2014 - 11:35
p2004r Вот "дополнительные слои" в пирамиду О... 25.04.2014 - 14:14
nokh Подход, предлагаемый р2004r, буду осмысливать по м... 27.04.2014 - 20:24
p2004r Цитата(nokh @ 27.04.2014 - 20:24) ... 28.04.2014 - 23:22
nokh Благодарю! скопировал все себе, буду разбирать... 29.04.2014 - 04:37
Liz "nokh: Можно обычным хи-квадратом сравнить... 29.04.2014 - 18:08
dr.MIG Спасибо большое, за столь подробное обсуждение.
Я ... 17.05.2014 - 21:08
nokh Цитата(dr.MIG @ 18.05.2014 - 00:08) ... 25.05.2014 - 14:51
dr.MIG Всем огромное спасибо за обсуждение! 28.05.2014 - 20:11![]() ![]() |