А работает ли аппарат?, ... или изгнание бесов при помощи статистики |
Здравствуйте, гость ( Вход | Регистрация )
А работает ли аппарат?, ... или изгнание бесов при помощи статистики |
12.12.2014 - 12:25
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 12.12.2014 Пользователь №: 26886 |
Прошу помощи в статистической обработке материала.
Почему в подзаголовок попали "бесы": есть аппарат, который имеет признаки "лженауки". Итак, исходные данные. Имеется аппарат, который неизвестным науке способом (по заявлению производителей на основании "информативности температуры в определенных точках тела") определяет "131 параметр жизнедеятельности организма человека". В том числе, данное чудо научной (лженаучной?) мысли "показывает" параметры, которые определяются рутинными лабораторными методами. Быть может, мой ироничный настрой ошибочен и мы имеем научный прорыв, либо данный агрегат годится только для наукообразного "шаманства". Задача: подтвердить или опровергнуть работоспособность аппарата. Исходные данные: имеются результаты полученные при помощи аппарата и рутинными лабораторными методиками. У каждого пациента выбранный параметр определялся как в лаборатории, так и на аппарате. "На глаз" видно, что показатели полученные в лаборатории и при помощи "чудо-агрегата" заметно отличаются, как в сторону завышенных, так и заниженных данных (если за эталон взять лабораторию). Для примера фрагмент с данными по гемоглобину (ниже). Первая колонка - показатель гемоглобина, определенный в лаборатории, вторая колонка - у тех же пациентов на "чудо-аппарате". Вопрос: как статистически подтвердить (или опровергнуть) наличие существенных отклонений в показателях? Гемоглобин_лаб Гемоглобин 116---------------------139,2 146---------------------160 149---------------------136 121---------------------132 115---------------------153,79 121---------------------135,35 131---------------------125,48 142---------------------77,74 131---------------------155,15 127---------------------143,38 155---------------------136,21 163---------------------149,47 130---------------------100,12 134---------------------133,47 Сообщение отредактировал Insaniens - 12.12.2014 - 12:32 |
|
12.12.2014 - 13:34
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Учебные задачки надо самому решать вообщето.
А так вот например --- рандомизацией получаем перцентили необходимые для отбрасывания "нулевой гипотезы" о отсутствии связи. Критерий не достигает реальное значение --- значит связь не может быть доказана. Отстутвие связи доказать значительно сложнее, так как она может быть очень незначительная и потребуется значительно большая группа (её размер вы думаю посчитаете сами?) Код > quantile(replicate(10000, cor(gembn$Гемоглобин, sample(gembn$Гемоглобин_лаб))), probs=c(0.025,0.5,0.975)) 2.5% 50% 97.5% -0.55839229 0.01049748 0.50118705 > quantile(replicate(100000, cor(gembn$Гемоглобин, sample(gembn$Гемоглобин_лаб))), probs=c(0.025,0.5,0.975)) 2.5% 50% 97.5% -0.56194921 0.01313884 0.49301626 > quantile(replicate(100000, cor(gembn$Гемоглобин, sample(gembn$Гемоглобин_лаб))), probs=c(0.025,0.5,0.975)) 2.5% 50% 97.5% -0.56014658 0.01265719 0.49350855 > quantile(replicate(1000000, cor(gembn$Гемоглобин, sample(gembn$Гемоглобин_лаб))), probs=c(0.025,0.5,0.975)) 2.5% 50% 97.5% -0.55927770 0.01301754 0.49402244 Ладно, вот так можно определеить объем выборки для "доказательсва значимости" такого небольшого по ожидаемой величине эффекта (естетственно что и сам эффект будет меняться и ещё как Код > quantile(replicate(10000, cor(c(gembn$Гемоглобин, gembn$Гемоглобин), sample(c(gembn$Гемоглобин_лаб, gembn$Гемоглобин_лаб)))), probs=c(0.025,0.5,0.975))
2.5% 50% 97.5% -0.3871983241 -0.0001393141 0.3637828166 > quantile(replicate(10000, cor(c(gembn$Гемоглобин, gembn$Гемоглобин), sample(c(gembn$Гемоглобин_лаб, gembn$Гемоглобин_лаб)))), probs=c(0.025,0.5,0.975)) 2.5% 50% 97.5% -0.384000417 0.006484305 0.362028738 > quantile(replicate(10000, cor(c(gembn$Гемоглобин, gembn$Гемоглобин, gembn$Гемоглобин), sample(c(gembn$Гемоглобин_лаб, gembn$Гемоглобин_лаб, gembn$Гемоглобин_лаб)))), probs=c(0.025,0.5,0.975)) 2.5% 50% 97.5% -0.308052837 0.004971756 0.300314873 |
|
13.12.2014 - 13:31
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Задача: подтвердить или опровергнуть работоспособность аппарата. Я бы подсчитал по Вашим данным выборочную дисперсию чудо-аппарата и сравнил ее с дисперсией стандартных лабораторных измерений, которую из ваших данных получить нельзя, но она должна быть указана в спецификациях к прибору. Если дисперсии отличаются не очень сильно, то чудо работает хорошо, если дисперсия чуда много больше лабораторной дисперсии, то плохо.
Сообщение отредактировал DoctorStat - 13.12.2014 - 13:35 Просто включи мозги => http://doctorstat.narod.ru
|
|
13.12.2014 - 15:55
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 12.12.2014 Пользователь №: 26886 |
Учебные задачки надо самому решать вообщето. Проблема в том, что я из тех, кто по меткому выражению одного коллеги "пошел в медицину по причине того, что не дружил с математикой" Мне кажется, что каждый должен заниматься своим делом: врач - лечить, статист - заниматься обработкой материала, научный работник - планировать (вместе со статистом) и проводить исследование. В нашей стране сложилось, что врач/исследователь/статист - порой одно лицо. Полностью согласен, что качество многих работ в медицине в плане статистики удручает. С одной стороны - дефект образования, с другой - дефицит статистов. В скромном городе, где я живу не знаю ни одного человека, который мог бы назвать себя специалистом в области медицинской статистики... Посоветоваться не с кем. Учиться не у кого. Поехать в Мск? Контора не финансирует, своих средств не хватает. Приходится выкручиваться... Это вступление. По теме. Подсказку я ожидал примерно такую. Возьмите данные, программу "Статистика" и сравните при помощи такого-то критерия. Размер группы, несомненно, больше, чем я привел и может быть увеличен... |
|
13.12.2014 - 15:56
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 12.12.2014 Пользователь №: 26886 |
Я бы подсчитал по Вашим данным выборочную дисперсию чудо-аппарата и сравнил ее с дисперсией стандартных лабораторных измерений, которую из ваших данных получить нельзя, но она должна быть указана в спецификациях к прибору. Если дисперсии отличаются не очень сильно, то чудо работает хорошо, если дисперсия чуда много больше лабораторной дисперсии, то плохо. Так было бы правильнее (как мне кажется), но есть технические сложности в плане выяснения спецификаций приборов. Да и моя задача скромнее: есть взаимосвязь между двумя вариантами показателей или её нет. |
|
13.12.2014 - 17:33
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Преамбула:
Ну вот редкий из "медистов" спросит что то полезное у "статистов" Амбула: Если что, то приведенные вами циферки и были посчитатны. В вашей контрофактной стаитсике написанное исполнимо, посколку R туда уже давно встроен. Исходная постановка вопроса неразрешима принципиально. Но величина связи между измерениями крайне близкая 0 говорит, что методы дают практически не связанные результаты. Постскриптум: А бедные вы оттого, что воруете всякую гадость, типа "статистики". |
|
13.12.2014 - 20:19
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 12.12.2014 Пользователь №: 26886 |
Преамбула: Ну вот редкий из "медистов" спросит что то полезное у "статистов" Я бы не стал обобщать. Люди разные. Если бы в доступе был специалист по статистике (понял мягкий намек на неологизм/жаргонизм ) я бы с великим удовольствием советовался/сотрудничал. Не раз слышал от врачей и преподавателей мед. ВУЗов, что статистика есть зло и ненужное мудрствование. Категорически не согласен. Амбула: Если что, то приведенные вами циферки и были посчитатны. Это я понял. Но циферок у меня больше, а как посчитать другие параметры из приведенной схемы не понял. Ибо "медист" Постскриптум: А бедные вы оттого, что воруете всякую гадость, типа "статистики". В смысле? Программа "статистика"? Дак не ворую. Институт купил. То, что пользуюсь не совсем вникая в смысл... ну, да, есть такая проблема. Каюсь, виноват. Причина указана выше: обучаться негде. |
|
13.12.2014 - 20:50
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Это я понял. Но циферок у меня больше, а как посчитать другие параметры из приведенной схемы не понял. Ибо "медист" В смысле? Программа "статистика"? Дак не ворую. Институт купил. То, что пользуюсь не совсем вникая в смысл... ну, да, есть такая проблема. Каюсь, виноват. Причина указана выше: обучаться негде. 1. Приведенный пример полностью исполнимый в среде R, она встроена в последние версии статистики (но и свободно доступна сама по себе) http://cran.r-project.org/ 2. Институт способный вывалить 8 штук баксов за программу может и потратить меньшие суммы на найм(обучение) специалиста по анализу данных |
|
14.12.2014 - 14:30
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 10 Регистрация: 12.12.2014 Пользователь №: 26886 |
2. Институт способный вывалить 8 штук баксов за программу может и потратить меньшие суммы на найм(обучение) специалиста по анализу данных А Вы не замечали, что в России регулярно сначала покупается оборудование, а затем возникает понимание, что на нем некому работать? Из последних примеров: в одной больнице нашего города был приобретен аппарат искусственной вентиляции легких. Причем не абы какой, а самый "продвинутый" на тот момент в городе. Сначала администрация учреждения хвалилась и ставила себе в заслугу покупку прекрасного оборудования. Потом возник вопрос: зачем ИВЛ в больнице, где нет отделения реанимации? О чем думали, когда тратили деньги - мне неведомо. В итоге оборудование по-тихому передали в другую больницу. И это не единичный пример. Вспомните хотя бы целую серию публикаций о покупке аппаратов МРТ (очень дорогих) для маленьких больниц, где нет ни одного специалиста, владеющего такой техникой. PS: приобреталась не самая свежая версия, цена (насколько мне известно) около 1000 $. Если верить оф. сайту STATISTICA скидки для ВУЗов до 65%. Когда покупали, в институте был специалист, знающий с какой стороны подойти. На данный момент уволился. PPS: не сочтите за флуд. |
|
27.12.2014 - 07:07
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 143 Регистрация: 4.09.2012 Пользователь №: 24146 |
|
|
27.12.2014 - 13:27
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|
27.12.2014 - 16:19
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
В связи с чем у меня вопрос: кто же вас научил считать к-т корреляции для связанных выборок? ну для независимых выборок посчитать точно не получиться а так да, лонгитудинальные данные имеют весьма забавные коэфициенты корреляции, но 1) конкретно это не тот случай (это скорее кросскорреляция) 2) автокорреляция для временных рядов весьма ценный метод |
|
27.12.2014 - 18:08
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
?Статисты? ?сатанисты продолжают издеваться над медистами, предлагая все более изощренные методы статистического анализа.
Причем тут корреляции или автокорреляции, ошибки не обязаны быть систематическими, вы много хотите от шаманского прибора. Медист может не дружить со статистом , но он должен сформулировать задачу в своей медицинской области. Прежде всего, озадачиться вопросом, какова должна быть для него точность информации, которую выдает чудо прибор по множеству показателей. Для гемоглобина существует широкий диапазон нормы. Норма, ниже и выше нормы ? возможно это вполне достаточная информация. В этом случае можно сравнить доли этих категорий при двух методах анализа. Возможно, для экспресс анализа выявления анемии , это устроит, но не устроит для мониторинга лечения анемии. Если нужно оценить сходимость двух оценок уровня гемоглобина, то тогда нужно анализировать разницу для каждой пары наблюдений. Она вас устраивает? Классика статистики не отменена , а потому нужно начать с анализа выбросов в каждом ряду. Любители Statistica могут использовать критерий Граббса и удалить пару со значением 77. А если имеются внушительные ряды данных, то пошаманить с индустриальной статистикой в этом же пакете, контроль качества. Что есть брак, выброс, а что анемия ? вам решать. Простым визуальным методом, анализирующим расхождения двух методов измерения, являются Юден графики. Систематические, случайные и тотальные ошибки увидите сами. http://www.medcalc.org/manual/youdenplot.php На форуме уже обсуждались. |
|
27.12.2014 - 19:44
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
А вообще очень забавно:
1. Критерий типа омега-квадрат (Орлова): р=,89. Гипотеза симметричности функции распределения попарных разностей относительго нуля не отвергается. 2. Критерий однородности математических ожиданий для связанных выборок: р=,49. Гипотеза однородности мат. ожиданий не отвергается. 3. Критерий знаковых рангов Уилкоксона: z=,35. Нулевая гипотеза не отвергается. Резюме: атличный прибор. Удалил пару наблюдений (в рамках метода "складного ножа") 142 --- 77.74 Резюме: атличный прибор. А вот AtteStat с критерием рандомизации для связанных выборок облажался. Сообщение отредактировал 100$ - 27.12.2014 - 19:52 |
|
28.12.2014 - 13:55
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 143 Регистрация: 4.09.2012 Пользователь №: 24146 |
|
|