Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: А работает ли аппарат?
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Страницы: 1, 2
Insaniens
Прошу помощи в статистической обработке материала.

Почему в подзаголовок попали "бесы": есть аппарат, который имеет признаки "лженауки". Итак, исходные данные. Имеется аппарат, который неизвестным науке способом (по заявлению производителей на основании "информативности температуры в определенных точках тела") определяет "131 параметр жизнедеятельности организма человека". В том числе, данное чудо научной (лженаучной?) мысли "показывает" параметры, которые определяются рутинными лабораторными методами.

Быть может, мой ироничный настрой ошибочен и мы имеем научный прорыв, либо данный агрегат годится только для наукообразного "шаманства".

Задача: подтвердить или опровергнуть работоспособность аппарата.

Исходные данные: имеются результаты полученные при помощи аппарата и рутинными лабораторными методиками. У каждого пациента выбранный параметр определялся как в лаборатории, так и на аппарате. "На глаз" видно, что показатели полученные в лаборатории и при помощи "чудо-агрегата" заметно отличаются, как в сторону завышенных, так и заниженных данных (если за эталон взять лабораторию). Для примера фрагмент с данными по гемоглобину (ниже). Первая колонка - показатель гемоглобина, определенный в лаборатории, вторая колонка - у тех же пациентов на "чудо-аппарате".

Вопрос: как статистически подтвердить (или опровергнуть) наличие существенных отклонений в показателях?



Гемоглобин_лаб Гемоглобин
116---------------------139,2
146---------------------160
149---------------------136
121---------------------132
115---------------------153,79
121---------------------135,35
131---------------------125,48
142---------------------77,74
131---------------------155,15
127---------------------143,38
155---------------------136,21
163---------------------149,47
130---------------------100,12
134---------------------133,47
p2004r
Учебные задачки надо самому решать вообщето.

А так вот например --- рандомизацией получаем перцентили необходимые для отбрасывания "нулевой гипотезы" о отсутствии связи. Критерий не достигает реальное значение --- значит связь не может быть доказана.

Отстутвие связи доказать значительно сложнее, так как она может быть очень незначительная и потребуется значительно большая группа (её размер вы думаю посчитаете сами?)

Код
> quantile(replicate(10000, cor(gembn$Гемоглобин, sample(gembn$Гемоглобин_лаб))), probs=c(0.025,0.5,0.975))
       2.5%         50%       97.5%
-0.55839229  0.01049748  0.50118705
> quantile(replicate(100000, cor(gembn$Гемоглобин, sample(gembn$Гемоглобин_лаб))), probs=c(0.025,0.5,0.975))
       2.5%         50%       97.5%
-0.56194921  0.01313884  0.49301626
> quantile(replicate(100000, cor(gembn$Гемоглобин, sample(gembn$Гемоглобин_лаб))), probs=c(0.025,0.5,0.975))
       2.5%         50%       97.5%
-0.56014658  0.01265719  0.49350855
> quantile(replicate(1000000, cor(gembn$Гемоглобин, sample(gembn$Гемоглобин_лаб))), probs=c(0.025,0.5,0.975))
       2.5%         50%       97.5%
-0.55927770  0.01301754  0.49402244


Ладно, вот так можно определеить объем выборки для "доказательсва значимости" такого небольшого по ожидаемой величине эффекта (естетственно что и сам эффект будет меняться и ещё как smile.gif

Код
> quantile(replicate(10000, cor(c(gembn$Гемоглобин, gembn$Гемоглобин), sample(c(gembn$Гемоглобин_лаб, gembn$Гемоглобин_лаб)))), probs=c(0.025,0.5,0.975))
         2.5%           50%         97.5%
-0.3871983241 -0.0001393141  0.3637828166
> quantile(replicate(10000, cor(c(gembn$Гемоглобин, gembn$Гемоглобин), sample(c(gembn$Гемоглобин_лаб, gembn$Гемоглобин_лаб)))), probs=c(0.025,0.5,0.975))
        2.5%          50%        97.5%
-0.384000417  0.006484305  0.362028738
> quantile(replicate(10000, cor(c(gembn$Гемоглобин, gembn$Гемоглобин, gembn$Гемоглобин), sample(c(gembn$Гемоглобин_лаб, gembn$Гемоглобин_лаб, gembn$Гемоглобин_лаб)))), probs=c(0.025,0.5,0.975))
        2.5%          50%        97.5%
-0.308052837  0.004971756  0.300314873
DoctorStat
Цитата(Insaniens @ 12.12.2014 - 12:25) *
Задача: подтвердить или опровергнуть работоспособность аппарата.
Я бы подсчитал по Вашим данным выборочную дисперсию чудо-аппарата и сравнил ее с дисперсией стандартных лабораторных измерений, которую из ваших данных получить нельзя, но она должна быть указана в спецификациях к прибору. Если дисперсии отличаются не очень сильно, то чудо работает хорошо, если дисперсия чуда много больше лабораторной дисперсии, то плохо.
Insaniens
Цитата(p2004r @ 12.12.2014 - 13:34) *
Учебные задачки надо самому решать вообщето.

Проблема в том, что я из тех, кто по меткому выражению одного коллеги "пошел в медицину по причине того, что не дружил с математикой"
Мне кажется, что каждый должен заниматься своим делом: врач - лечить, статист - заниматься обработкой материала, научный работник - планировать (вместе со статистом) и проводить исследование.
В нашей стране сложилось, что врач/исследователь/статист - порой одно лицо. Полностью согласен, что качество многих работ в медицине в плане статистики удручает. С одной стороны - дефект образования, с другой - дефицит статистов. В скромном городе, где я живу не знаю ни одного человека, который мог бы назвать себя специалистом в области медицинской статистики... Посоветоваться не с кем. Учиться не у кого. Поехать в Мск? Контора не финансирует, своих средств не хватает. Приходится выкручиваться...

Это вступление.

По теме. Подсказку я ожидал примерно такую. Возьмите данные, программу "Статистика" и сравните при помощи такого-то критерия. Размер группы, несомненно, больше, чем я привел и может быть увеличен...
Insaniens
Цитата(DoctorStat @ 13.12.2014 - 13:31) *
Я бы подсчитал по Вашим данным выборочную дисперсию чудо-аппарата и сравнил ее с дисперсией стандартных лабораторных измерений, которую из ваших данных получить нельзя, но она должна быть указана в спецификациях к прибору. Если дисперсии отличаются не очень сильно, то чудо работает хорошо, если дисперсия чуда много больше лабораторной дисперсии, то плохо.


Так было бы правильнее (как мне кажется), но есть технические сложности в плане выяснения спецификаций приборов. Да и моя задача скромнее: есть взаимосвязь между двумя вариантами показателей или её нет.
p2004r
Преамбула:
Ну вот редкий из "медистов" спросит что то полезное у "статистов"

Амбула:
Если что, то приведенные вами циферки и были посчитатны. В вашей контрофактной стаитсике написанное исполнимо, посколку R туда уже давно встроен.
Исходная постановка вопроса неразрешима принципиально. Но величина связи между измерениями крайне близкая 0 говорит, что методы дают практически не связанные результаты.

Постскриптум:
А бедные вы оттого, что воруете всякую гадость, типа "статистики".

Insaniens
Цитата(p2004r @ 13.12.2014 - 17:33) *
Преамбула:
Ну вот редкий из "медистов" спросит что то полезное у "статистов"

Я бы не стал обобщать. Люди разные. Если бы в доступе был специалист по статистике (понял мягкий намек на неологизм/жаргонизм rolleyes.gif ) я бы с великим удовольствием советовался/сотрудничал. Не раз слышал от врачей и преподавателей мед. ВУЗов, что статистика есть зло и ненужное мудрствование. Категорически не согласен.

Цитата(p2004r @ 13.12.2014 - 17:33) *
Амбула:
Если что, то приведенные вами циферки и были посчитатны.

Это я понял. Но циферок у меня больше, а как посчитать другие параметры из приведенной схемы не понял. Ибо "медист" insane.gif

Цитата(p2004r @ 13.12.2014 - 17:33) *
Постскриптум:
А бедные вы оттого, что воруете всякую гадость, типа "статистики".

В смысле? Программа "статистика"? Дак не ворую. Институт купил. То, что пользуюсь не совсем вникая в смысл... ну, да, есть такая проблема. Каюсь, виноват. Причина указана выше: обучаться негде.
p2004r
Цитата(Insaniens @ 13.12.2014 - 20:19) *
Это я понял. Но циферок у меня больше, а как посчитать другие параметры из приведенной схемы не понял. Ибо "медист" insane.gif


В смысле? Программа "статистика"? Дак не ворую. Институт купил. То, что пользуюсь не совсем вникая в смысл... ну, да, есть такая проблема. Каюсь, виноват. Причина указана выше: обучаться негде.


1. Приведенный пример полностью исполнимый в среде R, она встроена в последние версии статистики (но и свободно доступна сама по себе) http://cran.r-project.org/

2. Институт способный вывалить 8 штук баксов за программу может и потратить меньшие суммы на найм(обучение) специалиста по анализу данных smile.gif
Insaniens
Цитата(p2004r @ 13.12.2014 - 20:50) *
2. Институт способный вывалить 8 штук баксов за программу может и потратить меньшие суммы на найм(обучение) специалиста по анализу данных smile.gif


А Вы не замечали, что в России регулярно сначала покупается оборудование, а затем возникает понимание, что на нем некому работать? Из последних примеров: в одной больнице нашего города был приобретен аппарат искусственной вентиляции легких. Причем не абы какой, а самый "продвинутый" на тот момент в городе. Сначала администрация учреждения хвалилась и ставила себе в заслугу покупку прекрасного оборудования. Потом возник вопрос: зачем ИВЛ в больнице, где нет отделения реанимации? О чем думали, когда тратили деньги - мне неведомо. В итоге оборудование по-тихому передали в другую больницу. И это не единичный пример. Вспомните хотя бы целую серию публикаций о покупке аппаратов МРТ (очень дорогих) для маленьких больниц, где нет ни одного специалиста, владеющего такой техникой.

PS: приобреталась не самая свежая версия, цена (насколько мне известно) около 1000 $. Если верить оф. сайту STATISTICA скидки для ВУЗов до 65%. Когда покупали, в институте был специалист, знающий с какой стороны подойти. На данный момент уволился.

PPS: не сочтите за флуд.
Диагностик
Цитата(Insaniens @ 12.12.2014 - 17:25) *
Прошу помощи в статистической обработке материала.

Задача: подтвердить или опровергнуть работоспособность аппарата.

Коэффициент корреляции для ваших пар равен -0,010. Это говорит о полнейшем несоответствии измерений между собой.
100$
Цитата(Диагностик @ 27.12.2014 - 08:07) *
Коэффициент корреляции для ваших пар равен -0,010. Это говорит о полнейшем несоответствии измерений между собой.


В связи с чем у меня вопрос: кто же вас научил считать к-т корреляции для связанных выборок?
p2004r
Цитата(100$ @ 27.12.2014 - 13:27) *
В связи с чем у меня вопрос: кто же вас научил считать к-т корреляции для связанных выборок?


ну для независимых выборок посчитать точно не получиться smile.gif а так да, лонгитудинальные данные имеют весьма забавные коэфициенты корреляции, но 1) конкретно это не тот случай (это скорее кросскорреляция) 2) автокорреляция для временных рядов весьма ценный метод
DrgLena
?Статисты? ?сатанисты продолжают издеваться над медистами, предлагая все более изощренные методы статистического анализа.
Причем тут корреляции или автокорреляции, ошибки не обязаны быть систематическими, вы много хотите от шаманского прибора.
Медист может не дружить со статистом , но он должен сформулировать задачу в своей медицинской области. Прежде всего, озадачиться вопросом, какова должна быть для него точность информации, которую выдает чудо прибор по множеству показателей. Для гемоглобина существует широкий диапазон нормы. Норма, ниже и выше нормы ? возможно это вполне достаточная информация. В этом случае можно сравнить доли этих категорий при двух методах анализа. Возможно, для экспресс анализа выявления анемии , это устроит, но не устроит для мониторинга лечения анемии.
Если нужно оценить сходимость двух оценок уровня гемоглобина, то тогда нужно анализировать разницу для каждой пары наблюдений. Она вас устраивает? Классика статистики не отменена , а потому нужно начать с анализа выбросов в каждом ряду. Любители Statistica могут использовать критерий Граббса и удалить пару со значением 77. А если имеются внушительные ряды данных, то пошаманить с индустриальной статистикой в этом же пакете, контроль качества. Что есть брак, выброс, а что анемия ? вам решать.

Простым визуальным методом, анализирующим расхождения двух методов измерения, являются Юден графики. Систематические, случайные и тотальные ошибки увидите сами.
http://www.medcalc.org/manual/youdenplot.php
На форуме уже обсуждались.
100$
А вообще очень забавно:

1. Критерий типа омега-квадрат (Орлова): р=,89. Гипотеза симметричности функции распределения попарных разностей относительго нуля не отвергается.
2. Критерий однородности математических ожиданий для связанных выборок: р=,49. Гипотеза однородности мат. ожиданий не отвергается.
3. Критерий знаковых рангов Уилкоксона: z=,35. Нулевая гипотеза не отвергается.

Резюме: атличный прибор.

Удалил пару наблюдений (в рамках метода "складного ножа") 142 --- 77.74

Резюме: атличный прибор.

А вот AtteStat с критерием рандомизации для связанных выборок облажался.
Диагностик
Цитата(100$ @ 28.12.2014 - 00:44) *
1. Критерий типа омега-квадрат (Орлова)

Не Орлова, а Смирнова-Крамера-фон Мизеса.
100$! А почему вы всегда так рьяно выступаете за профессора А.И.Орлова? Вы его клон здесь или сынка его?
100$
Цитата(Диагностик @ 28.12.2014 - 14:55) *
Не Орлова, а Смирнова-Крамера-фон Мизеса.


Уважаемый знаток, семейство критериев типа омега-квадрат многочисленно: тут тебе и Крамера-Мизеса -Смирнова и Лемана - Розенблатта (все - для независимых выборок), и критерий типа омега-квадрат для проверки симметричности функции распределения относительно нуля (Орлова), что трактуется как однородность связанных выборок. Критерий описан в монографии Мартынова (с.44-45).
....
100$
Ну никак не дает мне модератор культурно пообщаться с тружениками жанра "Письмо к ученому соседу" (
p2004r
Цитата(100$ @ 29.12.2014 - 10:12) *
Ну никак не дает мне модератор культурно пообщаться с тружениками жанра "Письмо к ученому соседу" (


и все таки, как посчитать коэффициент корреляции для не "связанных выборок"?
100$
Цитата(p2004r @ 29.12.2014 - 13:37) *
и все таки, как посчитать коэффициент корреляции для не "связанных выборок"?


Что, 2004-й, уже начал отмечать Новый год? По принципу: кто празднику рад, тот накануне пьян?
Диагностик
Цитата(p2004r @ 29.12.2014 - 17:37) *
и все таки, как посчитать коэффициент корреляции для не "связанных выборок"?

Формально так же. Массивы по объёму должны совпадать. Только толку в этом никакого.
p2004r
Цитата(100$ @ 29.12.2014 - 13:41) *
Что, 2004-й, уже начал отмечать Новый год? По принципу: кто празднику рад, тот накануне пьян?


Жаль, Вы так многообещающе "ворвались в тред"... smile.gif
100$
Цитата(p2004r @ 29.12.2014 - 18:27) *
Жаль, Вы так многообещающе "ворвались в тред"... smile.gif


Председательствующий (наливает себе из графина):
-Жаль, что нам так и не удалось послушать начальника транспортного цеха.
Начальник транспортного цеха:
-Да, жаль.
Председательствующий:
-Но выговор мы ему все-таки запишем.
Начальник транспортного цеха:
-А как же! (с)
Диагностик
Цитата(Диагностик @ 27.12.2014 - 12:07) *
Коэффициент корреляции для ваших пар равен -0,010. Это говорит о полнейшем несоответствии измерений между собой.

Пусть Zi - истинное значение гемоглобина в крови у i-го пациента, а Хi и Yi это показания при этом Х и Y приборов. Тогда Zi=aiXi+bi=ciYi+di, где ai, bi, ci, di аддитивные и мультипликативные погрешности измерений. Отсюда очевидно что Y=eX+f и при малых погрешностях измерения коэффициент корреляции между этими значениями должен быть достаточно высок. Если бы ваши данные дали бы отличный от нуля коэффициент корреляции, можно было бы пойти дальше и проверять гипотезы что в Y=eX+f, e=1, и f=0. Но поскольку этого не случилось, то делаем вывод что один из применяемых вами приборов не пригоден для дальнейшей эксплуатации. Или оба.
100$
Цитата(Диагностик @ 1.01.2015 - 07:39) *
Пусть Zi - истинное значение гемоглобина в крови у i-го пациента, а Хi и Yi это показания при этом Х и Y приборов. Тогда Zi=aiXi+bi=ciYi+di, где ai, bi, ci, di аддитивные и мультипликативные погрешности измерений. Отсюда очевидно что Y=eX+f и при малых погрешностях измерения коэффициент корреляции между этими значениями должен быть достаточно высок. Если бы ваши данные дали бы отличный от нуля коэффициент корреляции, можно было бы пойти дальше и проверять гипотезы что в Y=eX+f, e=1, и f=0. Но поскольку этого не случилось, то делаем вывод что один из применяемых вами приборов не пригоден для дальнейшей эксплуатации. Или оба.


Вероятностно-статистическая модель порождения данных полностью ошибочна.
Если Zi=aiXi+bi=ciYi+di, то тут даже первоклассник сообразит, что при математическом ожидании погрешностей =0, математическое ожидание Zi по любой выборке будет равно 0.
Кроме того, из данной модели следует, что в нашем мире истинное значение гемоглобина пациента можно получить как линейную комбинацию случайных величин: Zi=aiXi+bi; Zi=ciYi+di.
Ребята, а ведь это уже на Нобелевку тянет.
Диагностик, срочно шей нобелевский фрак. Организационную суету я беру на себя. Меня на Нобелевский обед не забудь пригласить - и мы в расчете.

[Moderator on] Я в задумчивости... Но пока все даже как-то парадно smile.gif [Moderator off]
Олег Кравец
5 суток. Всем необходимо остыть и расслабиться. И мне тоже. Да, в Таллинне тоже есть интернет, если что.
p2004r
Цитата(Insaniens @ 12.12.2014 - 12:25) *
Прошу помощи в статистической обработке материала.

Почему в подзаголовок попали "бесы": есть аппарат, который имеет признаки "лженауки". Итак, исходные данные. Имеется аппарат, который неизвестным науке способом (по заявлению производителей на основании "информативности температуры в определенных точках тела") определяет "131 параметр жизнедеятельности организма человека". В том числе, данное чудо научной (лженаучной?) мысли "показывает" параметры, которые определяются рутинными лабораторными методами.

Быть может, мой ироничный настрой ошибочен и мы имеем научный прорыв, либо данный агрегат годится только для наукообразного "шаманства".

Задача: подтвердить или опровергнуть работоспособность аппарата.

Исходные данные: имеются результаты полученные при помощи аппарата и рутинными лабораторными методиками. У каждого пациента выбранный параметр определялся как в лаборатории, так и на аппарате. "На глаз" видно, что показатели полученные в лаборатории и при помощи "чудо-агрегата" заметно отличаются, как в сторону завышенных, так и заниженных данных (если за эталон взять лабораторию). Для примера фрагмент с данными по гемоглобину (ниже). Первая колонка - показатель гемоглобина, определенный в лаборатории, вторая колонка - у тех же пациентов на "чудо-аппарате".

Вопрос: как статистически подтвердить (или опровергнуть) наличие существенных отклонений в показателях?



Гемоглобин_лаб Гемоглобин
116---------------------139,2
146---------------------160
149---------------------136
121---------------------132
115---------------------153,79
121---------------------135,35
131---------------------125,48
142---------------------77,74
131---------------------155,15
127---------------------143,38
155---------------------136,21
163---------------------149,47
130---------------------100,12
134---------------------133,47


На самом деле в такой ситуации "точные значения" гемоглобина полученные неким референтным методом не очень нужны. Если перед нами действительно прибор что то измеряющий, то достаточно измерять одну и ту же группу испытуемых несколько раз подряд. В случае когда "прибор" "хоть что то" измеряет связанное с объектом измерения, мы получим стабильные результаты у одних и тех же объектов измерения, если у нас просто некий "генератор результатов", то стабильности в результатах не будет.

Удобно начинать именно с измерения стабильности, поскольку надежность измерительной процедуры, в любом случае, важнейшая характеристика любого измерительного прибора.
100$
Здесь надо для каждого пациента несколько раз измерить гемоглобин арбитражным методом и столько же - чудо-прибором, опосля чего протестировать полученные данные парным критерием Хотеллинга.
Тогда полученные при использовании этого многомерного аналога парного критерия Стьюдента разности: арбитражное значение минус значение по прибору можно интерпретировать как оценку погрешностей измерения чудесным прибором. Потому как при однократном замере на группе пациентов нулевая гипотеза однородности результатов не отвергается на 5%-ном уровне значимости.
Диагностик
Цитата(100$ @ 4.01.2015 - 03:11) *
Потому как при однократном замере на группе пациентов нулевая гипотеза однородности результатов не отвергается на 5%-ном уровне значимости.

Можете показать почему?
DrgLena
Цитата(Диагностик @ 4.01.2015 - 10:59) *
Можете показать почему?

Так уже показано 27.12.2014 - 19:44

Визуализация на картинках,

Всех с Новым Годом! Мира, дружбы и любви! smile.gif
Диагностик
Показано конечно и очень коряво, но почему Вы не учитываете что выборки связыны?
DrgLena
Цитата(Диагностик @ 4.01.2015 - 12:39) *
Показано конечно и очень коряво, но почему Вы не учитываете что выборки связыны?

Кто не учитывает, Юден? Он, может и не эстет, но и он и 100$ как раз связанность и анализируют.
Диагностик
Из их сообщений этого не следует.
DrgLena
Да уж, действительно забавно, не знаком ( по ссылке лень было сходить), но осуждаю этого самого Юдена с его корявыми графиками. За Юдена обидно, т.к. он уже не может сам за себя постоять. Метод описан в 1959 году, тем не менее:

This technique is now used in all measurement fields where interlaboratory agreement is important, and the term ?Youden plot? specifies not only the plotting technique but also the experimental procedure for sampling the performance of each laboratory through the results obtained on paired test items

Это как раз про корявые графики, которые я привела для участников форума, предварительно я дала ссылку на эту технику.

Аргументы 100$ статистически вполне обоснованы. Но бесы должны быть изгнаны медистами, а не статистами, если такая точность измерения им, медистам не подходит
DoctorStat
Цитата(DoctorStat @ 13.12.2014 - 13:31) *
Я бы подсчитал по Вашим данным выборочную дисперсию чудо-аппарата и сравнил ее с дисперсией стандартных лабораторных измерений, которую из ваших данных получить нельзя, но она должна быть указана в спецификациях к прибору. Если дисперсии отличаются не очень сильно, то чудо работает хорошо, если дисперсия чуда много больше лабораторной дисперсии, то плохо.
Решил проделать рекомендуемый мной анализ самостоятельно. Поиск в интернете дал стандартную ошибку измерения гемоглобина с помощью спектрофотометра в районе 3 г/л. Если чудо-прибор дает аналогичную точность или лучше, то делаем, как рекомендует наш "аля Далай Лама в медицине", а именно Гланц в книге "мед-био статистика" глава "Сравнение 2-х групп. Критерий Стъюдента", параграф в этой главе "Стандартное отклонение разности". Вкратце метод сводится к следующему. Вычитаем из лабораторных показателей (первый столбец) показатели тестируемого прибора (второй столбец) и помещаем разность в третий столбец. Для з-го столбца вычисляем стандартное отклонение (=26,5 (г/л) - выделено справа желтым). Если погрешности измерений лабораторным способом и прибором приблизительно одинаковы, то стандартное отклонение разности должно быть равно (внизу выделено желтым) = s0*sqrt(2)=3*1.4=4.24 (г/л) (см.Гланца). Видно, что реальное стандартное отклонение в 26/4=6 раз больше ожидаемого. Вычислим погрешность прибора. Суммируем дисперсии: 3^2 + x^2=26,5^2 . Отсюда x=26,3 (г/л). Следовательно прибор меряет гемоглобин в 26,3/3=9 раз хуже стандарта. Выкиньте его на свалку !
100$
Я исхожу из той вероятностно-статистической модели данных, что у каждого пациента в момент измерения гемоглобина есть его истинное значение (которое каждый прибор определяет с присущей ему степенью точности). Наличие в мат. модели измерения любым прибором ссылки на это самое истинное значение не позволяет считать эти измерения статистически независимыми. Оно и понятно: пациент-то один и тот же, сколькими бы приборами его не облепили.

Далее. Если взять математическое ожидание от моделей измерения, которые описаны в посте 23 (я по-прежнему утверждаю, что они кривые), то:
1. мат. ожидание измерения равно его истинному значению (иначе это не прибор, а металлолом).
2. мат. ожидание аддитивной погрешности равно нулю.
3. мат. ожидание истинного значения равно истинному значению (оно и понятно: истинное значение- детерминированная величина).
Числитель к-та корреляции представляет собой ковариацию сл. величин, т.е.: Истинное значение - Истинное значение= мат. ожидание аддитивной ошибки =0.
Иначе говоря, числитель к-та корреляции в случае зависимых (связанных выборок) равен произведению мат. ожиданий аддитивных погрешностей из обоих измерений, т. е. =0. Что нам и продемонстрировали.
Поэтому я утверждаю, что тестировать связанные выборки к-том корреляции (применительно к данной ситуации) - дурной тон.
Кроме того, известные к-ты корреляции (за исключением где-то встреченного мной параболического) линейны. А если статистическая связь двух измерений разными приборами нелинейна, то Пирсоном, Фехнером, Спирменом и Кендаллом ничего получить нельзя.

Ну и на сладкое цитатка из рускоязычной Вики:

Если X,Y независимые случайные величины, то R{X,Y} = 0. Обратное в общем случае неверно.
p2004r
Цитата(100$ @ 4.01.2015 - 21:55) *
Кроме того, известные к-ты корреляции (за исключением где-то встреченного мной параболического) линейны. А если статистическая связь двух измерений разными приборами нелинейна, то Пирсоном, Фехнером, Спирменом и Кендаллом ничего получить нельзя.

Ну и на сладкое цитатка из рускоязычной Вики:

Если X,Y независимые случайные величины, то R{X,Y} = 0. Обратное в общем случае неверно.


позволю себе быть кратким

1. "Натягивать сову на глобус" надо уметь. Это два прибора _поверенные_ (например тупым разведением образцов (о! кстати еще один способ поверить прибор работающий с кровью вообще одним единственным образцом smile.gif )) на выдачу результатов одного и того же показателя. Все погрешности "на нелинейность шкалы" _обязаны_ быть учтены конструктором прибора. Единственный ожидаемый результат это линейная зависимость показаний обоих методов.

2. R -- _выборочный_ показатель, он может быть _любым_ в пределах некоего своего _распределения_. Получить оценку этого распределения очень просто для экспериментальных данных и невероятно трудно в случае высасывания из пальцатеоретическом случае. Соответственно делать предположения о том, с какого уровня ошибки можно считать наблюдаемое достоверным событием, мы в своем (обычном повседневном) праве.
p2004r
без разделения fixed и random эффекта этот расчет бесполезен
100$
Цитата
R -- _выборочный_ показатель


Золотые слова. И выборочный и теоретический. И даже известны условия, при которых выборочный сходится к теоретическому.

Цитата
он может быть _любым_


Вот, поистине, бесценные сведения. Под словой "любым" , надо думать, понимается диапазон - 1 ... 1

Цитата
в пределах некоего своего _распределения_


Асимптотически нормального ~N(0,1)

Цитата
Получить оценку этого распределения очень просто для экспериментальных данных


Ресэмплинговыми техниками. Кто б спорил.

Цитата
и невероятно трудно в случае высасывания из пальцатеоретическом случае.


Матка боска! (польск.) Ужасть-то какая! Тем не менее все это сделано.

Цитата
Соответственно делать предположения о том, с какого уровня ошибки можно считать наблюдаемое достоверным событием, мы в своем (обычном повседневном) праве.


Красотища-то какая! Случайная величина в результате эксперимента (измерения гемоглобина) приняла некое численное значение. Глазам своим не верю и считаю это невозможным событием.

Неотвержение нулевой гипотезы формально не доказывает ее истинность.
p2004r
Цитата(100$ @ 5.01.2015 - 01:53) *
Золотые слова. И выборочный и теоретический. И даже известны условия, при которых выборочный сходится к теоретическому.



Вот, поистине, бесценные сведения. Под словой "любым" , надо думать, понимается диапазон - 1 ... 1



Асимптотически нормального ~N(0,1)



Ресэмплинговыми техниками. Кто б спорил.



Матка боска! (польск.) Ужасть-то какая! Тем не менее все это сделано.



Красотища-то какая! Случайная величина в результате эксперимента (измерения гемоглобина) приняла некое численное значение. Глазам своим не верю и считаю это невозможным событием.

Неотвержение нулевой гипотезы формально не доказывает ее истинность.


1. Нако выряйте еще отдельных букв из моих слов, может из них сложится еще что то ...

Трудность отвержения отсутствия связи между измерениями "вообще" у топикстартера (как и пути её преодоления) я описал еще в первых постах этого треда.

Тем не менее, мы точно так же считаем массу событий (завтра взойдет солнце) совершенно произвольно "достоверными". В данном случае мы примем возможную ошибку выхода за границу оценки доверительного интервала как несущественную, и будем считать событие "величина находится внутри интервала" достоверным для своих дальнейших рассуждений.

Таким образом величина возможного совпадения результатов не заключена в проверке какой то там гипотезы, а в расчете величины доверительного интервала для некоторой характеристики оцениваемого прибора. И коэффициент корреляции (вернее его доверительный интервал) более чем подходит для сравнения двух приборов выдающих на гора величину в заявленных "грамм гемоглобина на объем". (было бы "много гемоглобина", "мало гемоглобина", "вся сила в гемоглобине" было бы что обсуждать ещё)

2. Асимптотически нормального ~N(0,1)

На практике данное распределение может быть каким угодно у конкретной выборки. Поэтому я пишу у "выборочного". А что там, да кабы поверьте абсолютно не интересно... так же как и рассказываемые вами неумные скетчи (над которыми я не смеялся даже когда слышал их в первый раз).
100$
Цитата(p2004r @ 5.01.2015 - 13:19) *
1. Нако выряйте еще отдельных букв из моих слов, может из них сложится еще что то ...

Трудность отвержения отсутствия связи между измерениями "вообще" у топикстартера (как и пути её преодоления) я описал еще в первых постах этого треда.

Тем не менее, мы точно так же считаем массу событий (завтра взойдет солнце) совершенно произвольно "достоверными". В данном случае мы примем возможную ошибку выхода за границу оценки доверительного интервала как несущественную, и будем считать событие "величина находится внутри интервала" достоверным для своих дальнейших рассуждений.

Таким образом величина возможного совпадения результатов не заключена в проверке какой то там гипотезы, а в расчете величины доверительного интервала для некоторой характеристики оцениваемого прибора. И коэффициент корреляции (вернее его доверительный интервал) более чем подходит для сравнения двух приборов выдающих на гора величину в заявленных "грамм гемоглобина на объем". (было бы "много гемоглобина", "мало гемоглобина", "вся сила в гемоглобине" было бы что обсуждать ещё)

2. Асимптотически нормального ~N(0,1)

На практике данное распределение может быть каким угодно у конкретной выборки. Поэтому я пишу у "выборочного". А что там, да кабы поверьте абсолютно не интересно... так же как и рассказываемые вами неумные скетчи (над которыми я не смеялся даже когда слышал их в первый раз).


Ответь лучше на простенький вопрос:
1. Считаешь ли ты применительно к данному случаю два результата измерений статистически независимыми одинаково распределенным сл. величинами?

Просьба высказаться в категорях "Да-Нет". Избегая постороннего трепа.
100$
Цитата(Диагностик @ 5.01.2015 - 15:43) *
Да не работает этот аппарат. И отсутствие корреляции данных это очевидно показывает. Вам только одному это не понятно?


То есть взять математическое ожидание от собственной вероятностно-статистической модели измерений и подставить в формулу ковариации сл. величин ты тоже так и не смог.
Кстати, а как насчет статистической зависимости/независимости двух результатов измерений? А то что-то мы до сих пор не слыхали твоего ученого мнения.
p2004r
Цитата(DrgLena @ 4.01.2015 - 12:20) *
Так уже показано 27.12.2014 - 19:44

Визуализация на картинках,

Всех с Новым Годом! Мира, дружбы и любви! smile.gif


а так красивее smile.gif

Описание диаграммы:
http://www-pcmdi.llnl.gov/about/staff/Tayl...gram_primer.pdf

p2004r
Господин Модератор!

Мне самовыпилиться с этого форума? Или как мне ещё понимать результат вашего модерирования? Как одобрение?
nokh
Цитата(Диагностик @ 1.01.2015 - 08:39) *
Если бы ваши данные дали бы отличный от нуля коэффициент корреляции, можно было бы пойти дальше и проверять гипотезы что в Y=eX+f, e=1, и f=0. Но поскольку этого не случилось, то делаем вывод что один из применяемых вами приборов не пригоден для дальнейшей эксплуатации. Или оба.

Целиком и полностью поддерживаю. Начинать нужно именно с корреляции, если таковой нет - всё остальное бессмысленно. Поскольку речь в постах заходила и о возможной нелинейной связи, то лучше использовать ранговую корреляцию Спирмена (или Кендалла если больше нравится). Вопреки продуцируемым некоторыми учебниками заблуждениям, ранговые корреляции измеряют также и нелинейные монотонные связи. Эту тему мы обсуждали на форуме ещё с Игорем, а он уж года 2-3 если не больше как "самовыпилился" с форума. А недавно обнаружил, что уже и в википедии это появилось: http://en.wikipedia.org/wiki/Spearman%27s_...ion_coefficient
Именно корреляция является вторым по популярности после графического метода Бланда - Альтмана (Bland-Altman plot, вот подходящий метод: http://www.medcalc.org/manual/blandaltman.php ) и, кстати, первым методом, считающим р, в медицине для установления согласия двух методов измерения: http://www.plosone.org/article/info%3Adoi%...al.pone.0037908 - см. таблицы 1-2, сама статья с детскими рассуждениями - "ни о чём". Также используется в качестве одного из инструментов для валидации методов, можно даже онлайн посчитать и нарисовать: https://www.westgard.com/mvtools.htm

Байка на тему... Сравнивали как-то результаты ЭХО-КГ и МСКТ для 4 показателей работы сердца. Так вот, 2 значимые корреляции на уровне 0,35, а две - 0,1-0,2 и незначимы. Плюс колоссальные расхождения в самих оценках, для конечносистолического объёма - просто в 2 раза. Т.к. томограф очень дорогой, ну и типа современный - браковать сей чудо-аппарат за несоответствие результатов с классикой не стали smile.gif, стали разбираться. Оказалось, что различия - в настройках: томограф в автоматическом режиме усреднял показатели в движении, при ручном же анализе одного снимка результаты приблизились к классике. Это я к тому, что даже отсутствие корреляции и расхождения в оценках параметра может указывать не на непригодность прибора, а на иные причины. А вдруг чудо-аппарат работает, только для измерения "температуры в определенных точках тела" не те точки взяли, не гемоглобиновые? smile.gif И вообще, особо рьяных борцов со лженаукой нужно в узде держать - во благо самой Науки!

Присоединяюсь к поздравлениям с Новым годом wink.gif . Желаю всем:
(1) чтобы атмосфера дома, на работе, ну и в стране не отбивала желания заниматься любимой статистикой,
(2) чтобы ещё времени хватало!
anserovtv
В некоторых пакетах программ (XLStat) имеется процедура Эквивалентность тестов /TOST/, основанная на
1. вычислениях доверительных интервалов для разности значений (при выбранном уровне значимости),
2. Одновыборочных t-тестах для проверки двух направленных гипотез о равенстве разностей нижней и верхней границам ДИ.
В руководстве пользователя указана ссылка на работы Schuirman 1987.
http://www.kovcomp.co.uk/xlstat/tools/equi...-test-TOST.html
Полагаю, что для вычислений границ ДИ было бы разумно использовать и методологию ресамплинга или (и) байесовский подход.
Insaniens
Уважаемые участники форума! Благодарю за высказанные вами предложения.

Честно признаюсь, что часть из них мне, как истинному "медисту" (не знакомые с этим термином могут узнать о его возникновении на первой страничке темы) понятна не более, чем инструкция по ремонту большого андронного коллайдера на китайском языке smile.gif
Тем не менее, другая часть очень даже помогла в осмыслении проблемы.

Возможно, кому-то интересно, а что же за "чудо-прибор" обсуждается. Пожалуйста, сведения с официального сайта: http://biopromin.info/index.php

Все признаки лже-науки в данном приборе присутствуют: нет описания механизма получения "анализов", упомянутые на сайте исследования не представлены, зато есть красивые фото дипломов полумифических выставок и хвалебные "отзывы" неких организаций.

Зачем мне вообще это всё было надо: готовил доклад по лже-научным спекуляциям в медицине. Т.к. в одной из больниц стоит данный агрегат, решил проверить его работоспособность и результаты представить в докладе. На самом деле аппарат был лишь одним из разделов доклада, упор был сделан на публикации с сомнительными данными и лекарственные препараты с неподтвержденным эффектом.

Не сочтите, что здесь есть политика (аппарат родом с Украины). Отечественный "Оберон" из той же серии, просто под рукой оказался именно АМП.

Опять-таки, если кому-то интересно, то более полные данные можно найти в файле по ссылке (сюда прикрепить не удалось, сайт не дает, наверное, по причине малого кол-ва сообщений): http://rusfolder.com/42697128
Файл содержит данные пациентов, полученные в лаборатории и с помощью аппарата АМП (гемоглобин, эритроциты, лейкоциты, СОЭ, биллирубин). Столбцы озаглавленные зеленым - лабораторные, черным - с помощью АМП. Каждая строка соответствует одному пациенту (т.е. для каждого пациента есть пары наблюдений лаборатория/чудо-прибор). Наблюдений маловато (42), если честно, жаль было время терять на набор большого количества.

Расхождения поражают воображение. Понятно, что место прибору в мусорном бачке... Но хотелось доказать статистически, что прописка на территории городской свалки - то, что доктор прописал.
Ещё раз: спасибо за внимание к проблеме.
Диагностик
Цитата(100$ @ 5.01.2015 - 06:53) *
Случайная величина в результате эксперимента (измерения гемоглобина) приняла некое численное значение. Глазам своим не верю и считаю это невозможным событием.

Ну и зря, случайные величины только и делают, что в результате эксперимента принимают конкретные значения. Это событие достоверное, даже несмотря на ваше столь категоричное заявление.
Диагностик
Цитата(Insaniens @ 6.01.2015 - 20:09) *
Понятно, что место прибору в мусорном бачке... Но хотелось доказать статистически, что прописка на территории городской свалки - то, что доктор прописал.

Так я это вам сразу же и показал.
Insaniens
Ага smile.gif
Именно коэффициент корреляции я и использовал в докладе. В том числе по причине того, что понял как это делается.
Допускаю, что иные методы ничуть не хуже, а может и лучше, но не владею...
Субъективно показалось интересным предложение DoctorStat (на предыдущей странице). Почему "субъективно", т.к. мои знания в вопросах статистики оставляют желать лучшего.

PS: а вообще самому себе я представляюсь неразумным студентом наблюдающим за спором нескольких профессоров. Много непонятных слов и ощущение "ну какой же я дурак..." smile.gif
100$

Insaniens, не в службу, а в дружбу сообщите, пож-ста, какой методикой определялся г/глобин в лаборатории, и какова заявленная точность методики. А то по сообщениям в литературе, межлабораторный разброс рез-тов может достигать поистине неприличных значений.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.