Помогите выбрать граничное значение, Надо определить граничное значение флуоресценции здоровых тканей |
Здравствуйте, гость ( Вход | Регистрация )
Помогите выбрать граничное значение, Надо определить граничное значение флуоресценции здоровых тканей |
6.04.2014 - 23:19
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 6.04.2014 Пользователь №: 26293 |
Добрый день,
я студентка медицинской физики, на данный момент пишу научную работу в которой проверяю новый метод диагностики рака шейки матки. Не буду вдаваться в подробности, скажу только что этот метод основан на измерении флуоресценции шейки матки,чем выше флуоресценция, тем выше уровень патологии. Во время исследований была измерена флуоресценция 80 здоровых тканей шейки матки и 80 больных тканей у разных пациенток. Значение флуоресценции здоровых тканей было от 0.03 до 17.92, среднее значение 2.96, стандартное отклонение 2.84, медиана: 1.93. Значение флуоресценции больных тканей было от 0.48 до 38.8, среднее значение 9.35, стандартное отклонение 9.18, медиана 5.9. Обе выборки ненормалные и их разница статистически разная. Вопрос: как статистически правильно выбрать граничное значение флуоресценцижи чтобы можно было сказать что если флуоресценции превышает это значение,то шейка матки имеет раковые изменения? |
|
7.04.2014 - 00:00
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
http://en.wikipedia.org/wiki/Receiver_oper..._characteristic
Что не ясно, спрашиайте, обсуждалось на форуме. |
|
7.04.2014 - 09:27
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Во время исследований была измерена флуоресценция 80 здоровых тканей шейки матки и 80 больных тканей у разных пациенток. Значение флуоресценции здоровых тканей было от 0.03 до 17.92, среднее значение 2.96, стандартное отклонение 2.84, медиана: 1.93. Значение флуоресценции больных тканей было от 0.48 до 38.8, среднее значение 9.35, стандартное отклонение 9.18, медиана 5.9. Обе выборки ненормалные и их разница статистически разная. Здесь проблема в том, что группы разделяются без всякого анализа. Решение имеет такие варианты 1) У границы разделяющей объявляются "края" и лучшая граница проходит таким образом, что бы быть равноудаленной от данных попавших в края. 2) Необходимо делать модели распределения и считать для них оптимальную границу разделения смеси двух распределений. Модель распределения нужна, что бы получить "хвосты" распределения. (В принципе логистическая регрессия что такое и пытается делать) |
|
7.04.2014 - 16:37
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Здесь проблема в том, что группы разделяются без всякого анализа. Группы разделяются, по видимому, по гистологии или иному золотому стандарту диагностики, как это принято в медицине. Предлагаемый метод может с ним сравниваться по чувствительности и специфичности. Оносительно найденной оптимальной точки разделения возможен диапазон и настройка этого диапазона производится в медицинском исследовании, когда нужно найти компромис между недодиагностикой у больных и гипердиагностикой у здоровых. Можно оставить часть данных для проверки правила диагностики или ждать новых бльных, уточняя чувствительность и специфичность, которая приводится для нескольких значений, а не только д ля самой оптимальной точки, в которой отмечается максимальная чувствительности и специфичность. Студент медик должен понимать именно эти простые вещи. (В принципе логистическая регрессия что такое и пытается делать) Да, используя полученное уравнение логистическаой регрессии, можно посчитать вероятность болезни у каждого больного. Но, при ROC вы тоже получаете ряд значений вероятности болезни и здоровья при каждом значении признака (чувствительность и специфичность). Результат будет то же, поскольку у нас один признак. Это можно было бы посмотреть, если автор выложит данные на форум. |
|
7.04.2014 - 19:28
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 6.04.2014 Пользователь №: 26293 |
http://en.wikipedia.org/wiki/Receiver_oper..._characteristic Что не ясно, спрашиайте, обсуждалось на форуме. Спасибо за ответ. В принципе теоретически я поняла как это сделать, но практически не очень выходит, с R-project пробую. Может есть программа попроще? чтобы без "програмирывонья", а как в excele, просто столбики выбрать и кнопку нажать? :D а то R-project тяжело мне дается :D Сообщение отредактировал Olga_Zuk - 7.04.2014 - 19:29 |
|
7.04.2014 - 20:02
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 6.04.2014 Пользователь №: 26293 |
Да, используя полученное уравнение логистическаой регрессии, можно посчитать вероятность болезни у каждого больного. Но, при ROC вы тоже получаете ряд значений вероятности болезни и здоровья при каждом значении признака (чувствительность и специфичность). Результат будет то же, поскольку у нас один признак. Это можно было бы посмотреть, если автор выложит данные на форум. Спасибо за желание помочь! Выкладываю данные
Прикрепленные файлы
|
|
7.04.2014 - 21:28
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
...Может есть программа попроще? чтобы без "програмирывонья", а как в excele, просто столбики выбрать и кнопку нажать? :D а то R-project тяжело мне дается :D http://www.medcalc.org/features/roccurves.php (http://www.medcalc.org/manual/roccurves.php) |
|
7.04.2014 - 21:57
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
У меня пакет MedCalc, в сети есть бесплатная демо именно для ROC, nokh, как раз любезно предоставил ссылки.
Для ваших данных площадь под кривой составила 0,79 (р=0,0001). Оптимальное значение для диагностики рака >4,11. В этой точку чувствительность 67,82% и специфичность 77,11%. Для ваших задач можно также предложить другие значения, подняв чувствительность за счет снижения специфичности. Например, точка >3,3 ( ч. 74,71% ; сп. 65,05%) или >2,75 (ч. 80,46% и СП. 60,24%). ROC построенная по расчетным вероятностям логистической регрессии имеет также плошадь 0,79. При расчетной вероятности болезни > 0,45 число верно диагностированных больных 67,82% . Т.е. результат тот же. Сообщение отредактировал DrgLena - 7.04.2014 - 22:18 |
|
7.04.2014 - 22:10
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Ну и R копайте тоже, форум в помощь, p2004 спасибо http://forum.disser.ru/index.php?showtopic...amp;#entry12550
|
|
7.04.2014 - 22:45
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 6.04.2014 Пользователь №: 26293 |
Спасибо вам всем огромное!
Medcalc скачала, ROC уже тоже нарисовала, пытаюсь выяснить еще пару вещей, но уже думаю сама справлюсь |
|
8.04.2014 - 06:33
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Кроме проведения ROC-анализа можно построить совсем простое дерево классификации: порог будет выбран автоматически.
Я пробовал, метод работает с минимальными количествами ошибок обоего рода. Не уверен, правда, что такой глубокий анализ предполагался в студенческой работе. Возможно и ваши, Olga_Zuk, результаты уже достаточны. Для проведения глубокого исследования признаков должно быть больше и (или) доверительные интервалы должны пересекаться меньше. ROC-анализ легко сделать и в SPSS. можно скачать демоверсию на две недели. Поставить флажок Координаты точки кривой и в полученной таблице выбрать нужный вам порог. Существуют и другие методы определения качества бинарной классификации: статистика Колмогорова -Смирнова (не менее 40). индекс Джини, Lift-кривая. Сообщение отредактировал anserovtv - 9.04.2014 - 15:04 |
|
8.04.2014 - 08:37
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
можно построить совсем простое дерево классификации: порог будет выбран автоматически. Я пробовал, оно работает с минимальными количествами ошибок обоего рода. Раз вы уже потратили время, попробовали этот очень глубокий анализ, так поделитесь результатами. Какой порог разделения за вас выбрала машина и каковы ошибки классификации для больных и здоровых, вы эти ошибки назвали обоего рода? |
|
8.04.2014 - 09:59
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Раз вы уже потратили время А если в анализе не одна переменная (как здесь), а больше, то во что превращается ROC-кривая ?Просто включи мозги => http://doctorstat.narod.ru
|
|
8.04.2014 - 10:37
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
ROC кривая останется ROC кривой, но будет построена по результатам логистической регрессии, учитывающей несколько предикторов, но это мы уже обсудили. Продолжение дискуссии предложил anserov в плане использования дерева. Так вот вот это предложение выливается в порог 7,27 с соответствующими ошибками, которые сами можете посмотреть на рисунке.
|
|
8.04.2014 - 11:16
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Это я "на слух" решил что границы групп не пересекаются вообще А так да, простой ROC все покажет. Но! Есть проблема с выбором критерия отсечения --- Необходимо знать 1) с какой априорной вероятностью встретить заболевание будет использоваться критерий 2) "цену" ошибки ложно позитивного и ложно негативного. Только тогда можно выбрать оптимальное значение по которому отсекать, и которое действительно миниминизирует "стоимость ошибки". |
|