Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

4 страниц V   1 2 3 > »   
Добавить ответ в эту темуОткрыть тему
> Помогите выбрать граничное значение, Надо определить граничное значение флуоресценции здоровых тканей
Olga_Zuk
сообщение 6.04.2014 - 23:19
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 6.04.2014
Пользователь №: 26293



Добрый день,

я студентка медицинской физики, на данный момент пишу научную работу в которой проверяю новый метод диагностики рака шейки матки. Не буду вдаваться в подробности, скажу только что этот метод основан на измерении флуоресценции шейки матки,чем выше флуоресценция, тем выше уровень патологии.

Во время исследований была измерена флуоресценция 80 здоровых тканей шейки матки и 80 больных тканей у разных пациенток.
Значение флуоресценции здоровых тканей было от 0.03 до 17.92, среднее значение 2.96, стандартное отклонение 2.84, медиана: 1.93.
Значение флуоресценции больных тканей было от 0.48 до 38.8, среднее значение 9.35, стандартное отклонение 9.18, медиана 5.9.

Обе выборки ненормалные и их разница статистически разная.

Вопрос: как статистически правильно выбрать граничное значение флуоресценцижи чтобы можно было сказать что если флуоресценции превышает это значение,то шейка матки имеет раковые изменения?

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 7.04.2014 - 00:00
Сообщение #2





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



http://en.wikipedia.org/wiki/Receiver_oper..._characteristic
Что не ясно, спрашиайте, обсуждалось на форуме.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 7.04.2014 - 09:27
Сообщение #3





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Olga_Zuk @ 6.04.2014 - 23:19) *
Во время исследований была измерена флуоресценция 80 здоровых тканей шейки матки и 80 больных тканей у разных пациенток.
Значение флуоресценции здоровых тканей было от 0.03 до 17.92, среднее значение 2.96, стандартное отклонение 2.84, медиана: 1.93.
Значение флуоресценции больных тканей было от 0.48 до 38.8, среднее значение 9.35, стандартное отклонение 9.18, медиана 5.9.

Обе выборки ненормалные и их разница статистически разная.


Здесь проблема в том, что группы разделяются без всякого анализа. Решение имеет такие варианты

1) У границы разделяющей объявляются "края" и лучшая граница проходит таким образом, что бы быть равноудаленной от данных попавших в края.

2) Необходимо делать модели распределения и считать для них оптимальную границу разделения смеси двух распределений. Модель распределения нужна, что бы получить "хвосты" распределения. (В принципе логистическая регрессия что такое и пытается делать)


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 7.04.2014 - 16:37
Сообщение #4





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(p2004r @ 7.04.2014 - 09:27) *
Здесь проблема в том, что группы разделяются без всякого анализа.

Группы разделяются, по видимому, по гистологии или иному золотому стандарту диагностики, как это принято в медицине. Предлагаемый метод может с ним сравниваться по чувствительности и специфичности. Оносительно найденной оптимальной точки разделения возможен диапазон и настройка этого диапазона производится в медицинском исследовании, когда нужно найти компромис между недодиагностикой у больных и гипердиагностикой у здоровых. Можно оставить часть данных для проверки правила диагностики или ждать новых бльных, уточняя чувствительность и специфичность, которая приводится для нескольких значений, а не только д ля самой оптимальной точки, в которой отмечается максимальная чувствительности и специфичность. Студент медик должен понимать именно эти простые вещи.
Цитата(p2004r @ 7.04.2014 - 09:27) *
(В принципе логистическая регрессия что такое и пытается делать)

Да, используя полученное уравнение логистическаой регрессии, можно посчитать вероятность болезни у каждого больного. Но, при ROC вы тоже получаете ряд значений вероятности болезни и здоровья при каждом значении признака (чувствительность и специфичность). Результат будет то же, поскольку у нас один признак.
Это можно было бы посмотреть, если автор выложит данные на форум.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Olga_Zuk
сообщение 7.04.2014 - 19:28
Сообщение #5





Группа: Пользователи
Сообщений: 6
Регистрация: 6.04.2014
Пользователь №: 26293



Цитата(DrgLena @ 7.04.2014 - 00:00) *
http://en.wikipedia.org/wiki/Receiver_oper..._characteristic
Что не ясно, спрашиайте, обсуждалось на форуме.


Спасибо за ответ. В принципе теоретически я поняла как это сделать, но практически не очень выходит, с R-project пробую. Может есть программа попроще? чтобы без "програмирывонья", а как в excele, просто столбики выбрать и кнопку нажать? :D а то R-project тяжело мне дается :D

Сообщение отредактировал Olga_Zuk - 7.04.2014 - 19:29
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Olga_Zuk
сообщение 7.04.2014 - 20:02
Сообщение #6





Группа: Пользователи
Сообщений: 6
Регистрация: 6.04.2014
Пользователь №: 26293



Цитата(DrgLena @ 7.04.2014 - 16:37) *
Да, используя полученное уравнение логистическаой регрессии, можно посчитать вероятность болезни у каждого больного. Но, при ROC вы тоже получаете ряд значений вероятности болезни и здоровья при каждом значении признака (чувствительность и специфичность). Результат будет то же, поскольку у нас один признак.
Это можно было бы посмотреть, если автор выложит данные на форум.


Спасибо за желание помочь! Выкладываю данные smile.gif
Прикрепленные файлы
Прикрепленный файл  dannyje.txt ( 2,21 килобайт ) Кол-во скачиваний: 583
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 7.04.2014 - 21:28
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Olga_Zuk @ 7.04.2014 - 22:28) *
...Может есть программа попроще? чтобы без "програмирывонья", а как в excele, просто столбики выбрать и кнопку нажать? :D а то R-project тяжело мне дается :D

http://www.medcalc.org/features/roccurves.php
(http://www.medcalc.org/manual/roccurves.php)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 7.04.2014 - 21:57
Сообщение #8





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



У меня пакет MedCalc, в сети есть бесплатная демо именно для ROC, nokh, как раз любезно предоставил ссылки.

Для ваших данных площадь под кривой составила 0,79 (р=0,0001). Оптимальное значение для диагностики рака >4,11. В этой точку чувствительность 67,82% и специфичность 77,11%.
Для ваших задач можно также предложить другие значения, подняв чувствительность за счет снижения специфичности. Например, точка >3,3 ( ч. 74,71% ; сп. 65,05%) или >2,75 (ч. 80,46% и СП. 60,24%).

ROC построенная по расчетным вероятностям логистической регрессии имеет также плошадь 0,79. При расчетной вероятности болезни > 0,45 число верно диагностированных больных 67,82% . Т.е. результат тот же.

Сообщение отредактировал DrgLena - 7.04.2014 - 22:18
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 7.04.2014 - 22:10
Сообщение #9





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Ну и R копайте тоже, форум в помощь, p2004 спасибо http://forum.disser.ru/index.php?showtopic...amp;#entry12550
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Olga_Zuk
сообщение 7.04.2014 - 22:45
Сообщение #10





Группа: Пользователи
Сообщений: 6
Регистрация: 6.04.2014
Пользователь №: 26293



Спасибо вам всем огромное!
Medcalc скачала, ROC уже тоже нарисовала, пытаюсь выяснить еще пару вещей, но уже думаю сама справлюсь smile.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 8.04.2014 - 06:33
Сообщение #11





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Кроме проведения ROC-анализа можно построить совсем простое дерево классификации: порог будет выбран автоматически.
Я пробовал, метод работает с минимальными количествами ошибок обоего рода.
Не уверен, правда, что такой глубокий анализ предполагался в студенческой работе. Возможно и ваши, Olga_Zuk, результаты уже достаточны.
Для проведения глубокого исследования признаков должно быть больше и (или) доверительные интервалы должны пересекаться меньше.
ROC-анализ легко сделать и в SPSS. можно скачать демоверсию на две недели.
Поставить флажок Координаты точки кривой и в полученной таблице выбрать нужный вам порог.
Существуют и другие методы определения качества бинарной классификации: статистика Колмогорова -Смирнова (не менее 40). индекс Джини, Lift-кривая.

Сообщение отредактировал anserovtv - 9.04.2014 - 15:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 8.04.2014 - 08:37
Сообщение #12





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(anserovtv @ 8.04.2014 - 06:33) *
можно построить совсем простое дерево классификации: порог будет выбран автоматически.
Я пробовал, оно работает с минимальными количествами ошибок обоего рода.

Раз вы уже потратили время, попробовали этот очень глубокий анализ, так поделитесь результатами. Какой порог разделения за вас выбрала машина и каковы ошибки классификации для больных и здоровых, вы эти ошибки назвали обоего рода?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 8.04.2014 - 09:59
Сообщение #13





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(DrgLena @ 8.04.2014 - 09:37) *
Раз вы уже потратили время
А если в анализе не одна переменная (как здесь), а больше, то во что превращается ROC-кривая ?


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 8.04.2014 - 10:37
Сообщение #14





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



ROC кривая останется ROC кривой, но будет построена по результатам логистической регрессии, учитывающей несколько предикторов, но это мы уже обсудили. Продолжение дискуссии предложил anserov в плане использования дерева. Так вот вот это предложение выливается в порог 7,27 с соответствующими ошибками, которые сами можете посмотреть на рисунке.
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 8.04.2014 - 11:16
Сообщение #15





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699




Это я "на слух" решил что границы групп не пересекаются вообще smile.gif А так да, простой ROC все покажет.

Но! Есть проблема с выбором критерия отсечения --- Необходимо знать 1) с какой априорной вероятностью встретить заболевание будет использоваться критерий 2) "цену" ошибки ложно позитивного и ложно негативного. Только тогда можно выбрать оптимальное значение по которому отсекать, и которое действительно миниминизирует "стоимость ошибки".


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

4 страниц V   1 2 3 > » 
Добавить ответ в эту темуОткрыть тему