Здравствуйте, гость ( Вход | Регистрация )
3.10.2008 - 22:30
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Всем добрый день. Столкнулись с проблемой "определения показаний" к методу лечения. Суть в следующем. Например. Больные разделены на 2 группы - с положительным результатом лечения и отрицательным результатом лечения (иначе - отсутствием результата). Есть некие показатели - например, высота опухоли - которая у всех больных разная. Клинически очевидно, что чем больше высота опухоли, тем чаще лечение неудовлетворительно. Как выбрать величину (высоту опухоли) - при которой лечение можно считать показанным, а при какой - не показанным? Допустим, высота опухоли во всей выборке больных варьирует от 2 до 5 условных единиц. Что брать за критерий, относительно которого будет проводится сравнение? Т.е. надо показать, что если высота опухоли больше ... такой то цифры, то количество отрицательных результатов больше 80%, а если высота опухоли меньше ... такой то цифры, то количество отрицательных результатов меньше 20%. Так вот, как выбрать эту цифру, относительно которой сравнивать ? Это 3 ? Или это 3,2 ? Среднюю? Медиану? Дискриминантную точку? "Точку баланса", полученную при построении ROC-кривой? Чем они - эти все точки - отличаются друг от друга по смыслу? Безусловно, про среднюю, медиану - я знаю. А как быть с дискриминантной и точкой баланса? В чем их отличие? Для чего используется та, а для чего - другая?
А как построить ROC - кривую в Экселе? Как самому определить дискриминантную точку? Можно ли это сделать в Экселе? Я приношу свои извинения заранее, т.к. понимаю, что мои словоизлияния весьма дилетантски. Но не могу пробраться сквозь статистические дебри, а вокруг - никто вообще ничего не понимает. |
|
|
![]() |
![]() |
![]() |
4.10.2008 - 18:33
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
А если успешность лечения 20%, а 30%?
Нет, так не делается. Формально правильный подход построение ROC-кривой и нахождение точки, которая находится ближе всего к верхнему левому углу графика, а затем определения того значения высоты опухоли, которое соответствует этой точке. Есть еще один, более простой метод. Для всех высот опухоли рассчитываете показатели чувствительности и специфичности, затем берете индекс Йодена (Se+Sp-1). Та точка, для которой он максимален и есть точка разделения. Но вот в формулировке задачи нет ни слова о том, какова плата за операцию (похоже нет, данные только о плохих исходах упоминаются). Т.е., если например есть только набор данных 1 2 3 4 5 - высота 30% 20% 10% 20% 30% - частота плохих исходов то никаких кривых строить не надо и ответ очевиден (высота=3). |
|
|
![]() |
![]() |
5.10.2008 - 15:45
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Есть еще один, более простой метод. Для всех высот опухоли рассчитываете показатели чувствительности и специфичности, затем берете индекс Йодена (Se+Sp-1). Та точка, для которой он максимален и есть точка разделения. Но вот в формулировке задачи нет ни слова о том, какова плата за операцию (похоже нет, данные только о плохих исходах упоминаются). Т.е., если например есть только набор данных 1 2 3 4 5 - высота 30% 20% 10% 20% 30% - частота плохих исходов то никаких кривых строить не надо и ответ очевиден (высота=3). А тогда такой вопрос - как же рассчитать здесь чувствительность (Se) и спецефичность (Sp)? Правильно ли , что чув-ть равна количество всех пациентов деленных на количество отрицатеьлных результатов? А спецефичность равна общее количество больных отнять количество отрицательных результатов и эту разницу делить на количество положительных результатов? И вообще, что же значат эти показатели Se и Sp? На сколько я знаю, Sе - это процент правильного прогноза успеха (лечения, диагностики и прочего), а Sp - это процент правильного прогноза неудачи. Тогда как можно определить ДЛЯ КАЖДОГО ПРИЗНАКА показатели чувствительности и специфичности? Если они означают, что уже результаты подведены и проводится уже оценка, как метод работает? Про тот набор данных , про который вы привели пример, все понятно. Безусловно, здесь ничего строить не надо. Нет, у меня рабор данных более разношерстный. |
|
|
![]() |
![]() |
5.10.2008 - 16:55
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
А тогда такой вопрос - как же рассчитать здесь чувствительность (Se) и спецефичность (Sp)? Правильно ли , что чув-ть равна количество всех пациентов деленных на количество отрицатеьлных результатов? А спецефичность равна общее количество больных отнять количество отрицательных результатов и эту разницу делить на количество положительных результатов? И вообще, что же значат эти показатели Se и Sp? На сколько я знаю, Sе - это процент правильного прогноза успеха (лечения, диагностики и прочего), а Sp - это процент правильного прогноза неудачи. Тогда как можно определить ДЛЯ КАЖДОГО ПРИЗНАКА показатели чувствительности и специфичности? Если они означают, что уже результаты подведены и проводится уже оценка, как метод работает? Про тот набор данных , про который вы привели пример, все понятно. Безусловно, здесь ничего строить не надо. Нет, у меня рабор данных более разношерстный. Нет, чувствительность - это процент лиц с положительным результатом теста среди всех больных. Специфичность - процент отрицательных результатов теста среди тех, у кого заболевания нет. Например, в случае если заболевание приводит к смерти, то чувствительность может быть процент лиц с высотой опухоли более 6 см. среди умерших от этой опухоли, специфичность - процент лиц с высотой опухоли менее 6 см среди всех доживших до конца исследования. То, что Вы назвали Se и Sp называется предиктивными значениями и они не оцениваются в исследованиях, поскольку сильно зависят от состава популяции (т.е. очениваются. но не как основные показатели - их можно рассчитать зная профиль риска и чувствительность и специфичность). |
|
|
![]() |
![]() |
6.10.2008 - 20:04
Сообщение
#5
|
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Нет, чувствительность - это процент лиц с положительным результатом теста среди всех больных. Специфичность - процент отрицательных результатов теста среди тех, у кого заболевания нет. Например, в случае если заболевание приводит к смерти, то чувствительность может быть процент лиц с высотой опухоли более 6 см. среди умерших от этой опухоли, специфичность - процент лиц с высотой опухоли менее 6 см среди всех доживших до конца исследования. То, что Вы назвали Se и Sp называется предиктивными значениями и они не оцениваются в исследованиях, поскольку сильно зависят от состава популяции (т.е. очениваются. но не как основные показатели - их можно рассчитать зная профиль риска и чувствительность и специфичность). Вот вроде вы все понятно объясняете, но начинаю думать сама - сложности. Я понимаю, что такое специфичность и чувствительность в том контексте, в котором вы объясняете. Для того, что бы их рассчитать, надо знать количество ложно -отрицательных, ложно - положительных, истино - отрицательных и истино - положительных случаев. Но узнать это количество возможно, если есть вот эта самая точка .., равная в вашем примере 6 см. А мне надо ее найти!!! Т.е. относительно какой точки мне вести эти расчеты? Почему 6? А не 5? Не 5,5? И т.д. ? Я не могу понять , как можно посчитать специфичность и чувствительность ДЛЯ КАЖДОГО СЛУЧАЯ? У меня есть 2 ряда данных - в одном значения высоты опухоли, а в другом - результат, скажем лечения (вылечился или не вылечился). Как найти то значение высоты, относительно которого делить потом больных: если высота меньше такой то цифры, то пациента можно брать на лечение, т.к. ожидается положительный исход, если высота - больше, то надо использовать др.метод, тк. толку от лечения не будет. Так что это за точка? Это "оптимальный порог", который находит РОК-кривая? Кстати, я строила РОК - кривую и тем способом, который вы года 2 назад здесь описывали - в Экселе. Там можно получить пересечение кривых чув-ти и спец-ти, на этом пересечении - некое значение этой высоты. ТАк вот оно отличаестся от того значения, которое получается при постоении кривой, полученной с использованием программы AtteStat. |
|
|
![]() |
![]() |
10.10.2008 - 18:52
Сообщение
#6
|
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Т.е. относительно какой точки мне вести эти расчеты? Почему 6? А не 5? Не 5,5? И т.д. ? Я не могу понять , как можно посчитать специфичность и чувствительность ДЛЯ КАЖДОГО СЛУЧАЯ? Так что это за точка? Это "оптимальный порог", который находит РОК-кривая? Все правильно. ROC кривая это и есть, грубо говоря, чувствительности и специфичности при использовании каждой точки в качестве точки разделения. Строятся они для того, чтобы найти оптимальный порог. |
|
|
![]() |
![]() |
11.10.2008 - 22:34
Сообщение
#7
|
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Все правильно. ROC кривая это и есть, грубо говоря, чувствительности и специфичности при использовании каждой точки в качестве точки разделения. Строятся они для того, чтобы найти оптимальный порог. Понятно. Тогда правильно ли я понимаю, что, гляда на значения чув-ти и спец-ти для каждого значения (каждой точки), можно выбрать эту точку САМОМУ, по своему разумению, исходя из того, какой уровень чувствительности и спецефичности мне требуется (в зависимости от задач, которые передо мной стоят)? Дело в том, что при построении этой рок-кривой в Экселе с использованием программки Аттестат, помимо этой кривой еще программа дала расчет этих всех значений чув-ти и спец-ти, но еще она и написала "оптимальный порог = столько то" . Так могу я его - это значение "оптимального порога" выбрать сама? P.S. Плав, и все - все, кто откликнулся, спасибо большое!!!! |
|
|
![]() |
![]() |
12.10.2008 - 19:31
Сообщение
#8
|
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Понятно. Тогда правильно ли я понимаю, что, гляда на значения чув-ти и спец-ти для каждого значения (каждой точки), можно выбрать эту точку САМОМУ, по своему разумению, исходя из того, какой уровень чувствительности и спецефичности мне требуется (в зависимости от задач, которые передо мной стоят)? Дело в том, что при построении этой рок-кривой в Экселе с использованием программки Аттестат, помимо этой кривой еще программа дала расчет этих всех значений чув-ти и спец-ти, но еще она и написала "оптимальный порог = столько то" . Так могу я его - это значение "оптимального порога" выбрать сама? P.S. Плав, и все - все, кто откликнулся, спасибо большое!!!! Угу. Именно так и делается. Оптимальный порог - это порог с максимально возможными одновременно Se И Sp. Но для целей диагностики может быть важна максимизация Se или Sp по отдельности. Главное описать, почему берется такой порог на основании данных ROC кривой |
|
|
![]() |
![]() |
13.10.2008 - 21:09
Сообщение
#9
|
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Угу. Именно так и делается. Оптимальный порог - это порог с максимально возможными одновременно Se И Sp. Но для целей диагностики может быть важна максимизация Se или Sp по отдельности. Главное описать, почему берется такой порог на основании данных ROC кривой Спасибо большое!!! |
|
|
![]() |
![]() |
Solo... ROC - кривая 3.10.2008 - 22:30
Игорь Цитата(Solo... @ 3.10.2008 - 22:30) ... 4.10.2008 - 13:46
DoctorStat Предполагаемая ПОСТАНОВКА ЗАДАЧИ:
Выбрать высоту о... 4.10.2008 - 14:17
DrgLena Не совсем понятно, как измерен положительный и отр... 4.10.2008 - 21:27
Solo... Цитата(DrgLena @ 4.10.2008 - 22:27) ... 5.10.2008 - 16:31
Игорь Цитата(Solo... @ 5.10.2008 - 15:45) ... 5.10.2008 - 15:50
Solo... Цитата(Игорь @ 5.10.2008 - 16:50) Вы... 5.10.2008 - 16:24
Solo... Цитата(Игорь @ 5.10.2008 - 16:50) Вы... 6.10.2008 - 19:53
Solo... Возможно, я уже надоела со своими глупыми вопросам... 6.10.2008 - 20:11
DrgLena Действительно, вы порвторяете те вопросы, которые ... 6.10.2008 - 22:26![]() ![]() |