Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Как создать формулу для расчета прогноза?
Solo...
сообщение 15.10.2008 - 21:08
Сообщение #1





Группа: Пользователи
Сообщений: 35
Регистрация: 3.10.2008
Из: Москва
Пользователь №: 5369



Всем здравствуйте. Прошу опять помощи.
Стоит такая задача. Как создать формулу, с помощью которой можно вычислить вероятность положительного исхода лечения у конкретного больного. Т.е. формулу, в которую можно подставлять данные (признаки, разные показатели и пр.) конкретного обратившегося за помощью больного, далее получать с помощью этой формулы какую то цифру - % (70%, или 60, или 95 ... и т.д.). Эта цифра и будет отражать вероятность положительного исхода лечения этого больного.

Имеются результаты лечения около 100 больных, известны все их показатели, влияющие на результат лечения. Этих показателей - около 5-6. Все они должны входить в формулу.

Я слышала, что этой формулой является дискриминантное уравнение. Но как его построить? В Экселе или в Статистике?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Анна_К
сообщение 10.12.2008 - 15:12
Сообщение #2





Группа: Пользователи
Сообщений: 18
Регистрация: 23.10.2008
Пользователь №: 5430



Цитата(плав @ 9.12.2008 - 22:44) *
Ну вообщем-то все понятно.
1) Про 30 я не случайно спросил - общее место, после этого числа объектов стабилизируется выборочная дисперсия (точнее после 25-30 объектов), соответственно, речь идет об обычной статистике, так что отсутствие обоснованного ответа на этот вопрос уже о многом говорит. Так что "оправдало на практике" это веселое объяснение.

Я рада, что мы приближаемся к взаимопониманию. Если это, конечно, не иллюзия понимания. На самом деле, речь не идет об обычной статистике. Статистика отличается от DataMining'а как алгебра отличается от геометрии (стереометрии, гиперметрии). Вы используете формулы, средние, дисперсии, отклонения от среднего, оценки, ошибки? В ДМ (при использовании всех статистических достижений) строятся описания гипер-облаков, характеризующих группы объектов. Это описание может быть гиперкубом, гипер-эллипсоидом, сложной гипер-поверхностью. И точность распознавания зависит от того, насколько хорошо учтены все информативные признаки (измерения) и удалены все лишние неинформативные признаки (шум). И только практика свидетельствует об эффективности построенной модели. Сами помните из марксистской философии: «Практика - критерий истины», поэтому и нечего грустить.
Цитата(плав @ 9.12.2008 - 22:44) *
2) Насчет коэффициента корреляции я тоже спросил не случайно. Вообще-то его квадрат показывает процент дисперсии, который объясняет данная модель. С точки зрения предсказания коэффициент корреляции раный +1 и -1 одинаково хороши, просто во втором случае перепутали группы. Но Вы на этот подвох тоже не обратили внимания - и это говорит о многом.

В нашем подходе такой перевертыш исключается. Точность распознавания близка к нулю, если распознавание невозможно (все перемешано), или точность распознавания стремится к 1 (100% распознавание), если информативные признаки существуют. Еще лучше просто посчитать, сколько объектов при распознавании на скользящем контроле попало в свою родную группу, сколько попало в зону отказа (которая вычисляется в зависимости от числа объектов в группах), и сколько являются ошибками. При этом зону отказов можно учитывать или не учитывать. В ней мы просто не можем ничего сказать о принадлежности объекта к определенной группе.

Цитата(плав @ 9.12.2008 - 22:44) *
2) Насчет того, что Ваши методы лучше среднего врача, я вообще не понял. Итак нейронные сети дали 99% точности и Вы считаете это подгонкой. Ваши методы дали 85-90% и это прекрасно. Чего-то я логику не понял. Или методика была одна и тогда Ваши методы проиграли или же проверка опять была не проспективная, но а тогда и 99% и 85% подозрительны.

Речь о том же, что я писала выше: нейронные сети, построенные на данных, предварительно обработанных генетическими алгоритмами, это модель, точно описывающая именно те данные, которые пошли на обучение. Любое добавление объектов полностью перестраивает решающее правило, которое содержит очень большое число отобранных признаков. То есть этот подход неустойчив вследствие того, что число предполагаемых прогностических переменных очень велико. Цитата: «Поиск оптимального набора признаков путем максимизации функционала, характеризующего качество распознавания, неизбежно ведет к эффекту "overfitting" - сверхобучение, когда оценка точности распознавания на тех данных, которые использовались для обучения значительно завышается. Правильная оценка точности должна производится на абсолютно новых данных, которые ранее никак не использовались. Объем контрольной выборки должен быть достаточно большим для того, чтобы оценка точности распознавания была близка к настоящей точности». В данном случае скользящий контроль если и проводился, то при удалении объекта решающее правило не строили заново. Объект просто распознавали (при этом до того он участвовал в обучении алгоритма). В нашем случае при удалении объекта, заново строится решающее правило. То есть проверяемый объект не участвует в обучении. Кроме того, каждый признак, отобранный для решающего правила как информативный, проверяли методом Монте-Карло на значимость. В нейронных сетях этого естественно не делалали. У них получился набор из 30 признаков. В нашем случае информативными оказались только 11. Но каждый из них работал на распознавание. Такие методы, при работе в приемном покое будут хорошим подспорьем врачу. Тем более, что для них не нужны мощные машины с дорогущими лицензионными зарубежными пакетами. Нужно только ввести показатели 11 симптомов, получить результат распознавания и дальше делать вывод, соглашаться с ним или нет.

Цитата(плав @ 9.12.2008 - 22:44) *
Вы то ли не хотите, то ли не можете понять основного: (а) проверка метода на той же популяции, на которой строится модель порочна. Модель постоянно строится на одних и тех же данных, соответственно ее параметры будут одинаковыми.
... Иными словами, при таком подходе система не может учитывать редкие события - а частые события мозг человека будет учитывать значительно лучше. Нельзя одновременно уменьшить объем входящей информации и получить больше информации на выходе.

В медицине редко можно собрать слишком большие массивы данных. Их всегда - ограниченное число. И наши методы позволяют выявлять закономерности, которые не всегда видны невооруженным глазом. И при любой модели будут такие пациенты, которые не вписываются о «свою» группу. Любой хирург вам расскажет, что иногда выживают самые безнадежные больные, а благополучные (вроде бы) вдруг не выдерживают операции. Тоннельный эффект в медицине случается также часто как и в микромире, когда электрон оказывается там, где ему теоретически быть не положено.
А насчет уменьшения информации Вы абсолютны неправы! Как раз уменьшение шума дает возможность найти только информативные показатели, помогающие распознаванию.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Solo...   Как создать формулу для расчета прогноза?   15.10.2008 - 21:08
- - DoctorStat   1. Выявление клинически значимых параметров и их в...   16.10.2008 - 10:50
- - Игорь   Цитата(Solo... @ 15.10.2008 - 21:08)...   20.10.2008 - 09:18
- - Анна_К   Цитата(Solo... @ 15.10.2008 - 22:08)...   23.10.2008 - 13:16
- - Solo...   Я побывала на вашем форуме. Но , если честно, не р...   7.12.2008 - 18:42
|- - Анна_К   Цитата(Solo... @ 7.12.2008 - 18:42) ...   8.12.2008 - 11:28
- - плав   Ну, во-первых создать на 100 больных формулу, кото...   7.12.2008 - 20:22
|- - Анна_К   Цитата(плав @ 7.12.2008 - 20:22) Ну,...   8.12.2008 - 12:26
|- - плав   Цитата(Анна_К @ 8.12.2008 - 12:26) D...   8.12.2008 - 13:35
|- - Анна_К   Цитата(плав @ 8.12.2008 - 13:35) Это...   8.12.2008 - 21:50
|- - DoctorStat   Цитата(Анна_К @ 8.12.2008 - 21:50) П...   8.12.2008 - 22:25
||- - Анна_К   Цитата(DoctorStat @ 8.12.2008 - 22:2...   9.12.2008 - 14:27
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 14:27) С...   9.12.2008 - 16:28
||- - Анна_К   Цитата(DoctorStat @ 9.12.2008 - 16:2...   9.12.2008 - 18:41
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 18:41) П...   9.12.2008 - 19:55
||- - Анна_К   Цитата(DoctorStat @ 9.12.2008 - 19:5...   9.12.2008 - 21:50
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 21:50) Е...   9.12.2008 - 22:03
|- - плав   Цитата(Анна_К @ 8.12.2008 - 21:50) П...   8.12.2008 - 22:38
- - Анна_К   Для обсуждаемых данных, вероятно, подойдет метод С...   8.12.2008 - 12:30
- - DrgLena   Если уж наблюдать битву гигантов, то давайте вспом...   9.12.2008 - 18:25
|- - Анна_К   Цитата(DrgLena @ 9.12.2008 - 18:25) ...   9.12.2008 - 18:55
|- - DoctorStat   Цитата(DrgLena @ 9.12.2008 - 18:25) ...   9.12.2008 - 20:19
|- - плав   Цитата(DoctorStat @ 9.12.2008 - 20:1...   9.12.2008 - 22:52
- - Анна_К   Извините, plav, Вам отвечаю позже всех. Слишком мн...   9.12.2008 - 19:35
|- - плав   Цитата(Анна_К @ 9.12.2008 - 19:35) М...   9.12.2008 - 22:44
- - DrgLena   Да, действительно, DoktorStat, на основании предст...   10.12.2008 - 00:36
|- - плав   Цитата(DrgLena @ 10.12.2008 - 00:36)...   10.12.2008 - 12:39
|- - Анна_К   Цитата(DrgLena @ 10.12.2008 - 00:36)...   10.12.2008 - 15:09
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 15:09) ...   10.12.2008 - 15:17
- - DrgLena   Да, логика железная! У умерших от первого прис...   10.12.2008 - 13:05
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 13:05)...   10.12.2008 - 13:48
- - плав   А вот это сделать сложно. Люди просто умерли (внез...   10.12.2008 - 14:32
- - DrgLena   Это план исследования или уже есть результаты? Чащ...   10.12.2008 - 14:36
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 14:36)...   10.12.2008 - 14:42
- - Анна_К   Цитата(плав @ 9.12.2008 - 22:44) Ну ...   10.12.2008 - 15:12
- - Анна_К   Цитата(плав @ 9.12.2008 - 22:44) 3) ...   10.12.2008 - 15:14
- - DrgLena   DoctorStat, Да, я упустила пару ответов. Одноврем...   10.12.2008 - 15:25
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 15:25)...   10.12.2008 - 15:33
|- - Анна_К   Цитата(DrgLena @ 10.12.2008 - 15:25)...   10.12.2008 - 15:55
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 15:55) ...   10.12.2008 - 17:03
|- - Анна_К   Цитата(DoctorStat @ 10.12.2008 - 17...   10.12.2008 - 20:23
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 20:23) ...   10.12.2008 - 20:32
|- - Анна_К   Цитата(DoctorStat @ 10.12.2008 - 20...   10.12.2008 - 23:21
- - DrgLena   Дождаться "полного ответа" мне не удало...   10.12.2008 - 16:05
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 16:05)...   10.12.2008 - 16:23
- - DrgLena   Вы дали пример, его и решайте. Бог с ним с сайтом ...   10.12.2008 - 16:46
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 16:46)...   10.12.2008 - 16:54
- - DrgLena   Предлагаю "правильными" данными считать ...   10.12.2008 - 21:24
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 21:24)...   10.12.2008 - 21:36
- - DrgLena   Доктор DoctorStar, вы главный участник битвы гиган...   10.12.2008 - 22:13
- - DoctorStat   Данные взяты из самого первого файла Stenocardia.r...   11.12.2008 - 11:59
- - DrgLena   Чего только не сделает доктор, чтобы получить жела...   11.12.2008 - 14:06
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 14:06)...   11.12.2008 - 14:35
- - DrgLena   Да, я посетила ваш сайт и проследила за ходом выпо...   11.12.2008 - 15:32
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 15:32)...   11.12.2008 - 15:45
- - DrgLena   Если данные содержат информацию, которая может быт...   11.12.2008 - 16:57
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 16:57)...   11.12.2008 - 17:45
- - DrgLena   Вы, очевидно не поняли, что дело не в новых метода...   11.12.2008 - 17:54
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 17:54)...   11.12.2008 - 20:18
- - DrgLena   Да, вы извлекли какую- то информацию. А именно, на...   11.12.2008 - 22:42
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 22:42)...   12.12.2008 - 11:49
- - autumn   Уважаемый DrStat Я коллега Anny_K. Мы провели ана...   12.12.2008 - 13:35
|- - DoctorStat   Цитата(autumn @ 12.12.2008 - 13:35) ...   12.12.2008 - 14:09
|- - autumn   Цитата(DoctorStat @ 12.12.2008 - 15...   12.12.2008 - 15:51
|- - DoctorStat   Цитата(autumn @ 12.12.2008 - 15:51) ...   12.12.2008 - 16:13
|- - autumn   Цитата(DoctorStat @ 12.12.2008 - 17...   13.12.2008 - 12:38
|- - DoctorStat   Цитата(autumn @ 13.12.2008 - 12:38) ...   13.12.2008 - 14:22
|- - autumn   Цитата(DoctorStat @ 13.12.2008 - 15...   13.12.2008 - 16:09
|- - DoctorStat   Цитата(autumn @ 13.12.2008 - 16:09) ...   13.12.2008 - 16:43
- - DrgLena   DoctorStat, всю технологию описал на своем сайте h...   12.12.2008 - 16:08
- - DrgLena   Autumn, не могу сказать, чтобы я разобралась, поче...   12.12.2008 - 20:41
- - autumn   Извините, я как-то забыл про комментарии. Квадрант...   12.12.2008 - 21:21
- - DrgLena   Большое спасибо, я поняла. Теперь я вижу, что резу...   12.12.2008 - 22:52
- - DrgLena   Очевидно, моих аргументов не хватило для того, что...   13.12.2008 - 19:15
|- - DoctorStat   Цитата(DrgLena @ 13.12.2008 - 19:15)...   13.12.2008 - 20:43
|- - плав   Цитата(DoctorStat @ 13.12.2008 - 20...   13.12.2008 - 21:45
- - Анна_К   С файлом Stenocardia.xls разобрались. Но мне так и...   13.12.2008 - 20:05
|- - DoctorStat   Цитата(Анна_К @ 13.12.2008 - 20:05) ...   13.12.2008 - 20:49
- - DrgLena   Цитата(DoctorStat @ 13.12.2008 - 21...   14.12.2008 - 00:17
|- - DoctorStat   Цитата(DrgLena @ 14.12.2008 - 00:17)...   14.12.2008 - 14:19
|- - DoctorStat   Чтобы показать для чего нужна кластеризация, я сра...   14.12.2008 - 22:51
- - autumn   DoctorStat, существование искусственных данных, дл...   15.12.2008 - 12:10
|- - DoctorStat   Цитата(autumn @ 15.12.2008 - 13:10) ...   3.07.2009 - 10:20
- - DrgLena   Итак, у вас есть больной у которого первый вариант...   15.12.2008 - 13:06


Добавить ответ в эту темуОткрыть тему