Здравствуйте, гость ( Вход | Регистрация )
15.10.2008 - 21:08
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Всем здравствуйте. Прошу опять помощи.
Стоит такая задача. Как создать формулу, с помощью которой можно вычислить вероятность положительного исхода лечения у конкретного больного. Т.е. формулу, в которую можно подставлять данные (признаки, разные показатели и пр.) конкретного обратившегося за помощью больного, далее получать с помощью этой формулы какую то цифру - % (70%, или 60, или 95 ... и т.д.). Эта цифра и будет отражать вероятность положительного исхода лечения этого больного. Имеются результаты лечения около 100 больных, известны все их показатели, влияющие на результат лечения. Этих показателей - около 5-6. Все они должны входить в формулу. Я слышала, что этой формулой является дискриминантное уравнение. Но как его построить? В Экселе или в Статистике? |
|
|
![]() |
![]() |
![]() |
10.12.2008 - 15:12
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 18 Регистрация: 23.10.2008 Пользователь №: 5430 |
Ну вообщем-то все понятно. 1) Про 30 я не случайно спросил - общее место, после этого числа объектов стабилизируется выборочная дисперсия (точнее после 25-30 объектов), соответственно, речь идет об обычной статистике, так что отсутствие обоснованного ответа на этот вопрос уже о многом говорит. Так что "оправдало на практике" это веселое объяснение. Я рада, что мы приближаемся к взаимопониманию. Если это, конечно, не иллюзия понимания. На самом деле, речь не идет об обычной статистике. Статистика отличается от DataMining'а как алгебра отличается от геометрии (стереометрии, гиперметрии). Вы используете формулы, средние, дисперсии, отклонения от среднего, оценки, ошибки? В ДМ (при использовании всех статистических достижений) строятся описания гипер-облаков, характеризующих группы объектов. Это описание может быть гиперкубом, гипер-эллипсоидом, сложной гипер-поверхностью. И точность распознавания зависит от того, насколько хорошо учтены все информативные признаки (измерения) и удалены все лишние неинформативные признаки (шум). И только практика свидетельствует об эффективности построенной модели. Сами помните из марксистской философии: «Практика - критерий истины», поэтому и нечего грустить. 2) Насчет коэффициента корреляции я тоже спросил не случайно. Вообще-то его квадрат показывает процент дисперсии, который объясняет данная модель. С точки зрения предсказания коэффициент корреляции раный +1 и -1 одинаково хороши, просто во втором случае перепутали группы. Но Вы на этот подвох тоже не обратили внимания - и это говорит о многом. В нашем подходе такой перевертыш исключается. Точность распознавания близка к нулю, если распознавание невозможно (все перемешано), или точность распознавания стремится к 1 (100% распознавание), если информативные признаки существуют. Еще лучше просто посчитать, сколько объектов при распознавании на скользящем контроле попало в свою родную группу, сколько попало в зону отказа (которая вычисляется в зависимости от числа объектов в группах), и сколько являются ошибками. При этом зону отказов можно учитывать или не учитывать. В ней мы просто не можем ничего сказать о принадлежности объекта к определенной группе. 2) Насчет того, что Ваши методы лучше среднего врача, я вообще не понял. Итак нейронные сети дали 99% точности и Вы считаете это подгонкой. Ваши методы дали 85-90% и это прекрасно. Чего-то я логику не понял. Или методика была одна и тогда Ваши методы проиграли или же проверка опять была не проспективная, но а тогда и 99% и 85% подозрительны. Речь о том же, что я писала выше: нейронные сети, построенные на данных, предварительно обработанных генетическими алгоритмами, это модель, точно описывающая именно те данные, которые пошли на обучение. Любое добавление объектов полностью перестраивает решающее правило, которое содержит очень большое число отобранных признаков. То есть этот подход неустойчив вследствие того, что число предполагаемых прогностических переменных очень велико. Цитата: «Поиск оптимального набора признаков путем максимизации функционала, характеризующего качество распознавания, неизбежно ведет к эффекту "overfitting" - сверхобучение, когда оценка точности распознавания на тех данных, которые использовались для обучения значительно завышается. Правильная оценка точности должна производится на абсолютно новых данных, которые ранее никак не использовались. Объем контрольной выборки должен быть достаточно большим для того, чтобы оценка точности распознавания была близка к настоящей точности». В данном случае скользящий контроль если и проводился, то при удалении объекта решающее правило не строили заново. Объект просто распознавали (при этом до того он участвовал в обучении алгоритма). В нашем случае при удалении объекта, заново строится решающее правило. То есть проверяемый объект не участвует в обучении. Кроме того, каждый признак, отобранный для решающего правила как информативный, проверяли методом Монте-Карло на значимость. В нейронных сетях этого естественно не делалали. У них получился набор из 30 признаков. В нашем случае информативными оказались только 11. Но каждый из них работал на распознавание. Такие методы, при работе в приемном покое будут хорошим подспорьем врачу. Тем более, что для них не нужны мощные машины с дорогущими лицензионными зарубежными пакетами. Нужно только ввести показатели 11 симптомов, получить результат распознавания и дальше делать вывод, соглашаться с ним или нет. Вы то ли не хотите, то ли не можете понять основного: (а) проверка метода на той же популяции, на которой строится модель порочна. Модель постоянно строится на одних и тех же данных, соответственно ее параметры будут одинаковыми. ... Иными словами, при таком подходе система не может учитывать редкие события - а частые события мозг человека будет учитывать значительно лучше. Нельзя одновременно уменьшить объем входящей информации и получить больше информации на выходе. В медицине редко можно собрать слишком большие массивы данных. Их всегда - ограниченное число. И наши методы позволяют выявлять закономерности, которые не всегда видны невооруженным глазом. И при любой модели будут такие пациенты, которые не вписываются о «свою» группу. Любой хирург вам расскажет, что иногда выживают самые безнадежные больные, а благополучные (вроде бы) вдруг не выдерживают операции. Тоннельный эффект в медицине случается также часто как и в микромире, когда электрон оказывается там, где ему теоретически быть не положено. А насчет уменьшения информации Вы абсолютны неправы! Как раз уменьшение шума дает возможность найти только информативные показатели, помогающие распознаванию. |
|
|
![]() |
![]() |
Solo... Как создать формулу для расчета прогноза? 15.10.2008 - 21:08
DoctorStat 1. Выявление клинически значимых параметров и их в... 16.10.2008 - 10:50
Игорь Цитата(Solo... @ 15.10.2008 - 21:08)... 20.10.2008 - 09:18
Анна_К Цитата(Solo... @ 15.10.2008 - 22:08)... 23.10.2008 - 13:16
Solo... Я побывала на вашем форуме. Но , если честно, не р... 7.12.2008 - 18:42
Анна_К Цитата(Solo... @ 7.12.2008 - 18:42) ... 8.12.2008 - 11:28
плав Ну, во-первых создать на 100 больных формулу, кото... 7.12.2008 - 20:22
Анна_К Цитата(плав @ 7.12.2008 - 20:22) Ну,... 8.12.2008 - 12:26
плав Цитата(Анна_К @ 8.12.2008 - 12:26) D... 8.12.2008 - 13:35
Анна_К Цитата(плав @ 8.12.2008 - 13:35) Это... 8.12.2008 - 21:50
DoctorStat Цитата(Анна_К @ 8.12.2008 - 21:50) П... 8.12.2008 - 22:25

Анна_К Цитата(DoctorStat @ 8.12.2008 - 22:2... 9.12.2008 - 14:27

DoctorStat Цитата(Анна_К @ 9.12.2008 - 14:27) С... 9.12.2008 - 16:28

Анна_К Цитата(DoctorStat @ 9.12.2008 - 16:2... 9.12.2008 - 18:41

DoctorStat Цитата(Анна_К @ 9.12.2008 - 18:41) П... 9.12.2008 - 19:55

Анна_К Цитата(DoctorStat @ 9.12.2008 - 19:5... 9.12.2008 - 21:50

DoctorStat Цитата(Анна_К @ 9.12.2008 - 21:50) Е... 9.12.2008 - 22:03
плав Цитата(Анна_К @ 8.12.2008 - 21:50) П... 8.12.2008 - 22:38
Анна_К Для обсуждаемых данных, вероятно, подойдет метод С... 8.12.2008 - 12:30
DrgLena Если уж наблюдать битву гигантов, то давайте вспом... 9.12.2008 - 18:25
Анна_К Цитата(DrgLena @ 9.12.2008 - 18:25) ... 9.12.2008 - 18:55
DoctorStat Цитата(DrgLena @ 9.12.2008 - 18:25) ... 9.12.2008 - 20:19
плав Цитата(DoctorStat @ 9.12.2008 - 20:1... 9.12.2008 - 22:52
Анна_К Извините, plav, Вам отвечаю позже всех. Слишком мн... 9.12.2008 - 19:35
плав Цитата(Анна_К @ 9.12.2008 - 19:35) М... 9.12.2008 - 22:44
DrgLena Да, действительно, DoktorStat, на основании предст... 10.12.2008 - 00:36
плав Цитата(DrgLena @ 10.12.2008 - 00:36)... 10.12.2008 - 12:39
Анна_К Цитата(DrgLena @ 10.12.2008 - 00:36)... 10.12.2008 - 15:09
DoctorStat Цитата(Анна_К @ 10.12.2008 - 15:09) ... 10.12.2008 - 15:17
DrgLena Да, логика железная!
У умерших от первого прис... 10.12.2008 - 13:05
DoctorStat Цитата(DrgLena @ 10.12.2008 - 13:05)... 10.12.2008 - 13:48
плав А вот это сделать сложно. Люди просто умерли (внез... 10.12.2008 - 14:32
DrgLena Это план исследования или уже есть результаты? Чащ... 10.12.2008 - 14:36
DoctorStat Цитата(DrgLena @ 10.12.2008 - 14:36)... 10.12.2008 - 14:42
Анна_К Цитата(плав @ 9.12.2008 - 22:44) 3) ... 10.12.2008 - 15:14
DrgLena DoctorStat,
Да, я упустила пару ответов. Одноврем... 10.12.2008 - 15:25
DoctorStat Цитата(DrgLena @ 10.12.2008 - 15:25)... 10.12.2008 - 15:33
Анна_К Цитата(DrgLena @ 10.12.2008 - 15:25)... 10.12.2008 - 15:55
DoctorStat Цитата(Анна_К @ 10.12.2008 - 15:55) ... 10.12.2008 - 17:03
Анна_К Цитата(DoctorStat @ 10.12.2008 - 17... 10.12.2008 - 20:23
DoctorStat Цитата(Анна_К @ 10.12.2008 - 20:23) ... 10.12.2008 - 20:32
Анна_К Цитата(DoctorStat @ 10.12.2008 - 20... 10.12.2008 - 23:21
DrgLena Дождаться "полного ответа" мне не удало... 10.12.2008 - 16:05
DoctorStat Цитата(DrgLena @ 10.12.2008 - 16:05)... 10.12.2008 - 16:23
DrgLena Вы дали пример, его и решайте. Бог с ним с сайтом ... 10.12.2008 - 16:46
DoctorStat Цитата(DrgLena @ 10.12.2008 - 16:46)... 10.12.2008 - 16:54
DrgLena Предлагаю "правильными" данными считать ... 10.12.2008 - 21:24
DoctorStat Цитата(DrgLena @ 10.12.2008 - 21:24)... 10.12.2008 - 21:36
DrgLena Доктор DoctorStar, вы главный участник битвы гиган... 10.12.2008 - 22:13
DoctorStat Данные взяты из самого первого файла Stenocardia.r... 11.12.2008 - 11:59
DrgLena Чего только не сделает доктор, чтобы получить жела... 11.12.2008 - 14:06
DoctorStat Цитата(DrgLena @ 11.12.2008 - 14:06)... 11.12.2008 - 14:35
DrgLena Да, я посетила ваш сайт и проследила за ходом выпо... 11.12.2008 - 15:32
DoctorStat Цитата(DrgLena @ 11.12.2008 - 15:32)... 11.12.2008 - 15:45
DrgLena Если данные содержат информацию, которая может быт... 11.12.2008 - 16:57
DoctorStat Цитата(DrgLena @ 11.12.2008 - 16:57)... 11.12.2008 - 17:45
DrgLena Вы, очевидно не поняли, что дело не в новых метода... 11.12.2008 - 17:54
DoctorStat Цитата(DrgLena @ 11.12.2008 - 17:54)... 11.12.2008 - 20:18
DrgLena Да, вы извлекли какую- то информацию. А именно, на... 11.12.2008 - 22:42
DoctorStat Цитата(DrgLena @ 11.12.2008 - 22:42)... 12.12.2008 - 11:49
autumn Уважаемый DrStat
Я коллега Anny_K.
Мы провели ана... 12.12.2008 - 13:35
DoctorStat Цитата(autumn @ 12.12.2008 - 13:35) ... 12.12.2008 - 14:09
autumn Цитата(DoctorStat @ 12.12.2008 - 15... 12.12.2008 - 15:51
DoctorStat Цитата(autumn @ 12.12.2008 - 15:51) ... 12.12.2008 - 16:13
autumn Цитата(DoctorStat @ 12.12.2008 - 17... 13.12.2008 - 12:38
DoctorStat Цитата(autumn @ 13.12.2008 - 12:38) ... 13.12.2008 - 14:22
autumn Цитата(DoctorStat @ 13.12.2008 - 15... 13.12.2008 - 16:09
DoctorStat Цитата(autumn @ 13.12.2008 - 16:09) ... 13.12.2008 - 16:43
DrgLena DoctorStat, всю технологию описал на своем сайте h... 12.12.2008 - 16:08
DrgLena Autumn, не могу сказать, чтобы я разобралась, поче... 12.12.2008 - 20:41
autumn Извините, я как-то забыл про комментарии.
Квадрант... 12.12.2008 - 21:21
DrgLena Большое спасибо, я поняла. Теперь я вижу, что резу... 12.12.2008 - 22:52
DrgLena Очевидно, моих аргументов не хватило для того, что... 13.12.2008 - 19:15
DoctorStat Цитата(DrgLena @ 13.12.2008 - 19:15)... 13.12.2008 - 20:43
плав Цитата(DoctorStat @ 13.12.2008 - 20... 13.12.2008 - 21:45
Анна_К С файлом Stenocardia.xls разобрались. Но мне так и... 13.12.2008 - 20:05
DoctorStat Цитата(Анна_К @ 13.12.2008 - 20:05) ... 13.12.2008 - 20:49
DrgLena Цитата(DoctorStat @ 13.12.2008 - 21... 14.12.2008 - 00:17
DoctorStat Цитата(DrgLena @ 14.12.2008 - 00:17)... 14.12.2008 - 14:19
DoctorStat Чтобы показать для чего нужна кластеризация, я сра... 14.12.2008 - 22:51
autumn DoctorStat, существование искусственных данных, дл... 15.12.2008 - 12:10
DoctorStat Цитата(autumn @ 15.12.2008 - 13:10) ... 3.07.2009 - 10:20
DrgLena Итак, у вас есть больной у которого первый вариант... 15.12.2008 - 13:06![]() ![]() |