Здравствуйте, гость ( Вход | Регистрация )
15.10.2008 - 21:08
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 |
Всем здравствуйте. Прошу опять помощи.
Стоит такая задача. Как создать формулу, с помощью которой можно вычислить вероятность положительного исхода лечения у конкретного больного. Т.е. формулу, в которую можно подставлять данные (признаки, разные показатели и пр.) конкретного обратившегося за помощью больного, далее получать с помощью этой формулы какую то цифру - % (70%, или 60, или 95 ... и т.д.). Эта цифра и будет отражать вероятность положительного исхода лечения этого больного. Имеются результаты лечения около 100 больных, известны все их показатели, влияющие на результат лечения. Этих показателей - около 5-6. Все они должны входить в формулу. Я слышала, что этой формулой является дискриминантное уравнение. Но как его построить? В Экселе или в Статистике? |
|
|
![]() |
![]() |
![]() |
9.12.2008 - 19:35
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 18 Регистрация: 23.10.2008 Пользователь №: 5430 |
Извините, plav, Вам отвечаю позже всех. Слишком много надо было писать.
Начну отвечать с конца. Там наиболее фундаментальные и общие возражения. В целом сдается, что Вы думаете, что Ваши методы какое-то откровение, а не просто новояз окружающий комбинацию из хорошо известных регрессионных подходов (пусть и нелинейной регрессии), кластерного и факторного анализов. Кстати, методы MCMC, на который Вы так часто ссылаетесь, как на новое слово, в классической статистике используются уже давно, да вообщем-то и методы с интенсивным использованием ЭВМ (bootstrap), тоже с повторными выборками, для оценки коэффициентов регрессии никто не отменял. Вообще-то на такой полемический задор смотреть смешно, ну, понятно, есть увлечения, но не стоит считать, что вокруг все лаптем щи хлебают, а тут "дао снизошло". Лучше посмотрите книги по Data Mining, не в Москве изданные, а там, где термин зародился, тут интересу ради просто повернулся и сборник под ред. Bozdogan'а посмотрел - штуки четыре статьи об использовании логистической регрессии в DM. А Вы о "нашей логистической регрессии". Это, действительно, НЕ "новояз окружающий комбинацию из хорошо известных регрессионных подхоов"...! Методы существуют не 20 лет, а около 40 - с 70-х гг. прошлого столетия. Начиналось все с прогноза полезных ископаемых по пробам грунта. Жизнь не стоит на месте. И теоретические методы, которые были сочинены давно, но не могли применяться в связи колоссальной трудоемкостью, теперь спокойно программируются и работают. 10 лет назад мы ждали результата счета сутками, сейчас на пентиуме4 = всего минут 20-30. Хотя при большом числе объектов и признаков (несколько сотен) счет все-таки приходится оставлять на ночь. Никто не унижает Ваши, plav, глубокие познания в статистике, просто захотелось рассказать о том, что создается у меня на глазах (в ВЦ РАН). У нас в России есть странная привычка "молиться" на зарубежье, и не замечать, пренебрегать достижениями наших ученых-математиков. Работа идет, и это, пожалуй, одна из немногих областей, где не нужны электронные микроскопы и дорогостоящие реактивы, поэтому лаборатории остаются и функционируют в полную силу. Короче, кроме "логистической регрессии", существуют разные подходы 6) Вы не ошиблись насчет коэффициента корреляции как показателя точности распознавания? С квадратом коэффициента не перепутали? Или не понимаете о чем это я? И расскажите, как Вы считаете коэффициент корреляции между "реальным номером группы ... и его функцией номера класса". Какой коэффициент корреляции Вы считаете? Реальный номер группы он у Вас всегда ординальный? Или, не побоюсь этого слова, интервальный? Или? А если "реальный номер группы" 1 или 0 (т.е. болен - не болен), какой корреляционный коэффициент используете? Это простой привычный коэффициент корреляции. Не перепутала. Понимаю. Формулу можно посмотреть в наших ранних публикациях. Реальный номер группы всегда натуральный: 1, 2, 3... Если группа 0, меняем ее на 2. Поймите, что мы ищем коэффициент корреляции не между номерами исследуемых групп, а между истинным номером группы и результатом его прогноза (после работы алгоритма распознавания). 5) Если Вы кому-то рекомендуете составлять диагностические алгоритмы на 30 пациентах, мне очень жаль пациентов, которые потом будут получать помощь от таких "разработчиков" и я сильно надеюсь, что в случае судебных исков за ненадлежащее врачевание в адрес "разработчиков" уйдет частное определение. Никогда диагноз не ставится на основе какого-либо компьютерного решения. Диагноз ставит врач. Вся ответственность лежит на нем. Компьютерные методы только рекомендуют, и их точность равна вероятности, с которой работает данный метод. 4) Как Вы думаете, если я не представляю себе, как работает "скользящий контроль", почему я упоминаю leave-one-out? На этот вопрос мой коллега (автор алгоритма оптимальных разбиений) ответил так: «Вы не знаете термин ?скользящий контроль? !? Это абсолютно базовое понятие в современном прогнозировании. Прочитайте любую статью. Это вовсе не jackknife. Leave-one-out ? частный случай скользящего контроля. Смысл данного понятия именно в проверке точности прогноза. Выборка последовательно делится на подвыборки; обучающую и контрольную. На одной происходит обучение, на другой контроль. Процесс повторяется многократно. Где же здесь подгонка? Максимизация точности в режиме скользящий контроль действительно иногда производится путём манипулирования параметрами модели. Но это абсолютная ПРОФАНАЦИЯ метода. Вероятно, вы именно это имели в виду, когда писали: «при помощи методов leave-one-out обычно проводится ПОСТРОЕНИЕ модели». Результатам скользящего контроля в этом случае нельзя доверять. Кстати, вы можете с таким же успехом добиваться максимизации точности на контрольной выборке (другом наборе данных), меняя параметры модели». 3) Как эти доказательства были получены. И знаете, работает, хотя функция получена в Америке 1960х, а проверена на российской популяции 1980х. Предсказывает. А Вы можете такое же? Проверку на другой, не связанной с первой популяцией, другой группе больных. Доказательства, например, по распознаванию типа инсульта. В приемном покое врач с точностью 60% проводит дифференциальный диагноз между ишемическим и геморрагическим типами инсульта. Наше распознающее правило дало 85-90%. Нейронные сети с отладкой по генетическому алгоритму дали 99%, о чем и была защищена докторская диссертация. Но мы считаем, что это как раз и была подгонка. И наши результаты дающие не столь высокий результат ? намного устойчивее, и не боятся поступления в выборку новых данных. Все голословные утверждения ничего не стоят, пока не будет проведено честное сравнение результатов распознавания. 2) Будьте добры - в общих чертах - теоретическое обоснование метода, а то из всех возражений этот кусок (особенно с достоверностями, он как раз базируется на знании классической статистики) был проигнорирован. Senko O.V., Kuznetsova A.V. The Optimal Valid Partitioning Procedures, Электронный рецензируемый журнал «InterStat», http://ip.statjournals.net:2002/InterStat/...les/0604002.pdf, http://interstat.statjournals.net/ Может быть, это Вам поможет. 1) Почему именно на 30 объектах. Будьте добры теоретическое обоснование. Просто так нас учили на кафедре математики на медико-биологическом факультете РГМУ (Бывшего II МОЛГМИ им. Н.И.Пирогова), отделении медицинская кибернетика. И это оправдало себя на практике. Хотя с меньшим числом объектов и приходилось работать, но мы всегда знали, что это первоначальный алгоритм, требующий пополнения выборки. |
|
|
![]() |
![]() |
Solo... Как создать формулу для расчета прогноза? 15.10.2008 - 21:08
DoctorStat 1. Выявление клинически значимых параметров и их в... 16.10.2008 - 10:50
Игорь Цитата(Solo... @ 15.10.2008 - 21:08)... 20.10.2008 - 09:18
Анна_К Цитата(Solo... @ 15.10.2008 - 22:08)... 23.10.2008 - 13:16
Solo... Я побывала на вашем форуме. Но , если честно, не р... 7.12.2008 - 18:42
Анна_К Цитата(Solo... @ 7.12.2008 - 18:42) ... 8.12.2008 - 11:28
плав Ну, во-первых создать на 100 больных формулу, кото... 7.12.2008 - 20:22
Анна_К Цитата(плав @ 7.12.2008 - 20:22) Ну,... 8.12.2008 - 12:26
плав Цитата(Анна_К @ 8.12.2008 - 12:26) D... 8.12.2008 - 13:35
Анна_К Цитата(плав @ 8.12.2008 - 13:35) Это... 8.12.2008 - 21:50
DoctorStat Цитата(Анна_К @ 8.12.2008 - 21:50) П... 8.12.2008 - 22:25

Анна_К Цитата(DoctorStat @ 8.12.2008 - 22:2... 9.12.2008 - 14:27

DoctorStat Цитата(Анна_К @ 9.12.2008 - 14:27) С... 9.12.2008 - 16:28

Анна_К Цитата(DoctorStat @ 9.12.2008 - 16:2... 9.12.2008 - 18:41

DoctorStat Цитата(Анна_К @ 9.12.2008 - 18:41) П... 9.12.2008 - 19:55

Анна_К Цитата(DoctorStat @ 9.12.2008 - 19:5... 9.12.2008 - 21:50

DoctorStat Цитата(Анна_К @ 9.12.2008 - 21:50) Е... 9.12.2008 - 22:03
плав Цитата(Анна_К @ 8.12.2008 - 21:50) П... 8.12.2008 - 22:38
Анна_К Для обсуждаемых данных, вероятно, подойдет метод С... 8.12.2008 - 12:30
DrgLena Если уж наблюдать битву гигантов, то давайте вспом... 9.12.2008 - 18:25
Анна_К Цитата(DrgLena @ 9.12.2008 - 18:25) ... 9.12.2008 - 18:55
DoctorStat Цитата(DrgLena @ 9.12.2008 - 18:25) ... 9.12.2008 - 20:19
плав Цитата(DoctorStat @ 9.12.2008 - 20:1... 9.12.2008 - 22:52
плав Цитата(Анна_К @ 9.12.2008 - 19:35) М... 9.12.2008 - 22:44
DrgLena Да, действительно, DoktorStat, на основании предст... 10.12.2008 - 00:36
плав Цитата(DrgLena @ 10.12.2008 - 00:36)... 10.12.2008 - 12:39
Анна_К Цитата(DrgLena @ 10.12.2008 - 00:36)... 10.12.2008 - 15:09
DoctorStat Цитата(Анна_К @ 10.12.2008 - 15:09) ... 10.12.2008 - 15:17
DrgLena Да, логика железная!
У умерших от первого прис... 10.12.2008 - 13:05
DoctorStat Цитата(DrgLena @ 10.12.2008 - 13:05)... 10.12.2008 - 13:48
плав А вот это сделать сложно. Люди просто умерли (внез... 10.12.2008 - 14:32
DrgLena Это план исследования или уже есть результаты? Чащ... 10.12.2008 - 14:36
DoctorStat Цитата(DrgLena @ 10.12.2008 - 14:36)... 10.12.2008 - 14:42
Анна_К Цитата(плав @ 9.12.2008 - 22:44) Ну ... 10.12.2008 - 15:12
Анна_К Цитата(плав @ 9.12.2008 - 22:44) 3) ... 10.12.2008 - 15:14
DrgLena DoctorStat,
Да, я упустила пару ответов. Одноврем... 10.12.2008 - 15:25
DoctorStat Цитата(DrgLena @ 10.12.2008 - 15:25)... 10.12.2008 - 15:33
Анна_К Цитата(DrgLena @ 10.12.2008 - 15:25)... 10.12.2008 - 15:55
DoctorStat Цитата(Анна_К @ 10.12.2008 - 15:55) ... 10.12.2008 - 17:03
Анна_К Цитата(DoctorStat @ 10.12.2008 - 17... 10.12.2008 - 20:23
DoctorStat Цитата(Анна_К @ 10.12.2008 - 20:23) ... 10.12.2008 - 20:32
Анна_К Цитата(DoctorStat @ 10.12.2008 - 20... 10.12.2008 - 23:21
DrgLena Дождаться "полного ответа" мне не удало... 10.12.2008 - 16:05
DoctorStat Цитата(DrgLena @ 10.12.2008 - 16:05)... 10.12.2008 - 16:23
DrgLena Вы дали пример, его и решайте. Бог с ним с сайтом ... 10.12.2008 - 16:46
DoctorStat Цитата(DrgLena @ 10.12.2008 - 16:46)... 10.12.2008 - 16:54
DrgLena Предлагаю "правильными" данными считать ... 10.12.2008 - 21:24
DoctorStat Цитата(DrgLena @ 10.12.2008 - 21:24)... 10.12.2008 - 21:36
DrgLena Доктор DoctorStar, вы главный участник битвы гиган... 10.12.2008 - 22:13
DoctorStat Данные взяты из самого первого файла Stenocardia.r... 11.12.2008 - 11:59
DrgLena Чего только не сделает доктор, чтобы получить жела... 11.12.2008 - 14:06
DoctorStat Цитата(DrgLena @ 11.12.2008 - 14:06)... 11.12.2008 - 14:35
DrgLena Да, я посетила ваш сайт и проследила за ходом выпо... 11.12.2008 - 15:32
DoctorStat Цитата(DrgLena @ 11.12.2008 - 15:32)... 11.12.2008 - 15:45
DrgLena Если данные содержат информацию, которая может быт... 11.12.2008 - 16:57
DoctorStat Цитата(DrgLena @ 11.12.2008 - 16:57)... 11.12.2008 - 17:45
DrgLena Вы, очевидно не поняли, что дело не в новых метода... 11.12.2008 - 17:54
DoctorStat Цитата(DrgLena @ 11.12.2008 - 17:54)... 11.12.2008 - 20:18
DrgLena Да, вы извлекли какую- то информацию. А именно, на... 11.12.2008 - 22:42
DoctorStat Цитата(DrgLena @ 11.12.2008 - 22:42)... 12.12.2008 - 11:49
autumn Уважаемый DrStat
Я коллега Anny_K.
Мы провели ана... 12.12.2008 - 13:35
DoctorStat Цитата(autumn @ 12.12.2008 - 13:35) ... 12.12.2008 - 14:09
autumn Цитата(DoctorStat @ 12.12.2008 - 15... 12.12.2008 - 15:51
DoctorStat Цитата(autumn @ 12.12.2008 - 15:51) ... 12.12.2008 - 16:13
autumn Цитата(DoctorStat @ 12.12.2008 - 17... 13.12.2008 - 12:38
DoctorStat Цитата(autumn @ 13.12.2008 - 12:38) ... 13.12.2008 - 14:22
autumn Цитата(DoctorStat @ 13.12.2008 - 15... 13.12.2008 - 16:09
DoctorStat Цитата(autumn @ 13.12.2008 - 16:09) ... 13.12.2008 - 16:43
DrgLena DoctorStat, всю технологию описал на своем сайте h... 12.12.2008 - 16:08
DrgLena Autumn, не могу сказать, чтобы я разобралась, поче... 12.12.2008 - 20:41
autumn Извините, я как-то забыл про комментарии.
Квадрант... 12.12.2008 - 21:21
DrgLena Большое спасибо, я поняла. Теперь я вижу, что резу... 12.12.2008 - 22:52
DrgLena Очевидно, моих аргументов не хватило для того, что... 13.12.2008 - 19:15
DoctorStat Цитата(DrgLena @ 13.12.2008 - 19:15)... 13.12.2008 - 20:43
плав Цитата(DoctorStat @ 13.12.2008 - 20... 13.12.2008 - 21:45
Анна_К С файлом Stenocardia.xls разобрались. Но мне так и... 13.12.2008 - 20:05
DoctorStat Цитата(Анна_К @ 13.12.2008 - 20:05) ... 13.12.2008 - 20:49
DrgLena Цитата(DoctorStat @ 13.12.2008 - 21... 14.12.2008 - 00:17
DoctorStat Цитата(DrgLena @ 14.12.2008 - 00:17)... 14.12.2008 - 14:19
DoctorStat Чтобы показать для чего нужна кластеризация, я сра... 14.12.2008 - 22:51
autumn DoctorStat, существование искусственных данных, дл... 15.12.2008 - 12:10
DoctorStat Цитата(autumn @ 15.12.2008 - 13:10) ... 3.07.2009 - 10:20
DrgLena Итак, у вас есть больной у которого первый вариант... 15.12.2008 - 13:06![]() ![]() |