Как создать формулу для расчета прогноза?

Как создать формулу для расчета прогноза?

Solo... Просмотр профиля	15.10.2008 - 21:08 Сообщение #1
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369	Всем здравствуйте. Прошу опять помощи. Стоит такая задача. Как создать формулу, с помощью которой можно вычислить вероятность положительного исхода лечения у конкретного больного. Т.е. формулу, в которую можно подставлять данные (признаки, разные показатели и пр.) конкретного обратившегося за помощью больного, далее получать с помощью этой формулы какую то цифру - % (70%, или 60, или 95 ... и т.д.). Эта цифра и будет отражать вероятность положительного исхода лечения этого больного. Имеются результаты лечения около 100 больных, известны все их показатели, влияющие на результат лечения. Этих показателей - около 5-6. Все они должны входить в формулу. Я слышала, что этой формулой является дискриминантное уравнение. Но как его построить? В Экселе или в Статистике?

Ответов

DrgLena Просмотр профиля	13.12.2008 - 19:15 Сообщение #2
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Очевидно, моих аргументов не хватило для того, чтобы убедить DoctorStat в том, что он проделал, называется манипуляция данными с целью получить p<0,05. Почему манипуляция, потому что гены А и Б в результате анализа объявлены ответственными за развитие болезни, а на самом деле этот не так. Это как раз яркий пример того, как ошибки в статистике приводят к неверным выводам. Гланц объединил в одну группу физкультурниц и спортсменок, назвал их бегуньи, и относительно контрольной группы анализировал обращаемость и доказал различия между бегуньями и контролем. Вы же объединили в одну группу несколько худшие сочетания двух аллелей одного и того же гена и назвали их больными (при этом каждый из них в отдельности больным не является), как будто они могут сразу все быть у больных, а другую группу сочетаний аллелей по одному и тому же гену назвали здоровыми , как будто они все сразу могут быть у здоровых. С точки зрения генетики - это чистый бред, как и игнорирование вами редких или полиморфных генов. Именно они могут быть ответственными за болезнь. С точки зрения статистики, вы почему то упорно желаете, чтобы между больным кластером и здоровым кластером (в кавычках как больные, так и кластеры) было p<0,05. А нужно показать, что между определенным генотипом (пусть пока по одному гену) и болезнью есть сопряженность. Если вы хотите использовать кластерный анализ, то с его помощью в пространстве многих генов и их алеллей находят группы схожих по многим признакам т.е. по генетическим признакам, выделяют и описывают их особенности, а потом ищут связь определенного генотипа с заболеванием. То, что результат полученный разными методами анализа сходится, говорит о том, что в ваших данных он был заложен, но извлекали мы его по разному, я очень старым методом, меня научили здесь на этом сайте, год назад я пришла сюда с вопросом, Плав и Игорь мне очень помогли, познакомив с методами теории информации, второй ваш аппонент применил другой алгоритм извлечения данных data-mining. Вы продолжаете настаивать на своих выводах по первому набору данных ?

DoctorStat Просмотр профиля	13.12.2008 - 20:43 Сообщение #3
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(DrgLena @ 13.12.2008 - 19:15) гены А и Б в результате анализа объявлены ответственными за развитие болезни, а на самом деле этот не так Как на самом деле не знает никто. Цитата(DrgLena @ 13.12.2008 - 19:15) Вы же объединили в одну группу несколько худшие сочетания двух аллелей одного и того же гена и назвали их больными (при этом каждый из них в отдельности больным не является) Как правило, все гены высокополиморфны, т.е. обладают большой изменчивостью, см.гистограммы частот генотипов генов А, В, С в предыдущих сообщениях. Размеры выборок больных, наоборот, очень малы. Набрать группу больных, чтобы получить хорошую значимость по ОТДЕЛЬНЫМ генотипам практически невозможно. Поэтому приходится придумывать обходные пути. Какие? А вот какие. Если какой-то генотип встречается чаще в выборке больных, мы говорим, что он увеличивает риск заболевания. Пусть ненамного, но увеличивает. Поэтому он является кандидатом для включения в кластер «больных генотипов». Сначала методом кластеризации формируются больные и здоровые группы генотипов и методом хи-квадрат проверяется их внутри-кластерная однородность, т.е. одинаковая частота встречаемости генотипов внутри кластера. После этого тем же методом проверяется межкластерное различие (расстояние). Все, дело сделано! Внутри кластера генотипы встречаются с одинаковой частотой, а частота самих кластеров в разных выборках отличается. Значит, принадлежность какого-либо генотипа к «больному» кластеру увеличивает риск заболевания. Где здесь противоречие?? Мы говорим, не «больной» генотип, а «больной» КЛАСТЕР генотипов! Ведь мы доказали, что этот кластер встречается в выборке «больных» достоверно чаще!! Используя термин кластер, с помощью логистической регрессии вычисляется его роль в повышении риска заболевания, доля больных пациентов, объясняемая кластером и т.д. Забудьте слово генотип и выучите слово кластер!!! Цитата(DrgLena @ 13.12.2008 - 19:15) Вы продолжаете настаивать на своих выводах по первому набору данных ? Горбатого могила исправит. Сообщение отредактировал DoctorStat - 13.12.2008 - 20:51 Просто включи мозги => http://doctorstat.narod.ru

плав Просмотр профиля	13.12.2008 - 21:45 Сообщение #4
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(DoctorStat @ 13.12.2008 - 20:43) Как на самом деле не знает никто. Сначала методом кластеризации формируются больные и здоровые группы генотипов и методом хи-квадрат проверяется их внутри-кластерная однородность, т.е. одинаковая частота встречаемости генотипов внутри кластера. После этого тем же методом проверяется межкластерное различие (расстояние). Все, дело сделано! Внутри кластера генотипы встречаются с одинаковой частотой, а частота самих кластеров в разных выборках отличается. Значит, принадлежность какого-либо генотипа к «больному» кластеру увеличивает риск заболевания. Где здесь противоречие?? Мы говорим, не «больной» генотип, а «больной» КЛАСТЕР генотипов! Ведь мы доказали, что этот кластер встречается в выборке «больных» достоверно чаще!! Не хотел вмешиваться, но это будут читать и люди, которые не очень хорошо разбираются в статистических методах и, соответственно, не поймут в чем тут уловка. А она в том, что процедура кластеризации сделана так, что она собирает похожие объекты и ее задачей является минимизация расстояний внутри кластера и максимизация вне. Соответственно, кластерный анализ ВСЕГДА находит группы с достоверными отличиями. Любой может это сделать путем простого эксперимента - сгенерируйте нормальную популяцию, затем сделайте кластерный анализ и проанализируйте достоверность различия между кластерами. Чтобы не быть голословным, привожу код R для подобного эксперимента и результат: > pop.n<-rnorm(1000,120,20) > cl<-kmeans(pop.n,3) > anova(lm(pop.n~factor(cl$cluster))) Analysis of Variance Table Response: pop.n Df Sum Sq Mean Sq F value Pr(>F) factor(cl$cluster) 2 326427 163213 2009.5 < 2.2e-16 * Residuals 997 80975 81 --- Signif. codes: 0 ?? 0.001 ?? 0.01 ?? 0.05 ?.? 0.1 ? ? 1 Различия между кластерами высокодостоверны! Хотя я "кластеризовал" гомогенную популяциюс нормальным распределением признака. Так вот можно сгенерировать группы "больных" из гомогенной популяции. Для биномиальных экспериментов все будет аналогично, поскольку логика одна и та же.

Сообщений в этой теме

Solo... Как создать формулу для расчета прогноза? 15.10.2008 - 21:08

DoctorStat 1. Выявление клинически значимых параметров и их в... 16.10.2008 - 10:50

Игорь Цитата(Solo... @ 15.10.2008 - 21:08)... 20.10.2008 - 09:18

Анна_К Цитата(Solo... @ 15.10.2008 - 22:08)... 23.10.2008 - 13:16

Solo... Я побывала на вашем форуме. Но , если честно, не р... 7.12.2008 - 18:42

Анна_К Цитата(Solo... @ 7.12.2008 - 18:42) ... 8.12.2008 - 11:28

плав Ну, во-первых создать на 100 больных формулу, кото... 7.12.2008 - 20:22

Анна_К Цитата(плав @ 7.12.2008 - 20:22) Ну,... 8.12.2008 - 12:26

плав Цитата(Анна_К @ 8.12.2008 - 12:26) D... 8.12.2008 - 13:35

Анна_К Цитата(плав @ 8.12.2008 - 13:35) Это... 8.12.2008 - 21:50

DoctorStat Цитата(Анна_К @ 8.12.2008 - 21:50) П... 8.12.2008 - 22:25

Анна_К Цитата(DoctorStat @ 8.12.2008 - 22:2... 9.12.2008 - 14:27

DoctorStat Цитата(Анна_К @ 9.12.2008 - 14:27) С... 9.12.2008 - 16:28

Анна_К Цитата(DoctorStat @ 9.12.2008 - 16:2... 9.12.2008 - 18:41

DoctorStat Цитата(Анна_К @ 9.12.2008 - 18:41) П... 9.12.2008 - 19:55

Анна_К Цитата(DoctorStat @ 9.12.2008 - 19:5... 9.12.2008 - 21:50

DoctorStat Цитата(Анна_К @ 9.12.2008 - 21:50) Е... 9.12.2008 - 22:03

плав Цитата(Анна_К @ 8.12.2008 - 21:50) П... 8.12.2008 - 22:38

Анна_К Для обсуждаемых данных, вероятно, подойдет метод С... 8.12.2008 - 12:30

DrgLena Если уж наблюдать битву гигантов, то давайте вспом... 9.12.2008 - 18:25

Анна_К Цитата(DrgLena @ 9.12.2008 - 18:25) ... 9.12.2008 - 18:55

DoctorStat Цитата(DrgLena @ 9.12.2008 - 18:25) ... 9.12.2008 - 20:19

плав Цитата(DoctorStat @ 9.12.2008 - 20:1... 9.12.2008 - 22:52

Анна_К Извините, plav, Вам отвечаю позже всех. Слишком мн... 9.12.2008 - 19:35

плав Цитата(Анна_К @ 9.12.2008 - 19:35) М... 9.12.2008 - 22:44

DrgLena Да, действительно, DoktorStat, на основании предст... 10.12.2008 - 00:36

плав Цитата(DrgLena @ 10.12.2008 - 00:36)... 10.12.2008 - 12:39

Анна_К Цитата(DrgLena @ 10.12.2008 - 00:36)... 10.12.2008 - 15:09

DoctorStat Цитата(Анна_К @ 10.12.2008 - 15:09) ... 10.12.2008 - 15:17

DrgLena Да, логика железная! У умерших от первого прис... 10.12.2008 - 13:05

DoctorStat Цитата(DrgLena @ 10.12.2008 - 13:05)... 10.12.2008 - 13:48

плав А вот это сделать сложно. Люди просто умерли (внез... 10.12.2008 - 14:32

DrgLena Это план исследования или уже есть результаты? Чащ... 10.12.2008 - 14:36

DoctorStat Цитата(DrgLena @ 10.12.2008 - 14:36)... 10.12.2008 - 14:42

Анна_К Цитата(плав @ 9.12.2008 - 22:44) Ну ... 10.12.2008 - 15:12

Анна_К Цитата(плав @ 9.12.2008 - 22:44) 3) ... 10.12.2008 - 15:14

DrgLena DoctorStat, Да, я упустила пару ответов. Одноврем... 10.12.2008 - 15:25

DoctorStat Цитата(DrgLena @ 10.12.2008 - 15:25)... 10.12.2008 - 15:33

Анна_К Цитата(DrgLena @ 10.12.2008 - 15:25)... 10.12.2008 - 15:55

DoctorStat Цитата(Анна_К @ 10.12.2008 - 15:55) ... 10.12.2008 - 17:03

Анна_К Цитата(DoctorStat @ 10.12.2008 - 17... 10.12.2008 - 20:23

DoctorStat Цитата(Анна_К @ 10.12.2008 - 20:23) ... 10.12.2008 - 20:32

Анна_К Цитата(DoctorStat @ 10.12.2008 - 20... 10.12.2008 - 23:21

DrgLena Дождаться "полного ответа" мне не удало... 10.12.2008 - 16:05

DoctorStat Цитата(DrgLena @ 10.12.2008 - 16:05)... 10.12.2008 - 16:23

DrgLena Вы дали пример, его и решайте. Бог с ним с сайтом ... 10.12.2008 - 16:46

DoctorStat Цитата(DrgLena @ 10.12.2008 - 16:46)... 10.12.2008 - 16:54

DrgLena Предлагаю "правильными" данными считать ... 10.12.2008 - 21:24

DoctorStat Цитата(DrgLena @ 10.12.2008 - 21:24)... 10.12.2008 - 21:36

DrgLena Доктор DoctorStar, вы главный участник битвы гиган... 10.12.2008 - 22:13

DoctorStat Данные взяты из самого первого файла Stenocardia.r... 11.12.2008 - 11:59

DrgLena Чего только не сделает доктор, чтобы получить жела... 11.12.2008 - 14:06

DoctorStat Цитата(DrgLena @ 11.12.2008 - 14:06)... 11.12.2008 - 14:35

DrgLena Да, я посетила ваш сайт и проследила за ходом выпо... 11.12.2008 - 15:32

DoctorStat Цитата(DrgLena @ 11.12.2008 - 15:32)... 11.12.2008 - 15:45

DrgLena Если данные содержат информацию, которая может быт... 11.12.2008 - 16:57

DoctorStat Цитата(DrgLena @ 11.12.2008 - 16:57)... 11.12.2008 - 17:45

DrgLena Вы, очевидно не поняли, что дело не в новых метода... 11.12.2008 - 17:54

DoctorStat Цитата(DrgLena @ 11.12.2008 - 17:54)... 11.12.2008 - 20:18

DrgLena Да, вы извлекли какую- то информацию. А именно, на... 11.12.2008 - 22:42

DoctorStat Цитата(DrgLena @ 11.12.2008 - 22:42)... 12.12.2008 - 11:49

autumn Уважаемый DrStat Я коллега Anny_K. Мы провели ана... 12.12.2008 - 13:35

DoctorStat Цитата(autumn @ 12.12.2008 - 13:35) ... 12.12.2008 - 14:09

autumn Цитата(DoctorStat @ 12.12.2008 - 15... 12.12.2008 - 15:51

DoctorStat Цитата(autumn @ 12.12.2008 - 15:51) ... 12.12.2008 - 16:13

autumn Цитата(DoctorStat @ 12.12.2008 - 17... 13.12.2008 - 12:38

DoctorStat Цитата(autumn @ 13.12.2008 - 12:38) ... 13.12.2008 - 14:22

autumn Цитата(DoctorStat @ 13.12.2008 - 15... 13.12.2008 - 16:09

DoctorStat Цитата(autumn @ 13.12.2008 - 16:09) ... 13.12.2008 - 16:43

DrgLena DoctorStat, всю технологию описал на своем сайте h... 12.12.2008 - 16:08

DrgLena Autumn, не могу сказать, чтобы я разобралась, поче... 12.12.2008 - 20:41

autumn Извините, я как-то забыл про комментарии. Квадрант... 12.12.2008 - 21:21

DrgLena Большое спасибо, я поняла. Теперь я вижу, что резу... 12.12.2008 - 22:52

DrgLena Очевидно, моих аргументов не хватило для того, что... 13.12.2008 - 19:15

DoctorStat Цитата(DrgLena @ 13.12.2008 - 19:15)... 13.12.2008 - 20:43

плав Цитата(DoctorStat @ 13.12.2008 - 20... 13.12.2008 - 21:45

Анна_К С файлом Stenocardia.xls разобрались. Но мне так и... 13.12.2008 - 20:05

DoctorStat Цитата(Анна_К @ 13.12.2008 - 20:05) ... 13.12.2008 - 20:49

DrgLena Цитата(DoctorStat @ 13.12.2008 - 21... 14.12.2008 - 00:17

DoctorStat Цитата(DrgLena @ 14.12.2008 - 00:17)... 14.12.2008 - 14:19

DoctorStat Чтобы показать для чего нужна кластеризация, я сра... 14.12.2008 - 22:51

autumn DoctorStat, существование искусственных данных, дл... 15.12.2008 - 12:10

DoctorStat Цитата(autumn @ 15.12.2008 - 13:10) ... 3.07.2009 - 10:20

DrgLena Итак, у вас есть больной у которого первый вариант... 15.12.2008 - 13:06

« Предыдущая тема · Медицинская статистика · Следующая тема »