Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Как создать формулу для расчета прогноза?
Solo...
сообщение 15.10.2008 - 21:08
Сообщение #1





Группа: Пользователи
Сообщений: 35
Регистрация: 3.10.2008
Из: Москва
Пользователь №: 5369



Всем здравствуйте. Прошу опять помощи.
Стоит такая задача. Как создать формулу, с помощью которой можно вычислить вероятность положительного исхода лечения у конкретного больного. Т.е. формулу, в которую можно подставлять данные (признаки, разные показатели и пр.) конкретного обратившегося за помощью больного, далее получать с помощью этой формулы какую то цифру - % (70%, или 60, или 95 ... и т.д.). Эта цифра и будет отражать вероятность положительного исхода лечения этого больного.

Имеются результаты лечения около 100 больных, известны все их показатели, влияющие на результат лечения. Этих показателей - около 5-6. Все они должны входить в формулу.

Я слышала, что этой формулой является дискриминантное уравнение. Но как его построить? В Экселе или в Статистике?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
DrgLena
сообщение 13.12.2008 - 19:15
Сообщение #2





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Очевидно, моих аргументов не хватило для того, чтобы убедить DoctorStat в том, что он проделал, называется манипуляция данными с целью получить p<0,05. Почему манипуляция, потому что гены А и Б в результате анализа объявлены ответственными за развитие болезни, а на самом деле этот не так. Это как раз яркий пример того, как ошибки в статистике приводят к неверным выводам.

Гланц объединил в одну группу физкультурниц и спортсменок, назвал их бегуньи, и относительно контрольной группы анализировал обращаемость и доказал различия между бегуньями и контролем. Вы же объединили в одну группу несколько худшие сочетания двух аллелей одного и того же гена и назвали их больными (при этом каждый из них в отдельности больным не является), как будто они могут сразу все быть у больных, а другую группу сочетаний аллелей по одному и тому же гену назвали здоровыми , как будто они все сразу могут быть у здоровых. С точки зрения генетики - это чистый бред, как и игнорирование вами редких или полиморфных генов. Именно они могут быть ответственными за болезнь.

С точки зрения статистики, вы почему то упорно желаете, чтобы между больным кластером и здоровым кластером (в кавычках как больные, так и кластеры) было p<0,05. А нужно показать, что между определенным генотипом (пусть пока по одному гену) и болезнью есть сопряженность. Если вы хотите использовать кластерный анализ, то с его помощью в пространстве многих генов и их алеллей находят группы схожих по многим признакам т.е. по генетическим признакам, выделяют и описывают их особенности, а потом ищут связь определенного генотипа с заболеванием.
То, что результат полученный разными методами анализа сходится, говорит о том, что в ваших данных он был заложен, но извлекали мы его по разному, я очень старым методом, меня научили здесь на этом сайте, год назад я пришла сюда с вопросом, Плав и Игорь мне очень помогли, познакомив с методами теории информации, второй ваш аппонент применил другой алгоритм извлечения данных data-mining. Вы продолжаете настаивать на своих выводах по первому набору данных ?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 13.12.2008 - 20:43
Сообщение #3





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(DrgLena @ 13.12.2008 - 19:15) *
гены А и Б в результате анализа объявлены ответственными за развитие болезни, а на самом деле этот не так
Как на самом деле не знает никто.
Цитата(DrgLena @ 13.12.2008 - 19:15) *
Вы же объединили в одну группу несколько худшие сочетания двух аллелей одного и того же гена и назвали их больными (при этом каждый из них в отдельности больным не является)
Как правило, все гены высокополиморфны, т.е. обладают большой изменчивостью, см.гистограммы частот генотипов генов А, В, С в предыдущих сообщениях. Размеры выборок больных, наоборот, очень малы. Набрать группу больных, чтобы получить хорошую значимость по ОТДЕЛЬНЫМ генотипам практически невозможно. Поэтому приходится придумывать обходные пути. Какие? А вот какие. Если какой-то генотип встречается чаще в выборке больных, мы говорим, что он увеличивает риск заболевания. Пусть ненамного, но увеличивает. Поэтому он является кандидатом для включения в кластер «больных генотипов». Сначала методом кластеризации формируются больные и здоровые группы генотипов и методом хи-квадрат проверяется их внутри-кластерная однородность, т.е. одинаковая частота встречаемости генотипов внутри кластера. После этого тем же методом проверяется межкластерное различие (расстояние). Все, дело сделано! Внутри кластера генотипы встречаются с одинаковой частотой, а частота самих кластеров в разных выборках отличается. Значит, принадлежность какого-либо генотипа к «больному» кластеру увеличивает риск заболевания. Где здесь противоречие?? Мы говорим, не «больной» генотип, а «больной» КЛАСТЕР генотипов! Ведь мы доказали, что этот кластер встречается в выборке «больных» достоверно чаще!! Используя термин кластер, с помощью логистической регрессии вычисляется его роль в повышении риска заболевания, доля больных пациентов, объясняемая кластером и т.д. Забудьте слово генотип и выучите слово кластер!!!
Цитата(DrgLena @ 13.12.2008 - 19:15) *
Вы продолжаете настаивать на своих выводах по первому набору данных ?
Горбатого могила исправит.

Сообщение отредактировал DoctorStat - 13.12.2008 - 20:51


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 13.12.2008 - 21:45
Сообщение #4





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DoctorStat @ 13.12.2008 - 20:43) *
Как на самом деле не знает никто.
Сначала методом кластеризации формируются больные и здоровые группы генотипов и методом хи-квадрат проверяется их внутри-кластерная однородность, т.е. одинаковая частота встречаемости генотипов внутри кластера. После этого тем же методом проверяется межкластерное различие (расстояние). Все, дело сделано! Внутри кластера генотипы встречаются с одинаковой частотой, а частота самих кластеров в разных выборках отличается. Значит, принадлежность какого-либо генотипа к «больному» кластеру увеличивает риск заболевания. Где здесь противоречие?? Мы говорим, не «больной» генотип, а «больной» КЛАСТЕР генотипов! Ведь мы доказали, что этот кластер встречается в выборке «больных» достоверно чаще!!

Не хотел вмешиваться, но это будут читать и люди, которые не очень хорошо разбираются в статистических методах и, соответственно, не поймут в чем тут уловка. А она в том, что процедура кластеризации сделана так, что она собирает похожие объекты и ее задачей является минимизация расстояний внутри кластера и максимизация вне. Соответственно, кластерный анализ ВСЕГДА находит группы с достоверными отличиями. Любой может это сделать путем простого эксперимента - сгенерируйте нормальную популяцию, затем сделайте кластерный анализ и проанализируйте достоверность различия между кластерами. Чтобы не быть голословным, привожу код R для подобного эксперимента и результат:
> pop.n<-rnorm(1000,120,20)
> cl<-kmeans(pop.n,3)
> anova(lm(pop.n~factor(cl$cluster)))
Analysis of Variance Table

Response: pop.n
Df Sum Sq Mean Sq F value Pr(>F)
factor(cl$cluster) 2 326427 163213 2009.5 < 2.2e-16 ***
Residuals 997 80975 81
---
Signif. codes: 0 ?***? 0.001 ?**? 0.01 ?*? 0.05 ?.? 0.1 ? ? 1

Различия между кластерами высокодостоверны! Хотя я "кластеризовал" гомогенную популяциюс нормальным распределением признака. Так вот можно сгенерировать группы "больных" из гомогенной популяции. Для биномиальных экспериментов все будет аналогично, поскольку логика одна и та же.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Solo...   Как создать формулу для расчета прогноза?   15.10.2008 - 21:08
- - DoctorStat   1. Выявление клинически значимых параметров и их в...   16.10.2008 - 10:50
- - Игорь   Цитата(Solo... @ 15.10.2008 - 21:08)...   20.10.2008 - 09:18
- - Анна_К   Цитата(Solo... @ 15.10.2008 - 22:08)...   23.10.2008 - 13:16
- - Solo...   Я побывала на вашем форуме. Но , если честно, не р...   7.12.2008 - 18:42
|- - Анна_К   Цитата(Solo... @ 7.12.2008 - 18:42) ...   8.12.2008 - 11:28
- - плав   Ну, во-первых создать на 100 больных формулу, кото...   7.12.2008 - 20:22
|- - Анна_К   Цитата(плав @ 7.12.2008 - 20:22) Ну,...   8.12.2008 - 12:26
|- - плав   Цитата(Анна_К @ 8.12.2008 - 12:26) D...   8.12.2008 - 13:35
|- - Анна_К   Цитата(плав @ 8.12.2008 - 13:35) Это...   8.12.2008 - 21:50
|- - DoctorStat   Цитата(Анна_К @ 8.12.2008 - 21:50) П...   8.12.2008 - 22:25
||- - Анна_К   Цитата(DoctorStat @ 8.12.2008 - 22:2...   9.12.2008 - 14:27
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 14:27) С...   9.12.2008 - 16:28
||- - Анна_К   Цитата(DoctorStat @ 9.12.2008 - 16:2...   9.12.2008 - 18:41
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 18:41) П...   9.12.2008 - 19:55
||- - Анна_К   Цитата(DoctorStat @ 9.12.2008 - 19:5...   9.12.2008 - 21:50
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 21:50) Е...   9.12.2008 - 22:03
|- - плав   Цитата(Анна_К @ 8.12.2008 - 21:50) П...   8.12.2008 - 22:38
- - Анна_К   Для обсуждаемых данных, вероятно, подойдет метод С...   8.12.2008 - 12:30
- - DrgLena   Если уж наблюдать битву гигантов, то давайте вспом...   9.12.2008 - 18:25
|- - Анна_К   Цитата(DrgLena @ 9.12.2008 - 18:25) ...   9.12.2008 - 18:55
|- - DoctorStat   Цитата(DrgLena @ 9.12.2008 - 18:25) ...   9.12.2008 - 20:19
|- - плав   Цитата(DoctorStat @ 9.12.2008 - 20:1...   9.12.2008 - 22:52
- - Анна_К   Извините, plav, Вам отвечаю позже всех. Слишком мн...   9.12.2008 - 19:35
|- - плав   Цитата(Анна_К @ 9.12.2008 - 19:35) М...   9.12.2008 - 22:44
- - DrgLena   Да, действительно, DoktorStat, на основании предст...   10.12.2008 - 00:36
|- - плав   Цитата(DrgLena @ 10.12.2008 - 00:36)...   10.12.2008 - 12:39
|- - Анна_К   Цитата(DrgLena @ 10.12.2008 - 00:36)...   10.12.2008 - 15:09
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 15:09) ...   10.12.2008 - 15:17
- - DrgLena   Да, логика железная! У умерших от первого прис...   10.12.2008 - 13:05
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 13:05)...   10.12.2008 - 13:48
- - плав   А вот это сделать сложно. Люди просто умерли (внез...   10.12.2008 - 14:32
- - DrgLena   Это план исследования или уже есть результаты? Чащ...   10.12.2008 - 14:36
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 14:36)...   10.12.2008 - 14:42
- - Анна_К   Цитата(плав @ 9.12.2008 - 22:44) Ну ...   10.12.2008 - 15:12
- - Анна_К   Цитата(плав @ 9.12.2008 - 22:44) 3) ...   10.12.2008 - 15:14
- - DrgLena   DoctorStat, Да, я упустила пару ответов. Одноврем...   10.12.2008 - 15:25
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 15:25)...   10.12.2008 - 15:33
|- - Анна_К   Цитата(DrgLena @ 10.12.2008 - 15:25)...   10.12.2008 - 15:55
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 15:55) ...   10.12.2008 - 17:03
|- - Анна_К   Цитата(DoctorStat @ 10.12.2008 - 17...   10.12.2008 - 20:23
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 20:23) ...   10.12.2008 - 20:32
|- - Анна_К   Цитата(DoctorStat @ 10.12.2008 - 20...   10.12.2008 - 23:21
- - DrgLena   Дождаться "полного ответа" мне не удало...   10.12.2008 - 16:05
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 16:05)...   10.12.2008 - 16:23
- - DrgLena   Вы дали пример, его и решайте. Бог с ним с сайтом ...   10.12.2008 - 16:46
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 16:46)...   10.12.2008 - 16:54
- - DrgLena   Предлагаю "правильными" данными считать ...   10.12.2008 - 21:24
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 21:24)...   10.12.2008 - 21:36
- - DrgLena   Доктор DoctorStar, вы главный участник битвы гиган...   10.12.2008 - 22:13
- - DoctorStat   Данные взяты из самого первого файла Stenocardia.r...   11.12.2008 - 11:59
- - DrgLena   Чего только не сделает доктор, чтобы получить жела...   11.12.2008 - 14:06
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 14:06)...   11.12.2008 - 14:35
- - DrgLena   Да, я посетила ваш сайт и проследила за ходом выпо...   11.12.2008 - 15:32
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 15:32)...   11.12.2008 - 15:45
- - DrgLena   Если данные содержат информацию, которая может быт...   11.12.2008 - 16:57
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 16:57)...   11.12.2008 - 17:45
- - DrgLena   Вы, очевидно не поняли, что дело не в новых метода...   11.12.2008 - 17:54
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 17:54)...   11.12.2008 - 20:18
- - DrgLena   Да, вы извлекли какую- то информацию. А именно, на...   11.12.2008 - 22:42
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 22:42)...   12.12.2008 - 11:49
- - autumn   Уважаемый DrStat Я коллега Anny_K. Мы провели ана...   12.12.2008 - 13:35
|- - DoctorStat   Цитата(autumn @ 12.12.2008 - 13:35) ...   12.12.2008 - 14:09
|- - autumn   Цитата(DoctorStat @ 12.12.2008 - 15...   12.12.2008 - 15:51
|- - DoctorStat   Цитата(autumn @ 12.12.2008 - 15:51) ...   12.12.2008 - 16:13
|- - autumn   Цитата(DoctorStat @ 12.12.2008 - 17...   13.12.2008 - 12:38
|- - DoctorStat   Цитата(autumn @ 13.12.2008 - 12:38) ...   13.12.2008 - 14:22
|- - autumn   Цитата(DoctorStat @ 13.12.2008 - 15...   13.12.2008 - 16:09
|- - DoctorStat   Цитата(autumn @ 13.12.2008 - 16:09) ...   13.12.2008 - 16:43
- - DrgLena   DoctorStat, всю технологию описал на своем сайте h...   12.12.2008 - 16:08
- - DrgLena   Autumn, не могу сказать, чтобы я разобралась, поче...   12.12.2008 - 20:41
- - autumn   Извините, я как-то забыл про комментарии. Квадрант...   12.12.2008 - 21:21
- - DrgLena   Большое спасибо, я поняла. Теперь я вижу, что резу...   12.12.2008 - 22:52
- - DrgLena   Очевидно, моих аргументов не хватило для того, что...   13.12.2008 - 19:15
|- - DoctorStat   Цитата(DrgLena @ 13.12.2008 - 19:15)...   13.12.2008 - 20:43
|- - плав   Цитата(DoctorStat @ 13.12.2008 - 20...   13.12.2008 - 21:45
- - Анна_К   С файлом Stenocardia.xls разобрались. Но мне так и...   13.12.2008 - 20:05
|- - DoctorStat   Цитата(Анна_К @ 13.12.2008 - 20:05) ...   13.12.2008 - 20:49
- - DrgLena   Цитата(DoctorStat @ 13.12.2008 - 21...   14.12.2008 - 00:17
|- - DoctorStat   Цитата(DrgLena @ 14.12.2008 - 00:17)...   14.12.2008 - 14:19
|- - DoctorStat   Чтобы показать для чего нужна кластеризация, я сра...   14.12.2008 - 22:51
- - autumn   DoctorStat, существование искусственных данных, дл...   15.12.2008 - 12:10
|- - DoctorStat   Цитата(autumn @ 15.12.2008 - 13:10) ...   3.07.2009 - 10:20
- - DrgLena   Итак, у вас есть больной у которого первый вариант...   15.12.2008 - 13:06


Добавить ответ в эту темуОткрыть тему