Как создать формулу для расчета прогноза?

Как создать формулу для расчета прогноза?

Solo... Просмотр профиля	15.10.2008 - 21:08 Сообщение #1
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369	Всем здравствуйте. Прошу опять помощи. Стоит такая задача. Как создать формулу, с помощью которой можно вычислить вероятность положительного исхода лечения у конкретного больного. Т.е. формулу, в которую можно подставлять данные (признаки, разные показатели и пр.) конкретного обратившегося за помощью больного, далее получать с помощью этой формулы какую то цифру - % (70%, или 60, или 95 ... и т.д.). Эта цифра и будет отражать вероятность положительного исхода лечения этого больного. Имеются результаты лечения около 100 больных, известны все их показатели, влияющие на результат лечения. Этих показателей - около 5-6. Все они должны входить в формулу. Я слышала, что этой формулой является дискриминантное уравнение. Но как его построить? В Экселе или в Статистике?

Ответов

autumn Просмотр профиля	12.12.2008 - 13:35 Сообщение #2
Группа: Пользователи Сообщений: 6 Регистрация: 12.12.2008 Пользователь №: 5615	Уважаемый DrStat Я коллега Anny_K. Мы провели анализ вашей информации. по исходному файлу Stenokardia.xls с использованием а) методов Рраспознования около 10 методов б) перестановочного теста на бинарных показателях, соответствующих встречаемости номеров аллелей и их парных сочетаниях Вывод Довольно высокая прогностическая способность группы бинарных показателей, соответствующих гену C От 80 до 96% в группе здоровых и от 66 до 92% в группе больных. Режим скользящий контроль (Leave-one-out) По группе показателей для генов А и B для всех методов результат нулевой. Либо относят в один класс, либо около 50% для обоих. Тот же самый результат для парных сочетаний бинарных показателей для аллелей Значимые различия в распределениях больных-здоровых на уровне <0.001 на 1000 случайных перестановок для пар С_a2_10 C_a2_4 C_a1_2 C_a2_10 То есть всё соответствует тому, что говорит Ваш предыдущий оппонент У вас достаточно необычный результат. Насколько я понимаю вы делаете кластерный анализ парных значений аллелей? Regards Прикрепленные файлы bestpartitions.doc ( 271,5 килобайт ) Кол-во скачиваний: 412

DoctorStat Просмотр профиля	12.12.2008 - 14:09 Сообщение #3
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(autumn @ 12.12.2008 - 13:35) Мы провели анализ вашей информации. по исходному файлу Stenokardia.xls с использованием а) методов Рраспознования около 10 методов б) перестановочного теста на бинарных показателях, соответствующих встречаемости номеров аллелей и их парных сочетаниях Вот это - хорошая работа! Цитата(autumn @ 12.12.2008 - 13:35) То есть всё соответствует тому, что говорит Ваш предыдущий оппонент DrgLena, это комплимент в Вашу сторону! Цитата(autumn @ 12.12.2008 - 13:35) Насколько я понимаю вы делаете кластерный анализ парных значений аллелей? Грубо говоря, я объединяю генотипы (парные сочетания аллелей), чаще встречающиеся у больных, в «больной» кластер, а чаще встречающиеся у здоровых в «здоровый» кластер. Потом сравниваю эти 2 кластера в таблице сопряженности размером 2Х2 критерием хи-квадрат, чтобы проверить значимость отличий кластеров. Сообщение отредактировал DoctorStat - 12.12.2008 - 14:34 Просто включи мозги => http://doctorstat.narod.ru

autumn Просмотр профиля	12.12.2008 - 15:51 Сообщение #4
Группа: Пользователи Сообщений: 6 Регистрация: 12.12.2008 Пользователь №: 5615	Цитата(DoctorStat @ 12.12.2008 - 15:09) Вот это - хорошая работа! DrgLena, это комплимент в Вашу сторону! Грубо говоря, я объединяю генотипы (парные сочетания аллелей), чаще встречающиеся у больных, в «больной» кластер, а чаще встречающиеся у здоровых в «здоровый» кластер. Потом сравниваю эти 2 кластера в таблице сопряженности размером 2Х2 критерием хи-квадрат, чтобы проверить значимость отличий кластеров. Что вы ставите в ячейки таблицы сопряжённости?

DoctorStat Просмотр профиля	12.12.2008 - 16:13 Сообщение #5
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(autumn @ 12.12.2008 - 15:51) Что вы ставите в ячейки таблицы сопряжённости? Структура финальной таблицы сопряженности размерности 2Х2. 1-ый столбец таблицы - группа пациентов «Здоровые», 2-ой столбец - группа «Больные». 1-ая строка таблицы - генотипы кластера «Здоровый», 2-ая строка - кластера «Больной» Значение ячейки (1,1) - количество здоровых пациентов, у которых генотип принадлежит кластеру «Здоровый». Сообщение отредактировал DoctorStat - 12.12.2008 - 16:13 Просто включи мозги => http://doctorstat.narod.ru

autumn Просмотр профиля	13.12.2008 - 12:38 Сообщение #6
Группа: Пользователи Сообщений: 6 Регистрация: 12.12.2008 Пользователь №: 5615	Цитата(DoctorStat @ 12.12.2008 - 17:13) Структура финальной таблицы сопряженности размерности 2Х2. 1-ый столбец таблицы - группа пациентов «Здоровые», 2-ой столбец - группа «Больные». 1-ая строка таблицы - генотипы кластера «Здоровый», 2-ая строка - кластера «Больной» Значение ячейки (1,1) - количество здоровых пациентов, у которых генотип принадлежит кластеру «Здоровый». Позвольте. Но мне кажется, что получается следующее. Вы одну случайную величину вычисляете по другой и затем проверяете гипотезу о независимости этих двух величин. Конечно она будет отвергнута с высоким уровнем значимости.

DoctorStat

13.12.2008 - 14:22

Сообщение #7

Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224

Цитата(autumn @ 13.12.2008 - 12:38)

Вы одну случайную величину вычисляете по другой и затем
проверяете гипотезу о независимости этих двух величин. Конечно она будет
отвергнута с высоким уровнем значимости.

Есть таблица сопряженности, см.приложенный рисунок. В столбце ВЫБ.1 - количество здоровых пациентов. В столбце ВЫБ.2 - количество пациентов со стенокардией. Строки таблицы соответствуют генотипам гена С. Для генотипов 1\1 и 1\2 здоровых пациентов нет, зато есть 7 больных по каждому генотипу. Эти два генотипа я объединяю в один и отношу его к «больному» кластеру. Генотип 2\4 и 2\10 встречается только у здоровых пациентов в количестве 10 и 11 человек соответственно. Эти два генотипа я объединяю в один и отношу его к «здоровому» кластеру. Продолжаю эту процедуру (кластеризацию) до тех пор, пока все генотипы не будут объединены в 2 больших кластера - «больной» и «здоровый». Эта процедура объединения строк таблицы сопряженности аналогична описанной в книге: Стентон Гланц «Медико-биологическая статистика», стр. 147, раздел «Преобразование таблиц сопряженности». Объединяются группы генотипов, не отличающиеся между собой по критерию хи-квадрат.

Сообщение отредактировал DoctorStat - 13.12.2008 - 14:23

Эскизы прикрепленных изображений

Просто включи мозги => http://doctorstat.narod.ru

Ответить с цитированием данного сообщения

autumn Просмотр профиля	13.12.2008 - 16:09 Сообщение #8
Группа: Пользователи Сообщений: 6 Регистрация: 12.12.2008 Пользователь №: 5615	Цитата(DoctorStat @ 13.12.2008 - 15:22) Есть таблица сопряженности, см.приложенный рисунок. В столбце ВЫБ.1 - количество здоровых пациентов. В столбце ВЫБ.2 - количество пациентов со стенокардией. Строки таблицы соответствуют генотипам гена С. Для генотипов 1\1 и 1\2 здоровых пациентов нет, зато есть 7 больных по каждому генотипу. Эти два генотипа я объединяю в один и отношу его к «больному» кластеру. Генотип 2\4 и 2\10 встречается только у здоровых пациентов в количестве 10 и 11 человек соответственно. Эти два генотипа я объединяю в один и отношу его к «здоровому» кластеру. Продолжаю эту процедуру (кластеризацию) до тех пор, пока все генотипы не будут объединены в 2 больших кластера - «больной» и «здоровый». Эта процедура объединения строк таблицы сопряженности аналогична описанной в книге: Стентон Гланц «Медико-биологическая статистика», стр. 147, раздел «Преобразование таблиц сопряженности». Объединяются группы генотипов, не отличающиеся между собой по критерию хи-квадрат. Хорошо. Но представим такую ситуацию. У вас относительно небольшие группы больных и здоровых одинаковым образом и чисто случайно рассеяны по большому числу генотипов. Вы в один кластер отнесёте все генотипы, в которые попали больные, а в другой кластер все генотипы, в который попали здоровые. В вашей схеме это, насколько я понял, допускается. И вы спокойно получаете, что исход зависит от гена с огромной значимостью, которой по сценарию заведомо и в помине быть не может.

DoctorStat Просмотр профиля	13.12.2008 - 16:43 Сообщение #9
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(autumn @ 13.12.2008 - 16:09) Хорошо. Но представим такую ситуацию. У вас относительно небольшие группы больных и здоровых одинаковым образом и чисто случайно рассеяны по большому числу генотипов. Вы в один кластер отнесёте все генотипы, в которые попали больные, а в другой кластер все генотипы, в который попали здоровые. В вашей схеме это, насколько я понял, допускается. И вы спокойно получаете, что исход зависит от гена с огромной значимостью, которой по сценарию заведомо и в помине быть не может. 1. СЛУЧАЙНЫЕ ГЕНОТИПЫ. Если генотипы случайным образом рассеяны между 2-мя группами, то их частоты встречаемости в 2-х выборках будут приблизительно равны, поэтому значимость p-value отличия «больного» кластера от «здорового» будет невелика. Мы не найдем ни «плохих», ни «хороших» генотипов. 2. МАЛЫЙ ОБЪЕМ ВЫБОРОК. Алгоритм отсеивает и не учитывает редкие, малочисленные генотипы. Если группы окажутся слишком малы, а ген, наоборот, высокополиморфен (как, например, ген В), то все генотипы станут редкими, и кластеризация, а стало быть, и выявление «особых» генов станет невозможной. Существует минимальный объем выборок, связанный с полиморфизмом и распределением частот генотипов, ниже которого алгоритм не работает. Сообщение отредактировал DoctorStat - 13.12.2008 - 16:50 Просто включи мозги => http://doctorstat.narod.ru

Сообщений в этой теме

Solo... Как создать формулу для расчета прогноза? 15.10.2008 - 21:08

DoctorStat 1. Выявление клинически значимых параметров и их в... 16.10.2008 - 10:50

Игорь Цитата(Solo... @ 15.10.2008 - 21:08)... 20.10.2008 - 09:18

Анна_К Цитата(Solo... @ 15.10.2008 - 22:08)... 23.10.2008 - 13:16

Solo... Я побывала на вашем форуме. Но , если честно, не р... 7.12.2008 - 18:42

Анна_К Цитата(Solo... @ 7.12.2008 - 18:42) ... 8.12.2008 - 11:28

плав Ну, во-первых создать на 100 больных формулу, кото... 7.12.2008 - 20:22

Анна_К Цитата(плав @ 7.12.2008 - 20:22) Ну,... 8.12.2008 - 12:26

плав Цитата(Анна_К @ 8.12.2008 - 12:26) D... 8.12.2008 - 13:35

Анна_К Цитата(плав @ 8.12.2008 - 13:35) Это... 8.12.2008 - 21:50

DoctorStat Цитата(Анна_К @ 8.12.2008 - 21:50) П... 8.12.2008 - 22:25

Анна_К Цитата(DoctorStat @ 8.12.2008 - 22:2... 9.12.2008 - 14:27

DoctorStat Цитата(Анна_К @ 9.12.2008 - 14:27) С... 9.12.2008 - 16:28

Анна_К Цитата(DoctorStat @ 9.12.2008 - 16:2... 9.12.2008 - 18:41

DoctorStat Цитата(Анна_К @ 9.12.2008 - 18:41) П... 9.12.2008 - 19:55

Анна_К Цитата(DoctorStat @ 9.12.2008 - 19:5... 9.12.2008 - 21:50

DoctorStat Цитата(Анна_К @ 9.12.2008 - 21:50) Е... 9.12.2008 - 22:03

плав Цитата(Анна_К @ 8.12.2008 - 21:50) П... 8.12.2008 - 22:38

Анна_К Для обсуждаемых данных, вероятно, подойдет метод С... 8.12.2008 - 12:30

DrgLena Если уж наблюдать битву гигантов, то давайте вспом... 9.12.2008 - 18:25

Анна_К Цитата(DrgLena @ 9.12.2008 - 18:25) ... 9.12.2008 - 18:55

DoctorStat Цитата(DrgLena @ 9.12.2008 - 18:25) ... 9.12.2008 - 20:19

плав Цитата(DoctorStat @ 9.12.2008 - 20:1... 9.12.2008 - 22:52

Анна_К Извините, plav, Вам отвечаю позже всех. Слишком мн... 9.12.2008 - 19:35

плав Цитата(Анна_К @ 9.12.2008 - 19:35) М... 9.12.2008 - 22:44

DrgLena Да, действительно, DoktorStat, на основании предст... 10.12.2008 - 00:36

плав Цитата(DrgLena @ 10.12.2008 - 00:36)... 10.12.2008 - 12:39

Анна_К Цитата(DrgLena @ 10.12.2008 - 00:36)... 10.12.2008 - 15:09

DoctorStat Цитата(Анна_К @ 10.12.2008 - 15:09) ... 10.12.2008 - 15:17

DrgLena Да, логика железная! У умерших от первого прис... 10.12.2008 - 13:05

DoctorStat Цитата(DrgLena @ 10.12.2008 - 13:05)... 10.12.2008 - 13:48

плав А вот это сделать сложно. Люди просто умерли (внез... 10.12.2008 - 14:32

DrgLena Это план исследования или уже есть результаты? Чащ... 10.12.2008 - 14:36

DoctorStat Цитата(DrgLena @ 10.12.2008 - 14:36)... 10.12.2008 - 14:42

Анна_К Цитата(плав @ 9.12.2008 - 22:44) Ну ... 10.12.2008 - 15:12

Анна_К Цитата(плав @ 9.12.2008 - 22:44) 3) ... 10.12.2008 - 15:14

DrgLena DoctorStat, Да, я упустила пару ответов. Одноврем... 10.12.2008 - 15:25

DoctorStat Цитата(DrgLena @ 10.12.2008 - 15:25)... 10.12.2008 - 15:33

Анна_К Цитата(DrgLena @ 10.12.2008 - 15:25)... 10.12.2008 - 15:55

DoctorStat Цитата(Анна_К @ 10.12.2008 - 15:55) ... 10.12.2008 - 17:03

Анна_К Цитата(DoctorStat @ 10.12.2008 - 17... 10.12.2008 - 20:23

DoctorStat Цитата(Анна_К @ 10.12.2008 - 20:23) ... 10.12.2008 - 20:32

Анна_К Цитата(DoctorStat @ 10.12.2008 - 20... 10.12.2008 - 23:21

DrgLena Дождаться "полного ответа" мне не удало... 10.12.2008 - 16:05

DoctorStat Цитата(DrgLena @ 10.12.2008 - 16:05)... 10.12.2008 - 16:23

DrgLena Вы дали пример, его и решайте. Бог с ним с сайтом ... 10.12.2008 - 16:46

DoctorStat Цитата(DrgLena @ 10.12.2008 - 16:46)... 10.12.2008 - 16:54

DrgLena Предлагаю "правильными" данными считать ... 10.12.2008 - 21:24

DoctorStat Цитата(DrgLena @ 10.12.2008 - 21:24)... 10.12.2008 - 21:36

DrgLena Доктор DoctorStar, вы главный участник битвы гиган... 10.12.2008 - 22:13

DoctorStat Данные взяты из самого первого файла Stenocardia.r... 11.12.2008 - 11:59

DrgLena Чего только не сделает доктор, чтобы получить жела... 11.12.2008 - 14:06

DoctorStat Цитата(DrgLena @ 11.12.2008 - 14:06)... 11.12.2008 - 14:35

DrgLena Да, я посетила ваш сайт и проследила за ходом выпо... 11.12.2008 - 15:32

DoctorStat Цитата(DrgLena @ 11.12.2008 - 15:32)... 11.12.2008 - 15:45

DrgLena Если данные содержат информацию, которая может быт... 11.12.2008 - 16:57

DoctorStat Цитата(DrgLena @ 11.12.2008 - 16:57)... 11.12.2008 - 17:45

DrgLena Вы, очевидно не поняли, что дело не в новых метода... 11.12.2008 - 17:54

DoctorStat Цитата(DrgLena @ 11.12.2008 - 17:54)... 11.12.2008 - 20:18

DrgLena Да, вы извлекли какую- то информацию. А именно, на... 11.12.2008 - 22:42

DoctorStat Цитата(DrgLena @ 11.12.2008 - 22:42)... 12.12.2008 - 11:49

autumn Уважаемый DrStat Я коллега Anny_K. Мы провели ана... 12.12.2008 - 13:35

DoctorStat Цитата(autumn @ 12.12.2008 - 13:35) ... 12.12.2008 - 14:09

autumn Цитата(DoctorStat @ 12.12.2008 - 15... 12.12.2008 - 15:51

DoctorStat Цитата(autumn @ 12.12.2008 - 15:51) ... 12.12.2008 - 16:13

autumn Цитата(DoctorStat @ 12.12.2008 - 17... 13.12.2008 - 12:38

DoctorStat Цитата(autumn @ 13.12.2008 - 12:38) ... 13.12.2008 - 14:22

autumn Цитата(DoctorStat @ 13.12.2008 - 15... 13.12.2008 - 16:09

DoctorStat Цитата(autumn @ 13.12.2008 - 16:09) ... 13.12.2008 - 16:43

DrgLena DoctorStat, всю технологию описал на своем сайте h... 12.12.2008 - 16:08

DrgLena Autumn, не могу сказать, чтобы я разобралась, поче... 12.12.2008 - 20:41

autumn Извините, я как-то забыл про комментарии. Квадрант... 12.12.2008 - 21:21

DrgLena Большое спасибо, я поняла. Теперь я вижу, что резу... 12.12.2008 - 22:52

DrgLena Очевидно, моих аргументов не хватило для того, что... 13.12.2008 - 19:15

DoctorStat Цитата(DrgLena @ 13.12.2008 - 19:15)... 13.12.2008 - 20:43

плав Цитата(DoctorStat @ 13.12.2008 - 20... 13.12.2008 - 21:45

Анна_К С файлом Stenocardia.xls разобрались. Но мне так и... 13.12.2008 - 20:05

DoctorStat Цитата(Анна_К @ 13.12.2008 - 20:05) ... 13.12.2008 - 20:49

DrgLena Цитата(DoctorStat @ 13.12.2008 - 21... 14.12.2008 - 00:17

DoctorStat Цитата(DrgLena @ 14.12.2008 - 00:17)... 14.12.2008 - 14:19

DoctorStat Чтобы показать для чего нужна кластеризация, я сра... 14.12.2008 - 22:51

autumn DoctorStat, существование искусственных данных, дл... 15.12.2008 - 12:10

DoctorStat Цитата(autumn @ 15.12.2008 - 13:10) ... 3.07.2009 - 10:20

DrgLena Итак, у вас есть больной у которого первый вариант... 15.12.2008 - 13:06

« Предыдущая тема · Медицинская статистика · Следующая тема »