Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Как создать формулу для расчета прогноза?
Solo...
сообщение 15.10.2008 - 21:08
Сообщение #1





Группа: Пользователи
Сообщений: 35
Регистрация: 3.10.2008
Из: Москва
Пользователь №: 5369



Всем здравствуйте. Прошу опять помощи.
Стоит такая задача. Как создать формулу, с помощью которой можно вычислить вероятность положительного исхода лечения у конкретного больного. Т.е. формулу, в которую можно подставлять данные (признаки, разные показатели и пр.) конкретного обратившегося за помощью больного, далее получать с помощью этой формулы какую то цифру - % (70%, или 60, или 95 ... и т.д.). Эта цифра и будет отражать вероятность положительного исхода лечения этого больного.

Имеются результаты лечения около 100 больных, известны все их показатели, влияющие на результат лечения. Этих показателей - около 5-6. Все они должны входить в формулу.

Я слышала, что этой формулой является дискриминантное уравнение. Но как его построить? В Экселе или в Статистике?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
autumn
сообщение 12.12.2008 - 13:35
Сообщение #2





Группа: Пользователи
Сообщений: 6
Регистрация: 12.12.2008
Пользователь №: 5615



Уважаемый DrStat
Я коллега Anny_K.
Мы провели анализ вашей информации. по исходному
файлу Stenokardia.xls с использованием
а) методов Рраспознования
около 10 методов
б) перестановочного теста на бинарных показателях, соответствующих встречаемости номеров аллелей
и их парных сочетаниях
Вывод
Довольно высокая прогностическая способность
группы бинарных показателей, соответствующих гену C
От 80 до 96% в группе здоровых
и от 66 до 92% в группе больных.
Режим скользящий контроль (Leave-one-out)

По группе показателей для генов А и B для
всех методов результат нулевой.
Либо относят в один класс, либо около 50%
для обоих.
Тот же самый результат для парных сочетаний
бинарных показателей для аллелей
Значимые различия в распределениях больных-здоровых на уровне <0.001 на 1000 случайных перестановок
для пар
С_a2_10 C_a2_4
C_a1_2 C_a2_10
То есть всё соответствует тому, что говорит Ваш предыдущий оппонент
У вас достаточно необычный результат.
Насколько я понимаю вы делаете кластерный анализ парных значений аллелей?
Regards

Прикрепленные файлы
Прикрепленный файл  bestpartitions.doc ( 271,5 килобайт ) Кол-во скачиваний: 412
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 12.12.2008 - 14:09
Сообщение #3





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(autumn @ 12.12.2008 - 13:35) *
Мы провели анализ вашей информации. по исходному
файлу Stenokardia.xls с использованием
а) методов Рраспознования
около 10 методов
б) перестановочного теста на бинарных показателях, соответствующих встречаемости номеров аллелей
и их парных сочетаниях
Вот это - хорошая работа!
Цитата(autumn @ 12.12.2008 - 13:35) *
То есть всё соответствует тому, что говорит Ваш предыдущий оппонент
DrgLena, это комплимент в Вашу сторону!
Цитата(autumn @ 12.12.2008 - 13:35) *
Насколько я понимаю вы делаете кластерный анализ парных значений аллелей?
Грубо говоря, я объединяю генотипы (парные сочетания аллелей), чаще встречающиеся у больных, в «больной» кластер, а чаще встречающиеся у здоровых в «здоровый» кластер. Потом сравниваю эти 2 кластера в таблице сопряженности размером 2Х2 критерием хи-квадрат, чтобы проверить значимость отличий кластеров.

Сообщение отредактировал DoctorStat - 12.12.2008 - 14:34


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
autumn
сообщение 12.12.2008 - 15:51
Сообщение #4





Группа: Пользователи
Сообщений: 6
Регистрация: 12.12.2008
Пользователь №: 5615



Цитата(DoctorStat @ 12.12.2008 - 15:09) *
Вот это - хорошая работа!
DrgLena, это комплимент в Вашу сторону!
Грубо говоря, я объединяю генотипы (парные сочетания аллелей), чаще встречающиеся у больных, в «больной» кластер, а чаще встречающиеся у здоровых в «здоровый» кластер. Потом сравниваю эти 2 кластера в таблице сопряженности размером 2Х2 критерием хи-квадрат, чтобы проверить значимость отличий кластеров.

Что вы ставите в ячейки таблицы сопряжённости?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 12.12.2008 - 16:13
Сообщение #5





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(autumn @ 12.12.2008 - 15:51) *
Что вы ставите в ячейки таблицы сопряжённости?
Структура финальной таблицы сопряженности размерности 2Х2.
1-ый столбец таблицы - группа пациентов «Здоровые», 2-ой столбец - группа «Больные».
1-ая строка таблицы - генотипы кластера «Здоровый», 2-ая строка - кластера «Больной»
Значение ячейки (1,1) - количество здоровых пациентов, у которых генотип принадлежит кластеру «Здоровый».

Сообщение отредактировал DoctorStat - 12.12.2008 - 16:13


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
autumn
сообщение 13.12.2008 - 12:38
Сообщение #6





Группа: Пользователи
Сообщений: 6
Регистрация: 12.12.2008
Пользователь №: 5615



Цитата(DoctorStat @ 12.12.2008 - 17:13) *
Структура финальной таблицы сопряженности размерности 2Х2.
1-ый столбец таблицы - группа пациентов «Здоровые», 2-ой столбец - группа «Больные».
1-ая строка таблицы - генотипы кластера «Здоровый», 2-ая строка - кластера «Больной»
Значение ячейки (1,1) - количество здоровых пациентов, у которых генотип принадлежит кластеру «Здоровый».

Позвольте. Но мне кажется, что получается следующее. Вы одну случайную величину вычисляете по другой и затем
проверяете гипотезу о независимости этих двух величин. Конечно она будет
отвергнута с высоким уровнем значимости.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 13.12.2008 - 14:22
Сообщение #7





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(autumn @ 13.12.2008 - 12:38) *
Вы одну случайную величину вычисляете по другой и затем
проверяете гипотезу о независимости этих двух величин. Конечно она будет
отвергнута с высоким уровнем значимости.
Есть таблица сопряженности, см.приложенный рисунок. В столбце ВЫБ.1 - количество здоровых пациентов. В столбце ВЫБ.2 - количество пациентов со стенокардией. Строки таблицы соответствуют генотипам гена С. Для генотипов 1\1 и 1\2 здоровых пациентов нет, зато есть 7 больных по каждому генотипу. Эти два генотипа я объединяю в один и отношу его к «больному» кластеру. Генотип 2\4 и 2\10 встречается только у здоровых пациентов в количестве 10 и 11 человек соответственно. Эти два генотипа я объединяю в один и отношу его к «здоровому» кластеру. Продолжаю эту процедуру (кластеризацию) до тех пор, пока все генотипы не будут объединены в 2 больших кластера - «больной» и «здоровый». Эта процедура объединения строк таблицы сопряженности аналогична описанной в книге: Стентон Гланц «Медико-биологическая статистика», стр. 147, раздел «Преобразование таблиц сопряженности». Объединяются группы генотипов, не отличающиеся между собой по критерию хи-квадрат.

Сообщение отредактировал DoctorStat - 13.12.2008 - 14:23
Эскизы прикрепленных изображений
Прикрепленное изображение
 


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
autumn
сообщение 13.12.2008 - 16:09
Сообщение #8





Группа: Пользователи
Сообщений: 6
Регистрация: 12.12.2008
Пользователь №: 5615



Цитата(DoctorStat @ 13.12.2008 - 15:22) *
Есть таблица сопряженности, см.приложенный рисунок. В столбце ВЫБ.1 - количество здоровых пациентов. В столбце ВЫБ.2 - количество пациентов со стенокардией. Строки таблицы соответствуют генотипам гена С. Для генотипов 1\1 и 1\2 здоровых пациентов нет, зато есть 7 больных по каждому генотипу. Эти два генотипа я объединяю в один и отношу его к «больному» кластеру. Генотип 2\4 и 2\10 встречается только у здоровых пациентов в количестве 10 и 11 человек соответственно. Эти два генотипа я объединяю в один и отношу его к «здоровому» кластеру. Продолжаю эту процедуру (кластеризацию) до тех пор, пока все генотипы не будут объединены в 2 больших кластера - «больной» и «здоровый». Эта процедура объединения строк таблицы сопряженности аналогична описанной в книге: Стентон Гланц «Медико-биологическая статистика», стр. 147, раздел «Преобразование таблиц сопряженности». Объединяются группы генотипов, не отличающиеся между собой по критерию хи-квадрат.

Хорошо. Но представим такую ситуацию. У вас относительно небольшие группы больных и здоровых одинаковым образом и чисто случайно рассеяны по большому числу генотипов. Вы в один кластер отнесёте все генотипы, в которые попали больные, а в другой кластер все генотипы, в который попали здоровые. В вашей схеме это, насколько я понял, допускается. И вы спокойно получаете, что исход зависит от гена с огромной значимостью, которой по сценарию заведомо и в помине быть не может.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 13.12.2008 - 16:43
Сообщение #9





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(autumn @ 13.12.2008 - 16:09) *
Хорошо. Но представим такую ситуацию. У вас относительно небольшие группы больных и здоровых одинаковым образом и чисто случайно рассеяны по большому числу генотипов. Вы в один кластер отнесёте все генотипы, в которые попали больные, а в другой кластер все генотипы, в который попали здоровые. В вашей схеме это, насколько я понял, допускается. И вы спокойно получаете, что исход зависит от гена с огромной значимостью, которой по сценарию заведомо и в помине быть не может.
1. СЛУЧАЙНЫЕ ГЕНОТИПЫ.
Если генотипы случайным образом рассеяны между 2-мя группами, то их частоты встречаемости в 2-х выборках будут приблизительно равны, поэтому значимость p-value отличия «больного» кластера от «здорового» будет невелика. Мы не найдем ни «плохих», ни «хороших» генотипов.

2. МАЛЫЙ ОБЪЕМ ВЫБОРОК.
Алгоритм отсеивает и не учитывает редкие, малочисленные генотипы. Если группы окажутся слишком малы, а ген, наоборот, высокополиморфен (как, например, ген В), то все генотипы станут редкими, и кластеризация, а стало быть, и выявление «особых» генов станет невозможной. Существует минимальный объем выборок, связанный с полиморфизмом и распределением частот генотипов, ниже которого алгоритм не работает.


Сообщение отредактировал DoctorStat - 13.12.2008 - 16:50


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Solo...   Как создать формулу для расчета прогноза?   15.10.2008 - 21:08
- - DoctorStat   1. Выявление клинически значимых параметров и их в...   16.10.2008 - 10:50
- - Игорь   Цитата(Solo... @ 15.10.2008 - 21:08)...   20.10.2008 - 09:18
- - Анна_К   Цитата(Solo... @ 15.10.2008 - 22:08)...   23.10.2008 - 13:16
- - Solo...   Я побывала на вашем форуме. Но , если честно, не р...   7.12.2008 - 18:42
|- - Анна_К   Цитата(Solo... @ 7.12.2008 - 18:42) ...   8.12.2008 - 11:28
- - плав   Ну, во-первых создать на 100 больных формулу, кото...   7.12.2008 - 20:22
|- - Анна_К   Цитата(плав @ 7.12.2008 - 20:22) Ну,...   8.12.2008 - 12:26
|- - плав   Цитата(Анна_К @ 8.12.2008 - 12:26) D...   8.12.2008 - 13:35
|- - Анна_К   Цитата(плав @ 8.12.2008 - 13:35) Это...   8.12.2008 - 21:50
|- - DoctorStat   Цитата(Анна_К @ 8.12.2008 - 21:50) П...   8.12.2008 - 22:25
||- - Анна_К   Цитата(DoctorStat @ 8.12.2008 - 22:2...   9.12.2008 - 14:27
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 14:27) С...   9.12.2008 - 16:28
||- - Анна_К   Цитата(DoctorStat @ 9.12.2008 - 16:2...   9.12.2008 - 18:41
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 18:41) П...   9.12.2008 - 19:55
||- - Анна_К   Цитата(DoctorStat @ 9.12.2008 - 19:5...   9.12.2008 - 21:50
||- - DoctorStat   Цитата(Анна_К @ 9.12.2008 - 21:50) Е...   9.12.2008 - 22:03
|- - плав   Цитата(Анна_К @ 8.12.2008 - 21:50) П...   8.12.2008 - 22:38
- - Анна_К   Для обсуждаемых данных, вероятно, подойдет метод С...   8.12.2008 - 12:30
- - DrgLena   Если уж наблюдать битву гигантов, то давайте вспом...   9.12.2008 - 18:25
|- - Анна_К   Цитата(DrgLena @ 9.12.2008 - 18:25) ...   9.12.2008 - 18:55
|- - DoctorStat   Цитата(DrgLena @ 9.12.2008 - 18:25) ...   9.12.2008 - 20:19
|- - плав   Цитата(DoctorStat @ 9.12.2008 - 20:1...   9.12.2008 - 22:52
- - Анна_К   Извините, plav, Вам отвечаю позже всех. Слишком мн...   9.12.2008 - 19:35
|- - плав   Цитата(Анна_К @ 9.12.2008 - 19:35) М...   9.12.2008 - 22:44
- - DrgLena   Да, действительно, DoktorStat, на основании предст...   10.12.2008 - 00:36
|- - плав   Цитата(DrgLena @ 10.12.2008 - 00:36)...   10.12.2008 - 12:39
|- - Анна_К   Цитата(DrgLena @ 10.12.2008 - 00:36)...   10.12.2008 - 15:09
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 15:09) ...   10.12.2008 - 15:17
- - DrgLena   Да, логика железная! У умерших от первого прис...   10.12.2008 - 13:05
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 13:05)...   10.12.2008 - 13:48
- - плав   А вот это сделать сложно. Люди просто умерли (внез...   10.12.2008 - 14:32
- - DrgLena   Это план исследования или уже есть результаты? Чащ...   10.12.2008 - 14:36
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 14:36)...   10.12.2008 - 14:42
- - Анна_К   Цитата(плав @ 9.12.2008 - 22:44) Ну ...   10.12.2008 - 15:12
- - Анна_К   Цитата(плав @ 9.12.2008 - 22:44) 3) ...   10.12.2008 - 15:14
- - DrgLena   DoctorStat, Да, я упустила пару ответов. Одноврем...   10.12.2008 - 15:25
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 15:25)...   10.12.2008 - 15:33
|- - Анна_К   Цитата(DrgLena @ 10.12.2008 - 15:25)...   10.12.2008 - 15:55
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 15:55) ...   10.12.2008 - 17:03
|- - Анна_К   Цитата(DoctorStat @ 10.12.2008 - 17...   10.12.2008 - 20:23
|- - DoctorStat   Цитата(Анна_К @ 10.12.2008 - 20:23) ...   10.12.2008 - 20:32
|- - Анна_К   Цитата(DoctorStat @ 10.12.2008 - 20...   10.12.2008 - 23:21
- - DrgLena   Дождаться "полного ответа" мне не удало...   10.12.2008 - 16:05
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 16:05)...   10.12.2008 - 16:23
- - DrgLena   Вы дали пример, его и решайте. Бог с ним с сайтом ...   10.12.2008 - 16:46
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 16:46)...   10.12.2008 - 16:54
- - DrgLena   Предлагаю "правильными" данными считать ...   10.12.2008 - 21:24
|- - DoctorStat   Цитата(DrgLena @ 10.12.2008 - 21:24)...   10.12.2008 - 21:36
- - DrgLena   Доктор DoctorStar, вы главный участник битвы гиган...   10.12.2008 - 22:13
- - DoctorStat   Данные взяты из самого первого файла Stenocardia.r...   11.12.2008 - 11:59
- - DrgLena   Чего только не сделает доктор, чтобы получить жела...   11.12.2008 - 14:06
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 14:06)...   11.12.2008 - 14:35
- - DrgLena   Да, я посетила ваш сайт и проследила за ходом выпо...   11.12.2008 - 15:32
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 15:32)...   11.12.2008 - 15:45
- - DrgLena   Если данные содержат информацию, которая может быт...   11.12.2008 - 16:57
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 16:57)...   11.12.2008 - 17:45
- - DrgLena   Вы, очевидно не поняли, что дело не в новых метода...   11.12.2008 - 17:54
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 17:54)...   11.12.2008 - 20:18
- - DrgLena   Да, вы извлекли какую- то информацию. А именно, на...   11.12.2008 - 22:42
|- - DoctorStat   Цитата(DrgLena @ 11.12.2008 - 22:42)...   12.12.2008 - 11:49
- - autumn   Уважаемый DrStat Я коллега Anny_K. Мы провели ана...   12.12.2008 - 13:35
|- - DoctorStat   Цитата(autumn @ 12.12.2008 - 13:35) ...   12.12.2008 - 14:09
|- - autumn   Цитата(DoctorStat @ 12.12.2008 - 15...   12.12.2008 - 15:51
|- - DoctorStat   Цитата(autumn @ 12.12.2008 - 15:51) ...   12.12.2008 - 16:13
|- - autumn   Цитата(DoctorStat @ 12.12.2008 - 17...   13.12.2008 - 12:38
|- - DoctorStat   Цитата(autumn @ 13.12.2008 - 12:38) ...   13.12.2008 - 14:22
|- - autumn   Цитата(DoctorStat @ 13.12.2008 - 15...   13.12.2008 - 16:09
|- - DoctorStat   Цитата(autumn @ 13.12.2008 - 16:09) ...   13.12.2008 - 16:43
- - DrgLena   DoctorStat, всю технологию описал на своем сайте h...   12.12.2008 - 16:08
- - DrgLena   Autumn, не могу сказать, чтобы я разобралась, поче...   12.12.2008 - 20:41
- - autumn   Извините, я как-то забыл про комментарии. Квадрант...   12.12.2008 - 21:21
- - DrgLena   Большое спасибо, я поняла. Теперь я вижу, что резу...   12.12.2008 - 22:52
- - DrgLena   Очевидно, моих аргументов не хватило для того, что...   13.12.2008 - 19:15
|- - DoctorStat   Цитата(DrgLena @ 13.12.2008 - 19:15)...   13.12.2008 - 20:43
|- - плав   Цитата(DoctorStat @ 13.12.2008 - 20...   13.12.2008 - 21:45
- - Анна_К   С файлом Stenocardia.xls разобрались. Но мне так и...   13.12.2008 - 20:05
|- - DoctorStat   Цитата(Анна_К @ 13.12.2008 - 20:05) ...   13.12.2008 - 20:49
- - DrgLena   Цитата(DoctorStat @ 13.12.2008 - 21...   14.12.2008 - 00:17
|- - DoctorStat   Цитата(DrgLena @ 14.12.2008 - 00:17)...   14.12.2008 - 14:19
|- - DoctorStat   Чтобы показать для чего нужна кластеризация, я сра...   14.12.2008 - 22:51
- - autumn   DoctorStat, существование искусственных данных, дл...   15.12.2008 - 12:10
|- - DoctorStat   Цитата(autumn @ 15.12.2008 - 13:10) ...   3.07.2009 - 10:20
- - DrgLena   Итак, у вас есть больной у которого первый вариант...   15.12.2008 - 13:06


Добавить ответ в эту темуОткрыть тему