![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 35 Регистрация: 3.10.2008 Из: Москва Пользователь №: 5369 ![]() |
Всем здравствуйте. Прошу опять помощи.
Стоит такая задача. Как создать формулу, с помощью которой можно вычислить вероятность положительного исхода лечения у конкретного больного. Т.е. формулу, в которую можно подставлять данные (признаки, разные показатели и пр.) конкретного обратившегося за помощью больного, далее получать с помощью этой формулы какую то цифру - % (70%, или 60, или 95 ... и т.д.). Эта цифра и будет отражать вероятность положительного исхода лечения этого больного. Имеются результаты лечения около 100 больных, известны все их показатели, влияющие на результат лечения. Этих показателей - около 5-6. Все они должны входить в формулу. Я слышала, что этой формулой является дискриминантное уравнение. Но как его построить? В Экселе или в Статистике? |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
Забудьте слово генотип и выучите слово кластер!!! У нас опять что - то не то, со статистикой и генетикой, как в 1947 году. Пациент может иметь не ген, а кластер, а кластерный анализ - это не обучение без учителя, с целью объединить похожих в пространстве многих признаков, а собирание под две группы больных и здоровых, а метрика расстояния - ни евклидова, ни Чебышева, ни Манхеттеновская, и т.д., а хи.кв. Чтобы мне забыть про генотип и выучить, что такое кластер, просьба к DoctorStat, дайте пожалуйста ссылку на тот метод кластерного анализа, который вы использовали. Пример плава демонстрирует вашу уловку, но на rnorm и kmeans, а у вас все переменные чисто номинальные, был ли тут вообще кластерный анализ? Я давала пример с деревом решений, а в ссылке не просто дерево решений, а просто лес из деревьев использовался, чтобы в аналогичной патологии найти предикторы, в том числе и оценив роль генетических (и это все на R?) http://www.springerlink.com/content/n5600h...h1/fulltext.pdf Не хотел вмешиваться, Ну и зря! |
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 381 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 ![]() |
дайте пожалуйста ссылку на тот метод кластерного анализа, который вы использовали. немного информации по кластеризации есть на моем сайте: http://doctorstat.narod.ru/tech/index_t.html внизу страницы. Ничего, кроме метода хи-квадрат, я не использовал
Сообщение отредактировал DoctorStat - 14.12.2008 - 14:20 ![]() Просто включи мозги => http://doctorstat.narod.ru
|
|
![]() |
![]() |
![]()
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 381 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 ![]() |
Чтобы показать для чего нужна кластеризация, я сравнил две выборки (больные и контроль) по придуманному гену Х. Частоты всех 13 генотипов у 2-х выборок отличаются приблизительно в 3 раза. Гистограмма частот и таблица сопряженности показаны на приложенных рисунках. Из них видно, что если у Вас нечетный (красный цвет на гистограмме) генотип, то риск оказаться больным приблизительно в 3 РАЗА ВЫШЕ, чем быть здоровым. И, наоборот, если генотип четный (голубой цвет), то скорее всего (с вероятностью в 3 раза большей) Вы здоровяк. Внизу таблицы сопряженности (рис.справа) показана значимость теста хи-квадрат P=0,373254>0,05 (т.е. тест НЕЗНАЧИМ, отличий не найдено). Теперь Вы понимаете, зачем нужна кластеризация???
Сообщение отредактировал DoctorStat - 14.12.2008 - 23:01 ![]() Просто включи мозги => http://doctorstat.narod.ru
|
|
![]() |
![]() |
![]() ![]() |