Помогите описать вклад факторов в исход - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Помогите описать вклад факторов в исход

annica12 Просмотр профиля	5.02.2014 - 21:10 Сообщение #1
Группа: Пользователи Сообщений: 5 Регистрация: 5.02.2014 Пользователь №: 25976	Здравствуйте, коллеги. Очень прошу вашей профессиональной помощи. имеются 3 фактора, значимо различающиеся между группами с исходом 1 и 0. Построена нейронная сеть, дискриминантная модель, которые на основании этих факторов предсказывают исход с точностью 87-94%. Задача в формировании наглядного практического руководства к действию, если это возможно. Связать вместе эти три кофактора - напрямую друг от друга не зависят, разложить их, по осям например, и определить зоны риска, цветом (как плоскости или тернарные графики), чтобы отложив по осям имеющиеся значения каждого из факторов точка соединения показывала бы вероятность развития исходов 1 и 0 и было видно как изменить показатели, чтобы улучшить исход. Спасибо заранее.

Открыть тему

Ответов (1 - 9)

p2004r Просмотр профиля	5.02.2014 - 22:27 Сообщение #2
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(annica12 @ 5.02.2014 - 21:10) Здравствуйте, коллеги. Очень прошу вашей профессиональной помощи. имеются 3 фактора, значимо различающиеся между группами с исходом 1 и 0. Построена нейронная сеть, дискриминантная модель, которые на основании этих факторов предсказывают исход с точностью 87-94%. а кроссвалидация данной модели что показывает? http://r-statistics.livejournal.com/

annica12 Просмотр профиля	5.02.2014 - 23:07 Сообщение #3
Группа: Пользователи Сообщений: 5 Регистрация: 5.02.2014 Пользователь №: 25976	это точности после кроссвалидации, более того в этих пределах обе модели работают на данных двух независимых центров - источников аналогичных данных. данные факторы отобраны как значимые.

nokh Просмотр профиля	6.02.2014 - 15:01 Сообщение #4
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(annica12 @ 6.02.2014 - 00:10) ...Задача в формировании наглядного практического руководства к действию, если это возможно. Связать вместе эти три кофактора - напрямую друг от друга не зависят, разложить их, по осям например, и определить зоны риска, цветом (как плоскости или тернарные графики), чтобы отложив по осям имеющиеся значения каждого из факторов точка соединения показывала бы вероятность развития исходов 1 и 0 и было видно как изменить показатели, чтобы улучшить исход. Спасибо заранее. Готовых средств визуализации для вашей задачи мне не известно. Скорее всего их нет, нужно изобретать. Сообщение отредактировал nokh - 6.02.2014 - 16:02

DrgLena Просмотр профиля	6.02.2014 - 21:16 Сообщение #5
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Я как то сравнивала на одних данных возможности трех методов классификации дискриминантный анадиз, нейронные сети и деревья классификации, получила 72%, 76% и 74% соответственно. Классификационное дерево дает прекрасную графическую иллюстрацию и процесса и результата, которую понимает любой доктор, она и висит в ординаторской, красиво раскрашенная

nokh Просмотр профиля	6.02.2014 - 22:10 Сообщение #6
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(DrgLena @ 7.02.2014 - 00:16) Я как то сравнивала на одних данных возможности трех методов классификации дискриминантный анадиз, нейронные сети и деревья классификации, получила 72%, 76% и 74% соответственно. Классификационное дерево дает прекрасную графическую иллюстрацию и процесса и результата, которую понимает любой доктор, она и висит в ординаторской, красиво раскрашенная Тоже думал насчёт дерева классификации, очень наглядно, нравятся! Одно удачное дерево и теперь меня сложно переубедить, что оксалатная мочекаменная болезнь это - в первую очередь генетика, во вторую - генетическая предрасположенность и только потом питание Только у annica12 показателей для дерева мало - может и на кустик не хватить. А у вас нет аналогичных бинарных данных именно с 3 или 4-мя показателями? Есть одна задумка...

p2004r Просмотр профиля	6.02.2014 - 22:15 Сообщение #7
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(annica12 @ 5.02.2014 - 23:07) это точности после кроссвалидации, более того в этих пределах обе модели работают на данных двух независимых центров - источников аналогичных данных. данные факторы отобраны как значимые. делаете грид в котором перебираются с нужным шагом значения всех факторов (в результате получаете полное покрытие области в которой работает модель). для каждой точки грида запускаете свой нерорешатель, он выдает решение (или пробабилити, что красивее). Всё это визуализируете.... ну например просто отобразив все положительные решения в pairs() Если "красиво" не разделяется можно biplot(prcomp()), там оси-факторы будут в одном пространстве с границей решения вполне разделимы визуально, но ничего откладывать по ним у обычного человека не получится скорее всего дерево решений (их может быть несколько), как предлагают, лучшее по компактности решение. http://r-statistics.livejournal.com/

annica12 Просмотр профиля	7.02.2014 - 09:18 Сообщение #8
Группа: Пользователи Сообщений: 5 Регистрация: 5.02.2014 Пользователь №: 25976	Цитата(nokh @ 6.02.2014 - 22:10) Тоже думал насчёт дерева классификации, очень наглядно, нравятся! Одно удачное дерево и теперь меня сложно переубедить, что оксалатная мочекаменная болезнь это - в первую очередь генетика, во вторую - генетическая предрасположенность и только потом питание Только у annica12 показателей для дерева мало - может и на кустик не хватить. А у вас нет аналогичных бинарных данных именно с 3 или 4-мя показателями? Есть одна задумка... Спасибо, за отклики! Показателей всего 9, они работают в дискриминантной и нейросетевой модели. Но эти модели не дают практических рекомендаций, а только говорят - будет исход 0 или 1. Фишка в том, что врач в технологическом процессе непосредственно может повлиять ТОЛЬКО на 3 ЭТИХ фактора, остальные либо не модифицируются, либо опосредованы. Задача прогнозирования решена, осталось решит задачу с четкими практическими рекомендациями типа: если А 120, а В 200, а С 23, то поверни пимпочку вправо, а скорость увеличь на 5 оборотов. Как-то так. Random forest классифицируют данные с точностью 0,65. Это как примерно в анекдоте про блондинку и снежного человека: "или встречу или не встречу". Хотя, может, я и ошибаюсь

p2004r Просмотр профиля	7.02.2014 - 22:49 Сообщение #9
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(annica12 @ 7.02.2014 - 09:18) Спасибо, за отклики! Показателей всего 9, они работают в дискриминантной и нейросетевой модели. Но эти модели не дают практических рекомендаций, а только говорят - будет исход 0 или 1. Фишка в том, что врач в технологическом процессе непосредственно может повлиять ТОЛЬКО на 3 ЭТИХ фактора, остальные либо не модифицируются, либо опосредованы. Задача прогнозирования решена, осталось решит задачу с четкими практическими рекомендациями типа: если А 120, а В 200, а С 23, то поверни пимпочку вправо, а скорость увеличь на 5 оборотов. Как-то так. Random forest классифицируют данные с точностью 0,65. Это как примерно в анекдоте про блондинку и снежного человека: "или встречу или не встречу". Хотя, может, я и ошибаюсь Это тревожный звоночек, рандом форест дает результат распознания по данным не участвовавшим в построении модели и поэтому практически не подвержен переобучению. С другой стороны у Вас мало параметров в модели и исходные настройки фореста могут строить очень маленькое дерево включая, например, всего по три параметра одновременно. Можно его заставить включать большее число параметров в модель насильно. Для рандом фореста есть процедуры объективного исключения "лишних" параметров модели (я давал пример использования пакета Boruta). Можно выявить такие переменные и построить рандом форест модель принудительно включающую их всех. http://r-statistics.livejournal.com/

anserovtv Просмотр профиля	9.03.2014 - 09:23 Сообщение #10
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927	Как я понимаю. вашу задачу можно решить принципиально по-другому: 1) на основе нейронной сети , построенной вами. и , используя ее параметры (число слоев , функции активации , синаптические веса и др.) написать собственную небольшую программу , которая будет установлена на компьютере врача и будет работать как калькулятор. Точность прогнозирования при этом не ухудшится. Такие программы в меддиагностике , я знаю, уже существуют. 2) Скорее всего, точность прогнозирования можно еще улучшить, если применить нечеткие деревья классификации: деревья классификации + нечеткая логика. Подход тот же самый: используя стандартную программу (есть расширение пакета MATLAB Fuzzy Logic Toolbox ) создать алгоритм, а затем , используя его параметры, создать собственную программу для врача. Полагаю, что обе программы не будут очень сложными. Даже карты Кохонена можно запрограммировать так, чтобы они работали в интерактивном режиме!!! Тогда исследователь сможет визуально наблюдать за процессом классификации! У опытного программиста есть заготовки для таких программ. В вашем случае точность, полученная с применением нейронной сети, выше потому что при этом подходе используется параллельная обработка информации, а в деревьях классификации - последовательная. Другие подходы (с принципиально другими проблемами): 1) создание модели скоринга и ее применение, 2) применение процедуры Что-если (если она есть в пакете ), 3) скрипт, макрос и др. Сообщение отредактировал anserovtv - 9.03.2014 - 15:32

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Переключить на: Стандартный · Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2025 IPS, Inc.