Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Как выделить сочетания признаков?, Есть девять признаков (поражений) надо выделить самые частые сочетания
Листопадничек
сообщение 19.10.2014 - 20:36
Сообщение #1





Группа: Пользователи
Сообщений: 1
Регистрация: 19.10.2014
Пользователь №: 26750



Здравствуйте, коллеги. Проблема такая: в конце работы возникла потребность выделить наиболее частые сочетания поражений. Имеется девять видов поражений, которые выявлены у определенного процента обследованных пациентов. И было бы неплохо как-то обозначить, какие именно сочетания этих поражений встречаются чаще.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 20.10.2014 - 18:46
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Листопадничек @ 19.10.2014 - 23:36) *
Здравствуйте, коллеги. Проблема такая: в конце работы возникла потребность выделить наиболее частые сочетания поражений. Имеется девять видов поражений, которые выявлены у определенного процента обследованных пациентов. И было бы неплохо как-то обозначить, какие именно сочетания этих поражений встречаются чаще.

Самый тупой способ - просто посчитать в лоб все ассоциации smile.gif и выделить наиболее частые. Из программных реализаций здесь вполне подойдёт поиск ассоциативных правил по алгоритму "Apriori", который есть во всех пакетах и/или модулях Data mining. Когда я этим интересовался (лет 10 назад), то делал в Deductor (http://www.basegroup.ru/ в демо-версии Lite было некритичное для моих выборок ограничение на размер базы данных) и Weka (http://www.cs.waikato.ac.nz/ml/weka/ бесплатная на Java). Сейчас наверное ещё много чего добавилось доступного...
Если более осмысленно, то к ассоциациям признаков приводят какие-то сходные процессы. Можно исходя из данных по совстречаемости признаков выйти именно на эти процессы. Для этого используются многомерные статистические методы. Для качественных альтернативных признаков (ваш случай) традиционно используется анализ соответствий или анализ главных координат. Почитайте про эти техники, если понравится - могу подсказать как провести такой анализ в бесплатном пакете PAST. Пусть он не такой крутой как среда R, но имеет графический интерфейс (что очень хорошо для начала пути) и хорошо справляется с такими задачами. Желательно выложить данные или их часть в виде таблицы: в строках - пациенты, в столбцах - поражения, на пересечениях цифры - 0 (нет) или 1 (есть). Названия поражений можете нам не давать, просто "поражение 1", "поражение 2"... Заодно с кодами p2004r попрактикуемся...

Сообщение отредактировал nokh - 20.10.2014 - 18:51
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему