Цитата(anserovtv @ 12.05.2014 - 07:53)

Если я правильно понял, прежде всего вам нужно определиться с целевой (зависимой) переменной.
Как я понимаю, это , скорее всего, только развитие ИМ с двумя значениями: да или нет.
Тип других данных вы тоже не указали.
1) Я бы начал с анализа качества данных. Особое внимание нужно уделить взаимосвязям между переменными.
Если переменные измерены в метрической шкале, то , возможно, следует провести факторный анализ и модели анализа строить по новым переменным-факторам.
Для более глубокого понимания взаимосвязей полезно выполнить конфирматорный факторный анализ .
При этом можно образовывать вторичные факторы, использовать перекрестные индикаторы.
Можно оценить и связи между новыми факторами и др.
2) Из моделей анализа прежде всего я бы построил дерево классификации для всех данных.
Затем можно построить деревья и по вашим блокам.
С помощью данного метода также можно увидеть и взаимодействие факторов.
3) Очень удобны были бы в этой ситуации самоорганизующиеся карты Кохонена с зависимой переменной (для метрических данных).
На них можно увидеть не только принадлежность данного наблюдения к категории (кластеру),
но и как далеко или близко расположено оно от границы между категориями и др.
4) Анализ выживаемости (для ИМ или др.) возможен, если фактор времени важен и нужная информация у вас есть.
Сложные данные подразумевают и достаточно сложный анализ.
Одна из карт Кохонена.
Уважаемый anserovtv Вы выражаетесь несколько сложным для меня языком, но я постараюсь разобраться.... Несколько поясню Вам мою задачу. У нас есть 21 фактор риска развития ИМ, мы их взяли из рисков по Браунвальду (блок жалоб: длительность ангинозной боли; увеличение числа приступов; не купирующаяся боль и т.д., и блок ЭКГ-факторов: изменение сегмента ST; изменение зубца Т; тахиаритмия и т.д.). Там три блока факторов, соответственно высокий, средний и низкий риски. То есть это не измеряемые факторы - он есть или его нет и все. В этой же стратификации присутствует и лабораторный фактор (повышен или нет тропонин крови), мы его не учитываем т.к. на том этапе на котором будет применима наша шкала, лабораторию выполнить невозможно. И эти 21 фактор мы разделили на факторы высокого и низкого рисков. При этом, когда мы предлагаем стратифицировать риск, то ставится условие, должно присутствовать не менее 2-х факторов из низкого или высокого рисков, т.е.: один фактор из жалоб + один фактор из ЭКГ-картины = риск. Оппонент мне говорит, так не годится, нужна бальная система для вот этих 21 факторов. Дак вот что мы имеем... 250 пациентов которых госпитализировали и пролечили (есть все показатели диагностики). Мы их оценили (уже госпитально) по шкалам рисков ТIMI и GRACE, в которых есть лабораторные показатели. У кого то развился ИМ у кого то нет. И вот моя задача: оценить значимость тех 21 факторов в развитии ИМ и вывести бальную шкалу, где у каждого фактора будет свой балл в зависимости от его важности.