Добрый день. Есть около 300 пациентов, пролеченных за последние 8 лет, и больше сотни различных показателей. Задача - выбрать из этих показателей те, по которым можно спрогнозировать развитие осложнений. Старшие коллеги в подобных случаях рассчитывали отношение шансов для каждого показателя, отбирали значимые, проверяли отсутствие корреляции между ними, потом включали в логистическую регрессию.
1. Правильно ли я понимаю, что это когортное исследование, т.к. в него были включены все пациенты с изучаемой патологией (отбор не проводился) и затем прослежены в течение 90 дней? Соответственно, осложнения развились либо нет.
2. Верен ли такой подход?
3. Если верен, то как быть с количествеными показателями? Проводить ROC-анализ и разбивать на 2 группы по оптимальному пороговому значению?
4. Даже если такой подход верен, значимых показателей может оказаться все равно слишком много для одновременного включения в логистическую регрессию при таком количестве пациентов. Как уменьшить их количество?