Дизайн исследования |
Здравствуйте, гость ( Вход | Регистрация )
Дизайн исследования |
29.10.2015 - 10:45
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 6 Регистрация: 27.11.2014 Пользователь №: 26841 |
Добрый день. Есть около 300 пациентов, пролеченных за последние 8 лет, и больше сотни различных показателей. Задача - выбрать из этих показателей те, по которым можно спрогнозировать развитие осложнений. Старшие коллеги в подобных случаях рассчитывали отношение шансов для каждого показателя, отбирали значимые, проверяли отсутствие корреляции между ними, потом включали в логистическую регрессию.
1. Правильно ли я понимаю, что это когортное исследование, т.к. в него были включены все пациенты с изучаемой патологией (отбор не проводился) и затем прослежены в течение 90 дней? Соответственно, осложнения развились либо нет. 2. Верен ли такой подход? 3. Если верен, то как быть с количествеными показателями? Проводить ROC-анализ и разбивать на 2 группы по оптимальному пороговому значению? 4. Даже если такой подход верен, значимых показателей может оказаться все равно слишком много для одновременного включения в логистическую регрессию при таком количестве пациентов. Как уменьшить их количество? |
|
29.10.2015 - 14:02
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Добрый день. Есть около 300 пациентов, пролеченных за последние 8 лет, и больше сотни различных показателей. Задача - выбрать из этих показателей те, по которым можно спрогнозировать развитие осложнений. Старшие коллеги в подобных случаях рассчитывали отношение шансов для каждого показателя, отбирали значимые, проверяли отсутствие корреляции между ними, потом включали в логистическую регрессию. 1. Правильно ли я понимаю, что это когортное исследование, т.к. в него были включены все пациенты с изучаемой патологией (отбор не проводился) и затем прослежены в течение 90 дней? Соответственно, осложнения развились либо нет. 2. Верен ли такой подход? 3. Если верен, то как быть с количествеными показателями? Проводить ROC-анализ и разбивать на 2 группы по оптимальному пороговому значению? 4. Даже если такой подход верен, значимых показателей может оказаться все равно слишком много для одновременного включения в логистическую регрессию при таком количестве пациентов. Как уменьшить их количество? Есть методики отбора признаков. Например такой комбайн для построения регрессионных и классификационных моделей как caret содержит несколько режимов решения этой задачи. Можно использовать рандомизационные техники наподобие Boruta и ему подобных пакетов (в том числе и оптимизирующих AUC). |
|