Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Дизайн исследования
monday
сообщение 29.10.2015 - 10:45
Сообщение #1





Группа: Пользователи
Сообщений: 6
Регистрация: 27.11.2014
Пользователь №: 26841



Добрый день. Есть около 300 пациентов, пролеченных за последние 8 лет, и больше сотни различных показателей. Задача - выбрать из этих показателей те, по которым можно спрогнозировать развитие осложнений. Старшие коллеги в подобных случаях рассчитывали отношение шансов для каждого показателя, отбирали значимые, проверяли отсутствие корреляции между ними, потом включали в логистическую регрессию.
1. Правильно ли я понимаю, что это когортное исследование, т.к. в него были включены все пациенты с изучаемой патологией (отбор не проводился) и затем прослежены в течение 90 дней? Соответственно, осложнения развились либо нет.
2. Верен ли такой подход?
3. Если верен, то как быть с количествеными показателями? Проводить ROC-анализ и разбивать на 2 группы по оптимальному пороговому значению?
4. Даже если такой подход верен, значимых показателей может оказаться все равно слишком много для одновременного включения в логистическую регрессию при таком количестве пациентов. Как уменьшить их количество?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 29.10.2015 - 14:02
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(monday @ 29.10.2015 - 10:45) *
Добрый день. Есть около 300 пациентов, пролеченных за последние 8 лет, и больше сотни различных показателей. Задача - выбрать из этих показателей те, по которым можно спрогнозировать развитие осложнений. Старшие коллеги в подобных случаях рассчитывали отношение шансов для каждого показателя, отбирали значимые, проверяли отсутствие корреляции между ними, потом включали в логистическую регрессию.
1. Правильно ли я понимаю, что это когортное исследование, т.к. в него были включены все пациенты с изучаемой патологией (отбор не проводился) и затем прослежены в течение 90 дней? Соответственно, осложнения развились либо нет.
2. Верен ли такой подход?
3. Если верен, то как быть с количествеными показателями? Проводить ROC-анализ и разбивать на 2 группы по оптимальному пороговому значению?
4. Даже если такой подход верен, значимых показателей может оказаться все равно слишком много для одновременного включения в логистическую регрессию при таком количестве пациентов. Как уменьшить их количество?


Есть методики отбора признаков. Например такой комбайн для построения регрессионных и классификационных моделей как caret содержит несколько режимов решения этой задачи. Можно использовать рандомизационные техники наподобие Boruta и ему подобных пакетов (в том числе и оптимизирующих AUC).


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему