Форум врачей-аспирантов > Помогите выбрать метод анализа и вклад факторов

udjin69

8.05.2014 - 14:51

Уважаемые коллеги, помогите! Руководитель говорит одно, доцент кафедры другое, а я в статистике 0..... при этом нужно что то мне делать. Суть. Имеется группа пациентов 250 человек с ОКС БП ST (острый коронарный синдром без подъема сегмента ST), они имеют ряд клинических и ЭКГ-факторов (всего 21 фактор, или признак). Мной был разработан алгоритм стратификации риска смерти и инфаркта миокарда (ИМ) у данных пациентов на низкий и высокий риск. Стратификация проводилась по четырем блокам: 1) клинические факторы для высокого риска; 2) ЭКГ-факторы для высокого риска, 3) клинические факторы для низкого риска; 2) ЭКГ-факторы для низкого риска. Условие определения риска было следующим: наличие одного и более факторов из каждого блока, т.е. если пациент имел один фактор из клинического блока высокого риска и один из блока ЭКГ-факторов высокого риска, то ему присуждался - высокий риск. Оппонент высказал следующее мнение: необходимо каждому фактору (признаку) присудить балл, и разработать бальную систему стратификации рисков. И вот мне предлагают методы Каплана-Майера, либо Вальда, Кульбана..... Конечные точки в исследовании: смерть от любых причин, развитие нефатального ИМ. Сразу скажу, ни один пациент не умер. И вот я весь в сомнениях каким методом мне доказать силу этих 21-го фактора (признака). Если взять Каплана-Майера, то можно мне вместо смертности взять, к примеру какую либо величину из обследований (к примеру тропониновый тест, первая группа - положительный, вторая группа - отрицательный тест). И посмотреть каждый фактор (признак) в этих двух группах. Заранее благодарю....

nokh

11.05.2014 - 19:25

Цитата(udjin69 @ 8.05.2014 - 17:51)

Уважаемые коллеги, помогите! Руководитель говорит одно, доцент кафедры другое, а я в статистике 0..... при этом нужно что то мне делать. Суть. Имеется группа пациентов 250 человек с ОКС БП ST (острый коронарный синдром без подъема сегмента ST), они имеют ряд клинических и ЭКГ-факторов (всего 21 фактор, или признак). Мной был разработан алгоритм стратификации риска смерти и инфаркта миокарда (ИМ) у данных пациентов на низкий и высокий риск. Стратификация проводилась по четырем блокам: 1) клинические факторы для высокого риска; 2) ЭКГ-факторы для высокого риска, 3) клинические факторы для низкого риска; 2) ЭКГ-факторы для низкого риска. Условие определения риска было следующим: наличие одного и более факторов из каждого блока, т.е. если пациент имел один фактор из клинического блока высокого риска и один из блока ЭКГ-факторов высокого риска, то ему присуждался - высокий риск. Оппонент высказал следующее мнение: необходимо каждому фактору (признаку) присудить балл, и разработать бальную систему стратификации рисков. И вот мне предлагают методы Каплана-Майера, либо Вальда, Кульбана..... Конечные точки в исследовании: смерть от любых причин, развитие нефатального ИМ. Сразу скажу, ни один пациент не умер. И вот я весь в сомнениях каким методом мне доказать силу этих 21-го фактора (признака). Если взять Каплана-Майера, то можно мне вместо смертности взять, к примеру какую либо величину из обследований (к примеру тропониновый тест, первая группа - положительный, вторая группа - отрицательный тест). И посмотреть каждый фактор (признак) в этих двух группах. Заранее благодарю....

Дизайн вашего исследования не позволяет говорить о факторах риска смерти. Точнее, он только и позволяет, что говорить. Считать - нет. Поэтому абсолютно не важно как вы проведёте градацию: в баллах, в блоках или ещё в чём то. Это не принципиально, все полученные решения будут лишь более или менее обоснованными фантазиями, не подкреплёнными статистически. Причём сложно даже сказать какие из них будут более обоснованными, а какие - менее. Для того чтобы рассчитать риск смерти, должны быть смерти. Нет смертей - нет рисков! Только фантазии. Но на своём материале вы определённо можете рассчитать риски нефатального ИМ. Для этого следует воспользоваться аппаратом множественной логистической регрессии. Посмотрите поиском по форуму - очень много материала по этому методу.

anserovtv

12.05.2014 - 07:53

Если я правильно понял, прежде всего вам нужно определиться с целевой (зависимой) переменной.
Как я понимаю, это , скорее всего, только развитие ИМ с двумя значениями: да или нет.
Тип других данных вы тоже не указали.
1) Я бы начал с анализа качества данных. Особое внимание нужно уделить взаимосвязям между переменными.
Если переменные измерены в метрической шкале, то , возможно, следует провести факторный анализ и модели анализа строить по новым переменным-факторам.
Для более глубокого понимания взаимосвязей полезно выполнить конфирматорный факторный анализ .
При этом можно образовывать вторичные факторы, использовать перекрестные индикаторы.
Можно оценить и связи между новыми факторами и др.
2) Из моделей анализа прежде всего я бы построил дерево классификации для всех данных.
Затем можно построить деревья и по вашим блокам.
С помощью данного метода также можно увидеть и взаимодействие факторов.
3) Очень удобны были бы в этой ситуации самоорганизующиеся карты Кохонена с зависимой переменной (для метрических данных).
На них можно увидеть не только принадлежность данного наблюдения к категории (кластеру),
но и как далеко или близко расположено оно от границы между категориями и др.
4) Анализ выживаемости (для ИМ или др.) возможен, если фактор времени важен и нужная информация у вас есть.
Сложные данные подразумевают и достаточно сложный анализ.

Одна из карт Кохонена.

udjin69

12.05.2014 - 14:23

Цитата(nokh @ 11.05.2014 - 19:25)

Дизайн вашего исследования не позволяет говорить о факторах риска смерти. Точнее, он только и позволяет, что говорить. Считать - нет. Поэтому абсолютно не важно как вы проведёте градацию: в баллах, в блоках или ещё в чём то. Это не принципиально, все полученные решения будут лишь более или менее обоснованными фантазиями, не подкреплёнными статистически. Причём сложно даже сказать какие из них будут более обоснованными, а какие - менее. Для того чтобы рассчитать риск смерти, должны быть смерти. Нет смертей - нет рисков! Только фантазии. Но на своём материале вы определённо можете рассчитать риски нефатального ИМ. Для этого следует воспользоваться аппаратом множественной логистической регрессии. Посмотрите поиском по форуму - очень много материала по этому методу.

Я уже понял что о факторах смерти вести речь.... мягко говоря, надуманно.... Речь конечно же пойдет о развитии ИМ.

udjin69

12.05.2014 - 15:08

Цитата(anserovtv @ 12.05.2014 - 07:53)

Если я правильно понял, прежде всего вам нужно определиться с целевой (зависимой) переменной.
Как я понимаю, это , скорее всего, только развитие ИМ с двумя значениями: да или нет.
Тип других данных вы тоже не указали.
1) Я бы начал с анализа качества данных. Особое внимание нужно уделить взаимосвязям между переменными.
Если переменные измерены в метрической шкале, то , возможно, следует провести факторный анализ и модели анализа строить по новым переменным-факторам.
Для более глубокого понимания взаимосвязей полезно выполнить конфирматорный факторный анализ .
При этом можно образовывать вторичные факторы, использовать перекрестные индикаторы.
Можно оценить и связи между новыми факторами и др.
2) Из моделей анализа прежде всего я бы построил дерево классификации для всех данных.
Затем можно построить деревья и по вашим блокам.
С помощью данного метода также можно увидеть и взаимодействие факторов.
3) Очень удобны были бы в этой ситуации самоорганизующиеся карты Кохонена с зависимой переменной (для метрических данных).
На них можно увидеть не только принадлежность данного наблюдения к категории (кластеру),
но и как далеко или близко расположено оно от границы между категориями и др.
4) Анализ выживаемости (для ИМ или др.) возможен, если фактор времени важен и нужная информация у вас есть.
Сложные данные подразумевают и достаточно сложный анализ.

Одна из карт Кохонена.

Уважаемый anserovtv Вы выражаетесь несколько сложным для меня языком, но я постараюсь разобраться.... Несколько поясню Вам мою задачу. У нас есть 21 фактор риска развития ИМ, мы их взяли из рисков по Браунвальду (блок жалоб: длительность ангинозной боли; увеличение числа приступов; не купирующаяся боль и т.д., и блок ЭКГ-факторов: изменение сегмента ST; изменение зубца Т; тахиаритмия и т.д.). Там три блока факторов, соответственно высокий, средний и низкий риски. То есть это не измеряемые факторы - он есть или его нет и все. В этой же стратификации присутствует и лабораторный фактор (повышен или нет тропонин крови), мы его не учитываем т.к. на том этапе на котором будет применима наша шкала, лабораторию выполнить невозможно. И эти 21 фактор мы разделили на факторы высокого и низкого рисков. При этом, когда мы предлагаем стратифицировать риск, то ставится условие, должно присутствовать не менее 2-х факторов из низкого или высокого рисков, т.е.: один фактор из жалоб + один фактор из ЭКГ-картины = риск. Оппонент мне говорит, так не годится, нужна бальная система для вот этих 21 факторов. Дак вот что мы имеем... 250 пациентов которых госпитализировали и пролечили (есть все показатели диагностики). Мы их оценили (уже госпитально) по шкалам рисков ТIMI и GRACE, в которых есть лабораторные показатели. У кого то развился ИМ у кого то нет. И вот моя задача: оценить значимость тех 21 факторов в развитии ИМ и вывести бальную шкалу, где у каждого фактора будет свой балл в зависимости от его важности.

anserovtv

12.05.2014 - 18:24

Полагаю, что понял: у вас все или почти все переменные с бинарным откликом.
Тогда в самом деле лучше логрегрессия (и далее много всего), как вам советовали.
Получается, что выше я написал лишнее.
У меня такое ощущение, что слово "риск" у вас многозначно или может стать многозначным.
И еще: схема вашего исследования мне кажется очень странной.

udjin69

13.05.2014 - 14:06

Цитата(anserovtv @ 12.05.2014 - 18:24)

Полагаю, что понял: у вас все или почти все переменные с бинарным откликом.
Тогда в самом деле лучше логрегрессия (и далее), как вам советовали.
Я написал лишнее.
У меня такое ощущение, что слово "риск" у вас многозначно или может стать многозначным.
И еще: схема вашего исследования мне кажется очень странной.

А почему вы так думаете? Ведь в любой шкале рисков, тот самый риск складывается из многих значений )))).... Чем больше количество значений или их величина, тем больше риск. Ну я вот так думаю....
По поводу странности исследования.... я и сам так периодически думаю..... А вот с вашей точки зрения - в чем странность? (мне это просто нужно знать, и представится возможность что то исправить). Буду благодарен если вы выскажите свое мнение. Спасибо.