Помогите выбрать метод анализа и вклад факторов |
Здравствуйте, гость ( Вход | Регистрация )
Помогите выбрать метод анализа и вклад факторов |
8.05.2014 - 14:51
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.04.2014 Пользователь №: 26376 |
Уважаемые коллеги, помогите! Руководитель говорит одно, доцент кафедры другое, а я в статистике 0..... при этом нужно что то мне делать. Суть. Имеется группа пациентов 250 человек с ОКС БП ST (острый коронарный синдром без подъема сегмента ST), они имеют ряд клинических и ЭКГ-факторов (всего 21 фактор, или признак). Мной был разработан алгоритм стратификации риска смерти и инфаркта миокарда (ИМ) у данных пациентов на низкий и высокий риск. Стратификация проводилась по четырем блокам: 1) клинические факторы для высокого риска; 2) ЭКГ-факторы для высокого риска, 3) клинические факторы для низкого риска; 2) ЭКГ-факторы для низкого риска. Условие определения риска было следующим: наличие одного и более факторов из каждого блока, т.е. если пациент имел один фактор из клинического блока высокого риска и один из блока ЭКГ-факторов высокого риска, то ему присуждался - высокий риск. Оппонент высказал следующее мнение: необходимо каждому фактору (признаку) присудить балл, и разработать бальную систему стратификации рисков. И вот мне предлагают методы Каплана-Майера, либо Вальда, Кульбана..... Конечные точки в исследовании: смерть от любых причин, развитие нефатального ИМ. Сразу скажу, ни один пациент не умер. И вот я весь в сомнениях каким методом мне доказать силу этих 21-го фактора (признака). Если взять Каплана-Майера, то можно мне вместо смертности взять, к примеру какую либо величину из обследований (к примеру тропониновый тест, первая группа - положительный, вторая группа - отрицательный тест). И посмотреть каждый фактор (признак) в этих двух группах. Заранее благодарю....
Сообщение отредактировал udjin69 - 8.05.2014 - 20:22 |
|
11.05.2014 - 19:25
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Уважаемые коллеги, помогите! Руководитель говорит одно, доцент кафедры другое, а я в статистике 0..... при этом нужно что то мне делать. Суть. Имеется группа пациентов 250 человек с ОКС БП ST (острый коронарный синдром без подъема сегмента ST), они имеют ряд клинических и ЭКГ-факторов (всего 21 фактор, или признак). Мной был разработан алгоритм стратификации риска смерти и инфаркта миокарда (ИМ) у данных пациентов на низкий и высокий риск. Стратификация проводилась по четырем блокам: 1) клинические факторы для высокого риска; 2) ЭКГ-факторы для высокого риска, 3) клинические факторы для низкого риска; 2) ЭКГ-факторы для низкого риска. Условие определения риска было следующим: наличие одного и более факторов из каждого блока, т.е. если пациент имел один фактор из клинического блока высокого риска и один из блока ЭКГ-факторов высокого риска, то ему присуждался - высокий риск. Оппонент высказал следующее мнение: необходимо каждому фактору (признаку) присудить балл, и разработать бальную систему стратификации рисков. И вот мне предлагают методы Каплана-Майера, либо Вальда, Кульбана..... Конечные точки в исследовании: смерть от любых причин, развитие нефатального ИМ. Сразу скажу, ни один пациент не умер. И вот я весь в сомнениях каким методом мне доказать силу этих 21-го фактора (признака). Если взять Каплана-Майера, то можно мне вместо смертности взять, к примеру какую либо величину из обследований (к примеру тропониновый тест, первая группа - положительный, вторая группа - отрицательный тест). И посмотреть каждый фактор (признак) в этих двух группах. Заранее благодарю.... Дизайн вашего исследования не позволяет говорить о факторах риска смерти. Точнее, он только и позволяет, что говорить. Считать - нет. Поэтому абсолютно не важно как вы проведёте градацию: в баллах, в блоках или ещё в чём то. Это не принципиально, все полученные решения будут лишь более или менее обоснованными фантазиями, не подкреплёнными статистически. Причём сложно даже сказать какие из них будут более обоснованными, а какие - менее. Для того чтобы рассчитать риск смерти, должны быть смерти. Нет смертей - нет рисков! Только фантазии. Но на своём материале вы определённо можете рассчитать риски нефатального ИМ. Для этого следует воспользоваться аппаратом множественной логистической регрессии. Посмотрите поиском по форуму - очень много материала по этому методу. |
|
12.05.2014 - 07:53
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Если я правильно понял, прежде всего вам нужно определиться с целевой (зависимой) переменной.
Как я понимаю, это , скорее всего, только развитие ИМ с двумя значениями: да или нет. Тип других данных вы тоже не указали. 1) Я бы начал с анализа качества данных. Особое внимание нужно уделить взаимосвязям между переменными. Если переменные измерены в метрической шкале, то , возможно, следует провести факторный анализ и модели анализа строить по новым переменным-факторам. Для более глубокого понимания взаимосвязей полезно выполнить конфирматорный факторный анализ . При этом можно образовывать вторичные факторы, использовать перекрестные индикаторы. Можно оценить и связи между новыми факторами и др. 2) Из моделей анализа прежде всего я бы построил дерево классификации для всех данных. Затем можно построить деревья и по вашим блокам. С помощью данного метода также можно увидеть и взаимодействие факторов. 3) Очень удобны были бы в этой ситуации самоорганизующиеся карты Кохонена с зависимой переменной (для метрических данных). На них можно увидеть не только принадлежность данного наблюдения к категории (кластеру), но и как далеко или близко расположено оно от границы между категориями и др. 4) Анализ выживаемости (для ИМ или др.) возможен, если фактор времени важен и нужная информация у вас есть. Сложные данные подразумевают и достаточно сложный анализ. Одна из карт Кохонена. Сообщение отредактировал anserovtv - 12.05.2014 - 11:51
Прикрепленные файлы
|
|
12.05.2014 - 14:23
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.04.2014 Пользователь №: 26376 |
Дизайн вашего исследования не позволяет говорить о факторах риска смерти. Точнее, он только и позволяет, что говорить. Считать - нет. Поэтому абсолютно не важно как вы проведёте градацию: в баллах, в блоках или ещё в чём то. Это не принципиально, все полученные решения будут лишь более или менее обоснованными фантазиями, не подкреплёнными статистически. Причём сложно даже сказать какие из них будут более обоснованными, а какие - менее. Для того чтобы рассчитать риск смерти, должны быть смерти. Нет смертей - нет рисков! Только фантазии. Но на своём материале вы определённо можете рассчитать риски нефатального ИМ. Для этого следует воспользоваться аппаратом множественной логистической регрессии. Посмотрите поиском по форуму - очень много материала по этому методу. Я уже понял что о факторах смерти вести речь.... мягко говоря, надуманно.... Речь конечно же пойдет о развитии ИМ. |
|
12.05.2014 - 15:08
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.04.2014 Пользователь №: 26376 |
Если я правильно понял, прежде всего вам нужно определиться с целевой (зависимой) переменной. Как я понимаю, это , скорее всего, только развитие ИМ с двумя значениями: да или нет. Тип других данных вы тоже не указали. 1) Я бы начал с анализа качества данных. Особое внимание нужно уделить взаимосвязям между переменными. Если переменные измерены в метрической шкале, то , возможно, следует провести факторный анализ и модели анализа строить по новым переменным-факторам. Для более глубокого понимания взаимосвязей полезно выполнить конфирматорный факторный анализ . При этом можно образовывать вторичные факторы, использовать перекрестные индикаторы. Можно оценить и связи между новыми факторами и др. 2) Из моделей анализа прежде всего я бы построил дерево классификации для всех данных. Затем можно построить деревья и по вашим блокам. С помощью данного метода также можно увидеть и взаимодействие факторов. 3) Очень удобны были бы в этой ситуации самоорганизующиеся карты Кохонена с зависимой переменной (для метрических данных). На них можно увидеть не только принадлежность данного наблюдения к категории (кластеру), но и как далеко или близко расположено оно от границы между категориями и др. 4) Анализ выживаемости (для ИМ или др.) возможен, если фактор времени важен и нужная информация у вас есть. Сложные данные подразумевают и достаточно сложный анализ. Одна из карт Кохонена. Уважаемый anserovtv Вы выражаетесь несколько сложным для меня языком, но я постараюсь разобраться.... Несколько поясню Вам мою задачу. У нас есть 21 фактор риска развития ИМ, мы их взяли из рисков по Браунвальду (блок жалоб: длительность ангинозной боли; увеличение числа приступов; не купирующаяся боль и т.д., и блок ЭКГ-факторов: изменение сегмента ST; изменение зубца Т; тахиаритмия и т.д.). Там три блока факторов, соответственно высокий, средний и низкий риски. То есть это не измеряемые факторы - он есть или его нет и все. В этой же стратификации присутствует и лабораторный фактор (повышен или нет тропонин крови), мы его не учитываем т.к. на том этапе на котором будет применима наша шкала, лабораторию выполнить невозможно. И эти 21 фактор мы разделили на факторы высокого и низкого рисков. При этом, когда мы предлагаем стратифицировать риск, то ставится условие, должно присутствовать не менее 2-х факторов из низкого или высокого рисков, т.е.: один фактор из жалоб + один фактор из ЭКГ-картины = риск. Оппонент мне говорит, так не годится, нужна бальная система для вот этих 21 факторов. Дак вот что мы имеем... 250 пациентов которых госпитализировали и пролечили (есть все показатели диагностики). Мы их оценили (уже госпитально) по шкалам рисков ТIMI и GRACE, в которых есть лабораторные показатели. У кого то развился ИМ у кого то нет. И вот моя задача: оценить значимость тех 21 факторов в развитии ИМ и вывести бальную шкалу, где у каждого фактора будет свой балл в зависимости от его важности. |
|
12.05.2014 - 18:24
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Полагаю, что понял: у вас все или почти все переменные с бинарным откликом.
Тогда в самом деле лучше логрегрессия (и далее много всего), как вам советовали. Получается, что выше я написал лишнее. У меня такое ощущение, что слово "риск" у вас многозначно или может стать многозначным. И еще: схема вашего исследования мне кажется очень странной. Сообщение отредактировал anserovtv - 13.05.2014 - 16:01 |
|
13.05.2014 - 14:06
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 27.04.2014 Пользователь №: 26376 |
Полагаю, что понял: у вас все или почти все переменные с бинарным откликом. Тогда в самом деле лучше логрегрессия (и далее), как вам советовали. Я написал лишнее. У меня такое ощущение, что слово "риск" у вас многозначно или может стать многозначным. И еще: схема вашего исследования мне кажется очень странной. А почему вы так думаете? Ведь в любой шкале рисков, тот самый риск складывается из многих значений )))).... Чем больше количество значений или их величина, тем больше риск. Ну я вот так думаю.... По поводу странности исследования.... я и сам так периодически думаю..... А вот с вашей точки зрения - в чем странность? (мне это просто нужно знать, и представится возможность что то исправить). Буду благодарен если вы выскажите свое мнение. Спасибо. |
|