Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Стандартизация и корреляция
Ustas
сообщение 26.01.2006 - 22:35
Сообщение #1





Группа: Пользователи
Сообщений: 1
Регистрация: 26.01.2006
Пользователь №: 767



Подскажите, пожалуйста!
1. Можно ли рассчитать коэффициент корреляции по группе больных. Например зависимость фактора риска (артериальная гипертензия, диабет, атеросклероз и т.д.) от возраста, пола, формы заболевания и т.д, если про фактор риска известно только, что или он есть, или его нет. Если можно, то как.

2. Помогите определиться с методом рассчета вероятности возникновения заболевания в зависимости от фактора риска. Видел таблицы - в столбиках значения относительного и абсолютного риска для каждого фактора риска, а как это сделано - не понял.

Другая таблица: достоверность значимости факторов риска заболевания. В ней в столбиках - t-критерий для заболевания при каждом из факторов риска, тоже не знаю, как это сделать.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Leonov
сообщение 13.03.2006 - 21:06
Сообщение #2





Группа: Пользователи
Сообщений: 25
Регистрация: 7.10.2004
Пользователь №: 5



Цитата(Ustas @ 26.01.2006 - 19:35) [snapback]1081[/snapback]
1. Можно ли рассчитать коэффициент корреляции по группе больных. Например зависимость фактора риска (артериальная гипертензия, диабет, атеросклероз и т.д.) от возраста, пола, формы заболевания и т.д, если про фактор риска известно только, что или он есть, или его нет. Если можно, то как.

Используйте анализ таблиц сопряжёности, лог-линейный анализ, логистическую регрессию
http://www.biometrica.tomsk.ru/psycho2s.htm
http://www.biometrica.tomsk.ru/lar0.htm
http://www.biometrica.tomsk.ru/disser2.htm

Цитата(Ustas @ 26.01.2006 - 19:35) [snapback]1081[/snapback]
2. Помогите определиться с методом рассчета вероятности возникновения заболевания в зависимости от фактора риска. Видел таблицы - в столбиках значения относительного и абсолютного риска для каждого фактора риска, а как это сделано - не понял.

Извините, мой штатный телепат в отпуск ушёл rolleyes.gif Так что не могу понять, какую таблицу Вы видели. Вероятность возникновения заболевания в зависимости от комбинации факторов риска можно оценить в помощью логистической регрессии.
http://www.biometrica.tomsk.ru/psycho3s.htm
http://www.biometrica.tomsk.ru/psycho2s.htm
http://www.biometrica.tomsk.ru/lar0.htm
http://www.biometrica.tomsk.ru/disser2.htm

Цитата(Ustas @ 26.01.2006 - 19:35) [snapback]1081[/snapback]
Другая таблица: достоверность значимости факторов риска заболевания. В ней в столбиках - t-критерий для заболевания при каждом из факторов риска, тоже не знаю, как это сделать.

Рекомендую почитать статью Н.Зорина "О неправильном употреблении термина "достоверность" в российских научных психиатрических и общемедицинских статьях" http://www.biometrica.tomsk.ru/let1.htm
Биостатистика такая же сложная и специфическая наука, как кардиология, иммунология, гинекология и т.д...


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Dr_Andrew
сообщение 21.03.2006 - 07:37
Сообщение #3





Группа: Пользователи
Сообщений: 38
Регистрация: 31.08.2005
Из: азахстан
Пользователь №: 445



Цитата(Ustas @ 26.01.2006 - 22:35) [snapback]1081[/snapback]
Подскажите, пожалуйста!
1. Можно ли рассчитать коэффициент корреляции по группе больных. Например зависимость фактора риска (артериальная гипертензия, диабет, атеросклероз и т.д.) от возраста, пола, формы заболевания и т.д, если про фактор риска известно только, что или он есть, или его нет. Если можно, то как.


Однозначно нельзя. Почему? Потому, что корреляционная связь относится к так называемым количествкенным связям между явлениями. Это значит, что любому количественному значению признака соответствует определённое количественное значение другого признака. Если это правило соблюдается точно, то это будет функциональная связь, при этом при равномерном изменении значений одного признака будет происходить равномерное изменение значений другого признака. Однако, если на признак действует несколько различных факторов, то подобная зависимость будет соблюдена неточно, приближённо, поэтому можно говорить лишь об изменении средней признака при изменении средней другого признака. Это и будет корреляционная связь. Т.е., говоря просто, для вычисления корреляционной связи нужно: а) чтобы оба признака были измерены многократно; б) их значения выражались числами. У Вас же имеет место качественное (а не количественное) значение признака - есть или нет.
Тем не менее, связь между явлениями оценить можно. Вы даже сами упомянули как. Это факторы риска.
Итак, например, вам нужно изучить взаимосвязь между двумя факторами, выраженными качественными показателями (есть, нет), например, зависимость развития какого-либо заболевания (например, атеросклероза) от какого-либо фактора (например, возрастная группа >= 60 лет).
В настоящее время для этого модно пользоваться методами так называемой клинической эпидемиологии.
Для понимания - немного терминологии. В терминах клинической эпидемиологии (в нашем примере) возраст больного - это потенциальный риск. Им может быть, в принципе, любой фактор (например, пол, форма заболевания и т.п.), в том числе... и лечебный! Например, факт применения лекарственного препарата. Развитие заболевания (наступление смерти, выздоровления) называется исходом.
Тем самым, в клинической эпидемиологии используют термины:
Абсолютный риск ( R ), связанный с потенциальным фактором риска (Re) и отражающий вероятность изучаемого исхода (заболевания, смерти и т.п.) у экспонированных по данному фактору (в нашем случае – по возрасту 60 лет и старше).
Экспонированный - это имеющий данный фактор риска (буквально - имевший контакт, понятие идёт от инфекционной эпидемиологии).
Относительный риск (RR) – отношение абсолютных рисков при наличии (Re) и отсутствии (Rne) воздействия изучаемого фактора: RR=Re/Rne. RR характеризует силу связи между воздействием фактора и заболеванием, т.е. биологический аспект проблемы. Если относительный риск >1, то возникновение болезни может быть связано с действием данного фактора. Чем больше значение RR, тем важнее этиологическая роль фактора. Если RR=1, то фактор не оказывает воздействия, а RR<1 означает превентивное действие изучаемого фактора. Re при этом определяется как отношение количества заболевших (умерших) из числа подвергшихся действию данного фактора (в нашем случае – экспонированных по возрасту) к общему количеству всех экспонированных по данному фактору, т.е., по сути, рассчитывается как показатель кумулятивной инцидентности для экспонированных. Абсолютный риск возникновения изучаемого исхода (развитие атеросклероза) у лиц, не экспонированных к данному фактору риска (Rne) рассчитывается как показатель кумулятивной инцидентности в группе лиц, не подвергавшихся действию данного фактора.
Запутал? cool.gif Ничего, это наукообразное описание для вставки в диссер, на деле же всё просто как грабли.
Итак, чертим четырёхпольную таблицу (2 клетки сверху, 2 - снизу), цитата: "согласно международному дизайну формы проведения эпидемиологических исследований в клинике". rolleyes.gif
Для удобства дорисуем к 4-польной таблице подписи полей, а также поля "всего", тогда она примет вид:
~~~~~~~~~~~~~~~~~~~ + исход ~~~~~~~~ -исход ~~~~~~~~~~~ всего
Экспонированные ~~~~~~a ~~~~~~~~~~~~~~b ~~~~~~~~~~~~~~~ a+b
Неэкспонированные~~~~c~~~~~~~~~~~~~~~d~~~~~~~~~~~~~~~~c+d
Всего~~~~~~~~~~~~~~~~a+c~~~~~~~~~~~~~b+d~~~~~~~~~~~~~~N=a+b+c+d

На тильды (~) внимания не обращайте, я их использовал лишь для форматирования таблицы.
Что куда писать? Итак, a - это число (абсолютное, не процент!) экспонированных больных (т.е. в нашем случае в возрасте более 60 лет), у которых наступил изучаемый исход (т.н. плюс-исход, в нашем случае - атеросклероз). b - число экспонированных (в возрасте старше 60 лет) больных, у которых НЕ наступил изучаемый исход (т.н. минус-исход, т.е. нет атеросклероза). c и d - то же самое, но для неэкспонированных больных (в возрасте моложе 60 лет).
Тогда, исходя из данных таблицы, относительный риск (RR) рассчитывается следующим образом:
RR=(a/(a+b))/(c/(c+d)).
Если мы взглянем на формулу (и на таблицу, кстати), то увидим, что эта крутая "весчь", относительный риск, который нам преподносят как некую изюминку "доказательной медицины", которой у нас (во времена СССР), якобы, никогда не было, то увидим, что это всего лишь частный (наиболее простой для расчёта) случай старого доброго хи-квадрата, известного также под именем критерия согласия Пирсона, который каждый из нас преизрядно считал (по крайней мере, должен был считать) на 3-м курсе меда в рамках "Социальной гигиены и организации здравоохранения". Отсюда вытекют ответы на остальные части Вашего вопроса.

Цитата(Ustas @ 26.01.2006 - 22:35) [snapback]1081[/snapback]
2. Помогите определиться с методом рассчета вероятности возникновения заболевания в зависимости от фактора риска. Видел таблицы - в столбиках значения относительного и абсолютного риска для каждого фактора риска, а как это сделано - не понял.


Объяснил? cool.gif

Цитата(Ustas @ 26.01.2006 - 22:35) [snapback]1081[/snapback]
Другая таблица: достоверность значимости факторов риска заболевания. В ней в столбиках - t-критерий для заболевания при каждом из факторов риска, тоже не знаю, как это сделать.


Кстати, при желании, можно использовать и другие показатели, дабы показать свою крутизну:
Разность рисков (RD) – разность абсолютных рисков при наличии и отсутствии изучаемого фактора. Показывает, к какому абсолютному повышению заболеваемости приводит воздействие фактора, т.е. характеризует связь с данным фактором с позиций общественного здравоохранения: RD=Re-Rne=a/(a+b)-c/(c+d).
Атрибутивная фракция (AF) – отношение разности рисков к абсолютному у экспонированных, выраженное в процентах. Представляет собой долю всех случаев заболевания у экспонированных, обусловленную данным фактором. Показатель AF не имеет смысл, если причинная связь на самом деле отсутствует: AF=RD/Re*100=Re-Rne/Re*100(%).
Однако ушёл в сторону. Вернёмся к нашим факторам риска. So, рассчитали мы RR. Теперь наша задача его интерпретировать. Это см. выше (больше или меньше 1). Чем больше число, тем больше сила связи. Для нужд практики этого, в принципе, достаточно, но для науки не катит. Нам надо оценить значимость полученной величины. Для этого воспользуемся приёмами, известными нам (если на соцгиге не спали) с 3-го курса. Смысл хи-квадрата вообще-то (что "клиническая эпидемиология" не разъясняет) в оценке разности между ожидаемыми и действительными величинами при действии изучаемого фактора. Поэтому нам нужно оценить, является ли эта разность существенной или несущественной (случайной). Вначале нам нужно найти число степеней свободы k, которое зависит от числа полей таблицы, которые могут быть заполнены вполне определёнными значениями, независимо друг от друга.
Число степеней свободы может быть вычислено по формуле:

k=(c-1)*(r-1), где

с - число клеток по горизонтали (за исключением итога), а r - число сравниваемых рядов.
В нашем простейшем примере (4-польная таблица) k=(2-1)*(2-1)=1*1=1, т.е. 1 степень свободы.
Теперь нужно решить, какой минимум вероятности безошибочного прогноза следует взять для заключения о наличии связи между потенциальным фактором риска и исходом. В принципе, для биомедицинских исследований достаточна вероятность 95% (т.е. p<0,05).
Зная эти числа (k, p) мы можем воспользоваться таблицей "Вероятности p для критерия хи-квадрат". Обычно в такой таблице значения степеней свободы идут в столбик, а вероятности случайности (p) - по горизонтали. На пересечении граф и будет искомое значение хи-квадрат, которое нужно сравнить с вычисленным фактором относительного риска (RR). Так, для k=1 и p=0,05 хи-квадрат равен 3,841, а для p=0,01 - 6,635. Предположим, показатель относительного риска (RR) у нас оказался равен 8. Поскольку он много больше хи-квадрат для p=0,01 (6,635), то можно сделать вывод, что случайность различий в развитии атеросклероза у больных старше и моложе 60 лет исключается при p<0,01.
Вот и всё. Не так страшен чёрт, как его малюют. Я в принципе, написал под себя программку для расчёта хи-квадрат, но в сеть пока не выкладывал из-за необходимости урегулирования авторских прав (делалось в рамках НИР).


Signature
Казахский научный центр карантинных и зоонозных инфекций.
Лаборатория бруцеллёза и внутриклеточных инфекций
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 4.10.2006 - 19:58
Сообщение #4





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Ustas @ 26.01.2006 - 23:35) [snapback]1081[/snapback]
Подскажите, пожалуйста!
1. Можно ли рассчитать коэффициент корреляции по группе больных. Например зависимость фактора риска (артериальная гипертензия, диабет, атеросклероз и т.д.) от возраста, пола, формы заболевания и т.д, если про фактор риска известно только, что или он есть, или его нет. Если можно, то как.

2. Помогите определиться с методом рассчета вероятности возникновения заболевания в зависимости от фактора риска. Видел таблицы - в столбиках значения относительного и абсолютного риска для каждого фактора риска, а как это сделано - не понял.

Другая таблица: достоверность значимости факторов риска заболевания. В ней в столбиках - t-критерий для заболевания при каждом из факторов риска, тоже не знаю, как это сделать.

1. Можно, но не нужно. Есть методы расчета коэффициентов корреляции для качественных признаков (тетрахорический коэффициент Пирсона, например), однако ими пользуются лишь изредка, когда, например, надо делать факторный анализ для смеси качественных и количественных переменных. Замечу, что фактор риска (по определению) НЕ может зависеть от тяжести заболевания - либо связан, либо зависимость наоборот. В качестве показателя связи лучше использовать отношения шансов (а не относительный риск, если только у Вас не было когортного исследования, где Вы вначале измеряли фактор риска, а зтем смотрели за развитием заболевания). Формула OR=a*d/b/c.
2. Обычно делается на основе результатов логистической регрессии. Значения факторов риска (с определенным шагом) подставляются в уравнение регрессии y=1/(1+exp(-(ax+b))), и полученные значения вносятся в таблицу. Наверное, понятно, что то, что написано как ax+b в случае, например САД, ХС и диабета будет выглядеть так: Intercept (постоянный член)+ beta1*САД +beta2*ХС +beta3*диабет (да=1, 0=нет). Получите шкалу риска. Затем ее разделить на группы (квартили-квинтили) и посчитать реальный абсолютный риск в каждой из групп. Еще один подход - регрессия по Пуассону. В результате подстановки в регресионное уравнение значений обычно получают частоту события (т.е. абсолютный риск). Умножив ее на численность группы (вернее, на количество человеко-лет наблюдения в группе) будет получено ожидаемая (откорректированная) частота возникновения события. Затем можно расчитывать относительный риск путем деления на стандартное значение (так расчитываются стандартизованные показатели смертности SMR, например).
3. Опять-таки лучше логистической регрессией (только там тогда будет не t, а, скорее, хи2 Вальда)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему