Стандартизация и корреляция - Форум врачей-аспирантов

Форум врачей-аспирантов

Правила форума

Пользователи

Календарь

Здравствуйте, гость ( Вход | Регистрация )

Форум врачей-аспирантов » Разделы форума » Медицинская статистика

Добавить ответ в эту тему

Открыть тему

Стандартизация и корреляция

Ustas Просмотр профиля	26.01.2006 - 22:35 Сообщение #1
Группа: Пользователи Сообщений: 1 Регистрация: 26.01.2006 Пользователь №: 767	Подскажите, пожалуйста! 1. Можно ли рассчитать коэффициент корреляции по группе больных. Например зависимость фактора риска (артериальная гипертензия, диабет, атеросклероз и т.д.) от возраста, пола, формы заболевания и т.д, если про фактор риска известно только, что или он есть, или его нет. Если можно, то как. 2. Помогите определиться с методом рассчета вероятности возникновения заболевания в зависимости от фактора риска. Видел таблицы - в столбиках значения относительного и абсолютного риска для каждого фактора риска, а как это сделано - не понял. Другая таблица: достоверность значимости факторов риска заболевания. В ней в столбиках - t-критерий для заболевания при каждом из факторов риска, тоже не знаю, как это сделать.

Leonov Просмотр профиля	13.03.2006 - 21:06 Сообщение #2
Группа: Пользователи Сообщений: 25 Регистрация: 7.10.2004 Пользователь №: 5	Цитата(Ustas @ 26.01.2006 - 19:35) [snapback]1081[/snapback] 1. Можно ли рассчитать коэффициент корреляции по группе больных. Например зависимость фактора риска (артериальная гипертензия, диабет, атеросклероз и т.д.) от возраста, пола, формы заболевания и т.д, если про фактор риска известно только, что или он есть, или его нет. Если можно, то как. Используйте анализ таблиц сопряжёности, лог-линейный анализ, логистическую регрессию http://www.biometrica.tomsk.ru/psycho2s.htm http://www.biometrica.tomsk.ru/lar0.htm http://www.biometrica.tomsk.ru/disser2.htm Цитата(Ustas @ 26.01.2006 - 19:35) [snapback]1081[/snapback] 2. Помогите определиться с методом рассчета вероятности возникновения заболевания в зависимости от фактора риска. Видел таблицы - в столбиках значения относительного и абсолютного риска для каждого фактора риска, а как это сделано - не понял. Извините, мой штатный телепат в отпуск ушёл Так что не могу понять, какую таблицу Вы видели. Вероятность возникновения заболевания в зависимости от комбинации факторов риска можно оценить в помощью логистической регрессии. http://www.biometrica.tomsk.ru/psycho3s.htm http://www.biometrica.tomsk.ru/psycho2s.htm http://www.biometrica.tomsk.ru/lar0.htm http://www.biometrica.tomsk.ru/disser2.htm Цитата(Ustas @ 26.01.2006 - 19:35) [snapback]1081[/snapback] Другая таблица: достоверность значимости факторов риска заболевания. В ней в столбиках - t-критерий для заболевания при каждом из факторов риска, тоже не знаю, как это сделать. Рекомендую почитать статью Н.Зорина "О неправильном употреблении термина "достоверность" в российских научных психиатрических и общемедицинских статьях" http://www.biometrica.tomsk.ru/let1.htm Биостатистика такая же сложная и специфическая наука, как кардиология, иммунология, гинекология и т.д... В. Леонов, "Биометрика" - журнал для медиков и биологов

Dr_Andrew Просмотр профиля	21.03.2006 - 07:37 Сообщение #3
Группа: Пользователи Сообщений: 38 Регистрация: 31.08.2005 Из: азахстан Пользователь №: 445	Цитата(Ustas @ 26.01.2006 - 22:35) [snapback]1081[/snapback] Подскажите, пожалуйста! 1. Можно ли рассчитать коэффициент корреляции по группе больных. Например зависимость фактора риска (артериальная гипертензия, диабет, атеросклероз и т.д.) от возраста, пола, формы заболевания и т.д, если про фактор риска известно только, что или он есть, или его нет. Если можно, то как. Однозначно нельзя. Почему? Потому, что корреляционная связь относится к так называемым количествкенным связям между явлениями. Это значит, что любому количественному значению признака соответствует определённое количественное значение другого признака. Если это правило соблюдается точно, то это будет функциональная связь, при этом при равномерном изменении значений одного признака будет происходить равномерное изменение значений другого признака. Однако, если на признак действует несколько различных факторов, то подобная зависимость будет соблюдена неточно, приближённо, поэтому можно говорить лишь об изменении средней признака при изменении средней другого признака. Это и будет корреляционная связь. Т.е., говоря просто, для вычисления корреляционной связи нужно: а) чтобы оба признака были измерены многократно; б) их значения выражались числами. У Вас же имеет место качественное (а не количественное) значение признака - есть или нет. Тем не менее, связь между явлениями оценить можно. Вы даже сами упомянули как. Это факторы риска. Итак, например, вам нужно изучить взаимосвязь между двумя факторами, выраженными качественными показателями (есть, нет), например, зависимость развития какого-либо заболевания (например, атеросклероза) от какого-либо фактора (например, возрастная группа >= 60 лет). В настоящее время для этого модно пользоваться методами так называемой клинической эпидемиологии. Для понимания - немного терминологии. В терминах клинической эпидемиологии (в нашем примере) возраст больного - это потенциальный риск. Им может быть, в принципе, любой фактор (например, пол, форма заболевания и т.п.), в том числе... и лечебный! Например, факт применения лекарственного препарата. Развитие заболевания (наступление смерти, выздоровления) называется исходом. Тем самым, в клинической эпидемиологии используют термины: Абсолютный риск ( R ), связанный с потенциальным фактором риска (Re) и отражающий вероятность изучаемого исхода (заболевания, смерти и т.п.) у экспонированных по данному фактору (в нашем случае – по возрасту 60 лет и старше). Экспонированный - это имеющий данный фактор риска (буквально - имевший контакт, понятие идёт от инфекционной эпидемиологии). Относительный риск (RR) – отношение абсолютных рисков при наличии (Re) и отсутствии (Rne) воздействия изучаемого фактора: RR=Re/Rne. RR характеризует силу связи между воздействием фактора и заболеванием, т.е. биологический аспект проблемы. Если относительный риск >1, то возникновение болезни может быть связано с действием данного фактора. Чем больше значение RR, тем важнее этиологическая роль фактора. Если RR=1, то фактор не оказывает воздействия, а RR<1 означает превентивное действие изучаемого фактора. Re при этом определяется как отношение количества заболевших (умерших) из числа подвергшихся действию данного фактора (в нашем случае – экспонированных по возрасту) к общему количеству всех экспонированных по данному фактору, т.е., по сути, рассчитывается как показатель кумулятивной инцидентности для экспонированных. Абсолютный риск возникновения изучаемого исхода (развитие атеросклероза) у лиц, не экспонированных к данному фактору риска (Rne) рассчитывается как показатель кумулятивной инцидентности в группе лиц, не подвергавшихся действию данного фактора. Запутал? Ничего, это наукообразное описание для вставки в диссер, на деле же всё просто как грабли. Итак, чертим четырёхпольную таблицу (2 клетки сверху, 2 - снизу), цитата: "согласно международному дизайну формы проведения эпидемиологических исследований в клинике". Для удобства дорисуем к 4-польной таблице подписи полей, а также поля "всего", тогда она примет вид: ~~~~~~~~~~~~~~~~~~~ + исход ~~~~~~~~ -исход ~~~~~~~~~~~ всего Экспонированные ~~~~~~a ~~~~~~~~~~~~~~b ~~~~~~~~~~~~~~~ a+b Неэкспонированные~~~~c~~~~~~~~~~~~~~~d~~~~~~~~~~~~~~~~c+d Всего~~~~~~~~~~~~~~~~a+c~~~~~~~~~~~~~b+d~~~~~~~~~~~~~~N=a+b+c+d На тильды (~) внимания не обращайте, я их использовал лишь для форматирования таблицы. Что куда писать? Итак, a - это число (абсолютное, не процент!) экспонированных больных (т.е. в нашем случае в возрасте более 60 лет), у которых наступил изучаемый исход (т.н. плюс-исход, в нашем случае - атеросклероз). b - число экспонированных (в возрасте старше 60 лет) больных, у которых НЕ наступил изучаемый исход (т.н. минус-исход, т.е. нет атеросклероза). c и d - то же самое, но для неэкспонированных больных (в возрасте моложе 60 лет). Тогда, исходя из данных таблицы, относительный риск (RR) рассчитывается следующим образом: RR=(a/(a+b))/(c/(c+d)). Если мы взглянем на формулу (и на таблицу, кстати), то увидим, что эта крутая "весчь", относительный риск, который нам преподносят как некую изюминку "доказательной медицины", которой у нас (во времена СССР), якобы, никогда не было, то увидим, что это всего лишь частный (наиболее простой для расчёта) случай старого доброго хи-квадрата, известного также под именем критерия согласия Пирсона, который каждый из нас преизрядно считал (по крайней мере, должен был считать) на 3-м курсе меда в рамках "Социальной гигиены и организации здравоохранения". Отсюда вытекют ответы на остальные части Вашего вопроса. Цитата(Ustas @ 26.01.2006 - 22:35) [snapback]1081[/snapback] 2. Помогите определиться с методом рассчета вероятности возникновения заболевания в зависимости от фактора риска. Видел таблицы - в столбиках значения относительного и абсолютного риска для каждого фактора риска, а как это сделано - не понял. Объяснил? Цитата(Ustas @ 26.01.2006 - 22:35) [snapback]1081[/snapback] Другая таблица: достоверность значимости факторов риска заболевания. В ней в столбиках - t-критерий для заболевания при каждом из факторов риска, тоже не знаю, как это сделать. Кстати, при желании, можно использовать и другие показатели, дабы показать свою крутизну: Разность рисков (RD) – разность абсолютных рисков при наличии и отсутствии изучаемого фактора. Показывает, к какому абсолютному повышению заболеваемости приводит воздействие фактора, т.е. характеризует связь с данным фактором с позиций общественного здравоохранения: RD=Re-Rne=a/(a+b)-c/(c+d). Атрибутивная фракция (AF) – отношение разности рисков к абсолютному у экспонированных, выраженное в процентах. Представляет собой долю всех случаев заболевания у экспонированных, обусловленную данным фактором. Показатель AF не имеет смысл, если причинная связь на самом деле отсутствует: AF=RD/Re100=Re-Rne/Re100(%). Однако ушёл в сторону. Вернёмся к нашим факторам риска. So, рассчитали мы RR. Теперь наша задача его интерпретировать. Это см. выше (больше или меньше 1). Чем больше число, тем больше сила связи. Для нужд практики этого, в принципе, достаточно, но для науки не катит. Нам надо оценить значимость полученной величины. Для этого воспользуемся приёмами, известными нам (если на соцгиге не спали) с 3-го курса. Смысл хи-квадрата вообще-то (что "клиническая эпидемиология" не разъясняет) в оценке разности между ожидаемыми и действительными величинами при действии изучаемого фактора. Поэтому нам нужно оценить, является ли эта разность существенной или несущественной (случайной). Вначале нам нужно найти число степеней свободы k, которое зависит от числа полей таблицы, которые могут быть заполнены вполне определёнными значениями, независимо друг от друга. Число степеней свободы может быть вычислено по формуле: k=(c-1)(r-1), где с - число клеток по горизонтали (за исключением итога), а r - число сравниваемых рядов. В нашем простейшем примере (4-польная таблица) k=(2-1)(2-1)=1*1=1, т.е. 1 степень свободы. Теперь нужно решить, какой минимум вероятности безошибочного прогноза следует взять для заключения о наличии связи между потенциальным фактором риска и исходом. В принципе, для биомедицинских исследований достаточна вероятность 95% (т.е. p<0,05). Зная эти числа (k, p) мы можем воспользоваться таблицей "Вероятности p для критерия хи-квадрат". Обычно в такой таблице значения степеней свободы идут в столбик, а вероятности случайности (p) - по горизонтали. На пересечении граф и будет искомое значение хи-квадрат, которое нужно сравнить с вычисленным фактором относительного риска (RR). Так, для k=1 и p=0,05 хи-квадрат равен 3,841, а для p=0,01 - 6,635. Предположим, показатель относительного риска (RR) у нас оказался равен 8. Поскольку он много больше хи-квадрат для p=0,01 (6,635), то можно сделать вывод, что случайность различий в развитии атеросклероза у больных старше и моложе 60 лет исключается при p<0,01. Вот и всё. Не так страшен чёрт, как его малюют. Я в принципе, написал под себя программку для расчёта хи-квадрат, но в сеть пока не выкладывал из-за необходимости урегулирования авторских прав (делалось в рамках НИР). Казахский научный центр карантинных и зоонозных инфекций. Лаборатория бруцеллёза и внутриклеточных инфекций

плав Просмотр профиля	4.10.2006 - 19:58 Сообщение #4
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Цитата(Ustas @ 26.01.2006 - 23:35) [snapback]1081[/snapback] Подскажите, пожалуйста! 1. Можно ли рассчитать коэффициент корреляции по группе больных. Например зависимость фактора риска (артериальная гипертензия, диабет, атеросклероз и т.д.) от возраста, пола, формы заболевания и т.д, если про фактор риска известно только, что или он есть, или его нет. Если можно, то как. 2. Помогите определиться с методом рассчета вероятности возникновения заболевания в зависимости от фактора риска. Видел таблицы - в столбиках значения относительного и абсолютного риска для каждого фактора риска, а как это сделано - не понял. Другая таблица: достоверность значимости факторов риска заболевания. В ней в столбиках - t-критерий для заболевания при каждом из факторов риска, тоже не знаю, как это сделать. 1. Можно, но не нужно. Есть методы расчета коэффициентов корреляции для качественных признаков (тетрахорический коэффициент Пирсона, например), однако ими пользуются лишь изредка, когда, например, надо делать факторный анализ для смеси качественных и количественных переменных. Замечу, что фактор риска (по определению) НЕ может зависеть от тяжести заболевания - либо связан, либо зависимость наоборот. В качестве показателя связи лучше использовать отношения шансов (а не относительный риск, если только у Вас не было когортного исследования, где Вы вначале измеряли фактор риска, а зтем смотрели за развитием заболевания). Формула OR=ad/b/c. 2. Обычно делается на основе результатов логистической регрессии. Значения факторов риска (с определенным шагом) подставляются в уравнение регрессии y=1/(1+exp(-(ax+b))), и полученные значения вносятся в таблицу. Наверное, понятно, что то, что написано как ax+b в случае, например САД, ХС и диабета будет выглядеть так: Intercept (постоянный член)+ beta1САД +beta2ХС +beta3диабет (да=1, 0=нет). Получите шкалу риска. Затем ее разделить на группы (квартили-квинтили) и посчитать реальный абсолютный риск в каждой из групп. Еще один подход - регрессия по Пуассону. В результате подстановки в регресионное уравнение значений обычно получают частоту события (т.е. абсолютный риск). Умножив ее на численность группы (вернее, на количество человеко-лет наблюдения в группе) будет получено ожидаемая (откорректированная) частота возникновения события. Затем можно расчитывать относительный риск путем деления на стандартное значение (так расчитываются стандартизованные показатели смертности SMR, например). 3. Опять-таки лучше логистической регрессией (только там тогда будет не t, а, скорее, хи2 Вальда)

« Предыдущая тема · Медицинская статистика · Следующая тема »

Добавить ответ в эту тему

Открыть тему

Режим отображения: Стандартный · Переключить на: Линейный · Переключить на: Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Форум IP.Board © 2024 IPS, Inc.