Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> Сравнение частоты встречаемости
Игорь
сообщение 27.12.2007 - 07:06
Сообщение #16





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Проверять правильность одной программы с помощью другой программы...

Программа Хана p = 0,0000775...

Совпадает.

Теперь несколько методов сами посчитаем

Хи-квадрат p = 0,0000547...
Отношение правдоподобия p = 0,0000355...
Кресси-Рид (2/3) p = 0,0000496...

Таблица вот такая была:
90 70
10 35

Проблема в том, что автор первого поста, видимо, поменял исходные данные (поставил проценты и поменял цифры) в период между нашим и Вашим расчетами. Естественно, разные данные - разные результаты.

Уважаемый PLE, предыдущие сообщения, конечно, редактировать возможно - форум это позволяет. Но не нужно вносить существенные изменения, искажающие мнения (тем более результаты расчетов, любезно сделанные для Вас) собеседников, высказанные позднее. Это совершенно незаслуженно ставит их в неудобное положение, заставляет оправдываться, наносит ущерб профессиональной репутации. Например, как сейчас.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 27.12.2007 - 15:06
Сообщение #17





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Игорь, первый постер висит и входные данные приведены и вы считаете верно, что 30% от 105 - это 35 больных, а Плав посчитал, что это 32. Но вы оба сражаетесь за точность оценки и приводите их до 7 знака. При этом вы оба согласны, что сопряженность признаков доказана. Мне не понятно, почему плав считает, что нельзя дать смысловую оценку этому факту. Известно, что у спортсменов часто имеется ГЛЖ, но нет АГ. Сопряженность ГЛЖ с АГ, также необходимо оценить, и представить количественную оценку обоим факторам риска, как впрочем и другим, но это уже другая задачка. А их независимый вклад можно оценить с помощью логистической регрессии. А на сегодня мы имеем, то что имеем, а именно для ожирения:
Odds Ratio = 2.7; (Wald 95% CI: 1.3<O.R.<5.9). Т.е. вполне обоснованный вывод, что наличие ожирения в 2,7 раза повышает шанс развития ГЛЖ (при однофакторной оценке). И такой вывод вполне в духе ведущих медицинских журналов, в том числе Lancet.

35 70
10 90
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 27.12.2007 - 21:40
Сообщение #18





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Насчет того, что 30% от 105 - это 35 я как-то не понял. 35/105=0,3333. А 30% от 105 - это 31,5 (округляем до 32)... Но на самом деле вопрос не в том, какая там цифра идет после большого количества нулей, а в том, что результат сильно не меняется при использовании всех методов. Проблема в другом. Меня смущает использование методов, которые считаются "более" хорошими просто потому, что кто-то когда-то так написал в ущерб тем методам, которые используются уже давно. С моей точки зрения это обоснованно тогда, когда новый метод дает дополнительную информацию или позволяет избавиться от одних допущений не внося другие. Как же в этом случае выглядит метод Фишера?
Давайте попробуем сформулировать нулевую гипотезу. Итак, по методу Фишера мы рассчитываем вероятность получения таблицы такой же или еще более отличающейся от "нулевой" (созданной на основе краевых частот) в случае взятия выборок из одной и той же популяции. Всякий, кто знаком с ручным расчетом по методу Фишера знает, что мы берем и фиксируем ВСЕ краевые частоты и затем рассчитываем количество таблиц, которое могло бы появиться с данными значениями частот в таблице. Повторюсь еще раз, мы фиксируем все краевые частоты, т.е. мы считаем, что в выборке известна не только численность групп, но и фиксирована распространенность изучемого фактора риска. В приводимом примере это означает, что мы считаем, что во всех взятых выборках не только будет 105 и 100 человек (что мы делаем самостоятельно, произвольно деля выборку в 205 человек на такие части), но и во всех выборках распространенность ГЛЖ будет 20,5%. Каждый, кто хоть раз пытался играть со случайными выборками понимает, что это очень сомнительное допущение, но именно оно лежит в основе расчетов по методу Фишера и его производным.
В противоположность этому хи2 не делает таких допущений о структуре таблицы (он вообще никаких допущений не делает, поскольку хи2 это всего лишь способ суммарно описать таблицу, это - статистика). Соответственно, он легко расчитывается при разных допущениях нулевой гипотезы (например, что в общей популяции распространенность ГЛЖ составляет 10% или, наоборот, 30%). Другое дело, что стандратная тактика использования критерия хи2 исходит из сравнения полученного значения с табличными, рассчитанными при определенных допущениях, но никто не обязывает действовать таким образом. Есть, в конце концов, bootstrap и можно спокойно сделать распределение хи2 для конкретного эксперимента, благо вычислительные средства позволяют. На самом деле, вместо хи2 можно использовать, например, OR и сделать bootstrap распределение для OR и рассчитать все те же вероятности нулевой гипотезы.
Я отнюдь не призываю использовать bootstrap вместо критерия Фишера, однако хочу лишь указать, что все методы имеют свои проблемы (и bootstrap тоже) и всегда найдется кто-то, кто может раскритиковать использованную методологию статистической обработки с точки зрения обоснованности использованных допущений - без допущений моделей не существует. Соответственно, лучше обращать больше внимания на содеражтельную часть и адекватность анализа именно с содержательной точки зрения.
И вот тут мы подходим к моему последнему замечанию. Итак, о чем идет речь в задачке? Спорстсмены сравниваются с лицами не занимавшимися спортом (и имеющими ожирение)? Тогда задача и подавно бессмысленна - классика сравнения яблок с апельсинами. Если убрать очень специфическую группу спорстменов, наиболее частая причина ГЛЖ - АГ, у лиц с ожирением чаще встречается АГ, игнорирование АГ как третьей переменной является, на сегодняшнем уровне знаний ошибкой и никакой Lancet подобную зависимость двух факторов, которая игнорирует очевидную третью переменную не признает как существующую. Статистическая корреляция не есть причинно-следственная связь. И вот организация исследования в смысле адекватного учета всех факторов куда важнее, чем использовался хи2, критерий Фишера или Кохрана-Мантеля-Ханзеля, ибо статистические методы дадут сходные результаты, а неадекватный дизайн сводит на нет все исследование.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 29.12.2007 - 01:34
Сообщение #19





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



PLE обратился с конкретным вопросом о влиянии ожирения на ГЛЖ. Причем обратился в статистическую ветку форума, поскольку решает студенческую задачку по статистике, в чем он и сам сознался. В другой ветке форума с привлечением кардиологов, эндокринологов, спортивных врачей, а также и других, кто в этой предметной области специалист, можно было бы обсудить и дизайн исследования и его результаты. Тогда можно будет выяснить мнение коллег, какие факторы и каким образом влияют на развитие ГЛЖ. Ожирение, само по себе, даже без АГ, является доказанным фактором риска многих патологий, возможно и в этой абстрактной задачке, статистический вывод клинически справедлив.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 29.12.2007 - 13:35
Сообщение #20





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



На самом деле дизайн исследования имеет непосредственное отношение к обработке результатов исследования. Например, если взять работы, посвященные статистическим основам критерия Фишера, то там в качестве предположения стоит, что производится анализ рандомизированного контроллируемого проспективного исследования (не такими словами, но смысл именно такой - случайная выборка из популяции, подвергается часть подвергается воздействию фактора, а часть - нет). Соответственно, базируясь на допущениях, которые использованы при выводе критерия Фишера (и всех остальных унивариантных критериев для таблиц сопряженности) можно сказать, что выбранная PLE методка для анализа является не адекватной, поскольку она не предполагает наличие рандомизированного контролируемого эксперимента.
Почему наличие РКИ важно, я и проиллюстрировал в примере про АГ. Важно не то, оказала ли АГ влияние на полученные результаты или нет. А то, что она МОГЛА оказать воздействие. Исключить этого нельзя, соответственно, систематический фактор вариабельности не исключен и оценка результатов (статистическая) не возможна. Строго говоря, мч имеем следующую картину, зависимая переиенная (ГЛЖ) может быть записана так:
y=x+z+\epsilon, где х - влияние ожирения, z - влияние АГ (возможное).
Если бы использовалось РКИ, то распределение z между подгруппами было бы случайным и его влияние в целом нивелировалось бы. Однако в данном случае неизвестно, (1) одинаково ли количество лиц с АГ в подгруппах и (2) влияет ли АГ на наличие ГЛЖ. Ответ на вопрос 2 по данным литературы, скорее всего, да. Соответственно, модель y=x+\epsilon для данного случая статистически неприемлима.
И не нужны здесь специалисты по спортивной медицине, эндокринологи и кардиологи. Отсутствие учета систематического фактора в модели нерандомизированного исследования - это статистическая ошибка, а не клиническая. Это неправильный выбор статистической модели, о чем, собственно, я и писал.
И именно студенты должны понимать ограничения методов и понимать, что получение р<0,05 не означает наличия причинно-следственных связей (доказательств) между фактором и результатом.
И в заключение - как объяснение занудства - короткий анекдот. Три человека - специалист по общественному здравоохранению, эпидемиолог и биостатистик летят на самолете на конференцию. Из окна хороший вид на землю и они замечают внизу большое пасущееся стадо черных овец. Они пролетают над графством Эссекс.
Организатор здравоохранения: "Как много в графстве Эссекс черных овец"
Эпидемиолог: "На юго-востоке графства Эссекс пасется большое стадо черных овец"
Биостатистик: "На юго-востоке графства Эссекс пасется большое стадо овец, черных сверху"
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 29.12.2007 - 18:16
Сообщение #21





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Не могу согласиться, что эта задачка из «рандомизированного контроллируемого проспективного исследования», как вы пытаетесь нам объяснить. Это скорее всего обсервационное исследование, которое может быть либо когортное (вы просто наблюдаете всех старшеклассников одного города и рандомизировать никого никуда не нужно и цель исследование нам не известна), либо исследование типа case- control, что тоже относится к когортному, а не к рандомизированному. Сase ? ГЛЖ, тогда изучаются факторы с ним связанные. И уместно OR. Ожирение связано с ГЛЖ, но не обязательно напрямую. Возможно, в рамках того же когортного исследования стоит задача проанализировать взаимодействие нескольких факторов, т.е. и ожирения и АГ (модификация эффекта).
Известно, что мужчины чаще болеют ИБС, чем женщины. Однако, это может быть связано не с полом, а с тем, что мужчины чаще курят и больше едят баранину. Но при этом баранину рассматривают почему то все же как confounding factor.
О доказательстве причинно-следственной связи хорошо пишут Флетчеры и Вагнер
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 4.01.2008 - 17:31
Сообщение #22





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Неплохо бы внимательно читать пост, прежде, чем обвинять других в непонимании приведенных примеров. Цитирую самого себя:

"Соответственно, базируясь на допущениях, которые использованы при выводе критерия Фишера (и всех остальных унивариантных критериев для таблиц сопряженности) можно сказать, что выбранная PLE методка для анализа является не адекватной, поскольку она не предполагает наличие рандомизированного контролируемого эксперимента"

Именно потому, что та задачка была не РКИ, использование критерия Фишера является статистической ошибкой, ибо критерий разрабатывался исходя из предположения об использовании РКИ (точнее, вообще эксперимента, а не квазиэкспериментального дизайна, к которому относятся когортные исследования и исследования по типу случай-контроль).
И так, на всякий случай, исследования по типу случай-контроль никогда не относились к когортным исследованиям, ибо иной принцип отбора (при исследованиях по типу случай-контроль случаи отбираются из популяции больных, а контроли - из популяции здоровых, соответственно, оценить относительный риск - увеличения риска наступления исхода при наличии фактора - в подобных исследованиях не представляется возможным). В когортных исследованиях, группы отбираются по принципу воздействия фактора и, соответственно, оценить относительный риск можно. Кстати, обследование всех старшеклассников города - это не когортное исследование, а скриниговое, чаще всего превращающееся в исследование по типу случай-контроль. А если Вы наблюдаете за ними, то тогда Вам должна быть известна цель исследования, иначе когорты отбираются не те и не для того.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 5.01.2008 - 00:24
Сообщение #23





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Давайте вернемся к нашим баранам, вернее к черным сверху овцам и не будем гадать на кофейной гуще, какой тип исследования предполагал PLE. Если case-contr исследование и ГЛЖ ? case, то ожирение - фактор риска и его оценка по канонам EBM ? расчет отношения шансов (OR) и соответствующего ДИ. Наиболее известное исследование такого типа - исследование факторов риска синдрома внезапной детской смертности у младенцев. Анализировали около 100 факторов риска, один фактор признан защитным - использование пустышки OR<1.
Если оценивают риски в когортном исследовании, то это делают путем расчета относительного риска или отношения рисков (RR), которое показывает во сколько раз выше заболеваемость у лиц подвершихся фактору риска, чем у не подвергшихся. Пример - курение и сертность от рака легкого.
Напомню, что PLE методику анализа не выбирал, а спросил на форуме, достоверны ли различия чатосты развития ГЛЖ у ожирелых и нормальных, а вы ему про "квазиэкспериментальный дизайн"....
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 5.01.2008 - 11:23
Сообщение #24





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Вопрос, напомню, был какой критерий лучше использовать для анализа проведенного исследования (посмотрите первый пост). Соответственно, используемый критерий должен соответствовать выбранному дизайну, не случайно, например, в протоколах клинических испытаний (да и во всех протоколах исследований) методы статистической обработки прописываются ДО начала исследования, исходя из его дизайна. Если выбран квазиэкспериментальный дизайн типа СК или когортных исследований, то - в сравнении с рандомизированным испытанием - в статистической модели присутствуют не только случайные факторы, но и систематические факторы. Половина всех текстов по ЕВМ (да и учебников эпидемиологии, если уж на то пошло), посвящена описанию систематических ошибок (bias), которые возникают при использовании квазиэкспериментальных дизайнов.
Соответственно, статистически правильным подходом в случае выбора данного дизайна является построение многофакторной модели с учетом известных факторов, которые могли повлиять на исход. Повторюсь, использование унивариантных критериев (любых), в данном случае является ошибкой, ибо они исходят из предположения о рандомизированном характере эксперимента.
Кстати Ваш пример с SIDS очень хорошо иллюстрирует этот подход - анализировались не один фактор, а много, и был выбран тот, который независимо повышал риск смерти (плюс еще была коррекция по социально-экономическим показателям, возрасту матери и т.д.). Если использован дизайн случай-контроль - надо строить модель (чаще всего логистическую), правда всех проблем это не решит (остается, например, ошибка селективной смертности, которая вообще может превратить протективный фактор в фактор риска), однако учтет очевидные. Связь между ГЛЖ и АГ является хорошо задокументированной, между АГ и ожирением так же. Соответственно, игнорирование этой третьей переменной в исследовании является примером плохой организации исследования и, честно говоря, столь горячее отстаивание права на проведение очевидно плохого исследования у меня вызывает удивление. Тем более, что измерение АД в этих группах не является сложным, не требует дорогостоящего или инвазивного вмешательства, т.е. не может быть оправдано никаким образом.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 5.01.2008 - 13:46
Сообщение #25





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Полностью согласна. Дизайн исследования определяет методы анализа. Но чаще всего именно руководители (старшие товарищи) не обременяют себя подобными знаниями и в результате, врач-аспирант собирает материал и считает, что чем больше собрал, тем лучше будет диссертация. А при анализе начинают искать что-нибудь, чтобы достоверно различалось (р<0,05). Ведь мы рассматривали студенческую задачку, в которой по входным данным, нельзя сделать однозначный вывод. Ее ведь кто-то именно так и сформулировал.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему