Метаанализ, его методы и описание. - Форум врачей-аспирантов

Метаанализ, его методы и описание.

passant Просмотр профиля	4.04.2020 - 00:08 Сообщение #1
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223	Уважаемые коллеги-медики. Поскольку в последнее время наметился некоторый застой на этом интереснейшем форуме и что-бы несколько стимулировать активность участников, осмелюсь предложить вам проблему, которая - как я полагаю - в медицинской среде должна быть более исследована, чем в остальных областях применения статистики. Я имею ввиду практику метаанализа, которая распространена (по крайней мере мне, НЕ специализирующемуся на медицинских задачах, так кажется) в области медстатистики и которая слабо исследована в других предметных областях. Итак, формальная постановка задачи. Необходимо подтвердить H0 гипотезу отсутствия различий между двумя наборами данных. Таких тестов проводится множество. Результаты каждого теста представлены в виде соответствующего p-value. Необходимо поставить "окончательный диагноз", т.е. основываясь на указанном наборе p-value's дать окончательную оценку относительно принятия-отклонения гипотезы. В виде некоторого "обобщенного" p-value, разумеется. Получается такая себе "многомерная проверка гипотез". Задача - как мне видется, возможно я и ошибаюсь - имеет несколько подвариантов. Первый и самый, наверное, простой - все тесты проводятся одним и тем-же методом. Т.е. в области медицины - множество групп пациентов, например - в различных клиниках, каждая считает и предоставляет свои данные, например, по эффективности определенного лекарственного средства. Результаты должны быть формально обобщены. Как? Второй - оценивается два объекта (в медицинских терминах, наверное - групп пациентов) каждая по множеству разных параметров (давление, рост, вес.....). Необходимо проанализировав p-value отличия по каждому из параметров, формально определить, различаются-ли эти группы пациентов. Третий - у нас один параметр, но тестов мы проводим много (ну, самое простое - t-Стюдента, F-Фишера, тесты на различие моментов более высокого порядка, тест на постоянство автокорреляции, тест на постоянство коэффициента Херста - не важно). И решение надо принять по совокупности p-value, полученных на разных тестах.. (Ну, например, отслеживаем изменение этого параметра у пациента во времени). Возможно, есть и другие варианты постановки задачи, но я их пока не вижу. Итак, вопрос. Занимается-ли медстатистика такими задачами и если да (полагаю, что так и есть), то посоветуйте пожалуйста, натолкните на работы, где такие подходы разбираются. Ну и хочу все-таки отметить, что меня интересует не медицинская сторона этих работ, а именно формально-математико-статистическая. Заранее благодарю за любую информацию, и извиняюсь, если непрофессиональностью медицинских примеров задел чьи-то тонкие струны души :: Всем не хворать, а тем кто на карантине - стойко его выдержать. Сообщение отредактировал passant - 4.04.2020 - 00:14

Ответов

100$ Просмотр профиля	5.04.2020 - 00:00 Сообщение #2
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Цитата Итак... необходимо подтвердить H0 гипотезу отсутствия различий между двумя наборами данных. Таких тестов проводится множество. Результаты каждого теста представлены в виде соответствующего p-value. Необходимо поставить "окончательный диагноз", т.е. основываясь на указанном наборе p-value's дать окончательную оценку относительно принятия-отклонения гипотезы. В виде некоторого "обобщенного" p-value, разумеется. Получается такая себе "многомерная проверка гипотез". По этому пункту навскидку сюда Цитата Второй - оценивается два объекта (в медицинских терминах, наверное - групп пациентов) каждая по множеству разных параметров (давление, рост, вес.....). Необходимо проанализировав p-value отличия по каждому из параметров, формально определить, различаются-ли эти группы пациентов. Это- ~~жесть, как она есть~~ методологически неверно: совместное распределение координат признакового описания объекта изучается методами многомерной статистики. Нельзя с каждой координатой возиться, как котенок с клубком. Цитата Третий - у нас один параметр, но тестов мы проводим много (ну, самое простое - t-Стюдента, F-Фишера, тесты на различие моментов более высокого порядка, тест на постоянство автокорреляции, тест на постоянство коэффициента Херста - не важно). И решение надо принять по совокупности p-value, полученных на разных тестах.. (Ну, например, отслеживаем изменение этого параметра у пациента во времени). Если разными тестами проверяется одна и та же гипотеза, то эта процедура по существу представляет собой такой же статистический ("композитный"- термин мой) тест с неизвестными статистическими свойствами. Здесь можно применять два подхода: а) модель "объединения отвержений нулевой гипотезы" б) модель "пересечения отвержений нулевой гипотезы". В обоих случаях надо изучать их статистические свойства: состоятельность, несмещенность, способность удерживать заданный (номинальный) уровень ошибки I и мощность. У меня все. Сообщение отредактировал 100$ - 5.04.2020 - 00:10

passant Просмотр профиля	5.04.2020 - 00:23 Сообщение #3
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223	Цитата(100$ @ 4.04.2020 - 23:00) По этому пункту навскидку сюда Да, спасибо. Я уже понял, что проблема потихоньку перетекает в проблему множественной проверки гипотез, причем особенность моих задач - гипотезы разные, выполняются разными тестами но относятся к поведению (состоянию) одного объекта. Цитата(100$) совместное распределение координат признакового описания объекта изучается методами многомерной статистики. Нельзя с каждой координатой возиться, как котенок с клубком. Да, в моем плане тут попробовать применить методы из области классификации и кластерного анализа. Разумеется - многомерных. Цитата(100$) В обоих случаях надо изучать их статистические свойства: состоятельность, несмещенность, способность удерживать заданный (номинальный) уровень ошибки I и мощность. Спасибо, как раз накопал несколько несколько забугорных источников. Но там расматриваются в основном случаи однотипных гипотез. Буду копать дальше. Сообщение отредактировал passant - 5.04.2020 - 00:28

100$ Просмотр профиля	5.04.2020 - 00:44 Сообщение #4
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Цитата(passant @ 5.04.2020 - 00:23) ... но относятся к поведению (состоянию) одного объекта. Так, может, там не гипотезы надо тестировать, а подгонять модель в пространстве состояний? Впрочем, без конкретики сложно сказать больше, чем уже сказано...

passant Просмотр профиля	5.04.2020 - 10:50 Сообщение #5
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223	Цитата(100$ @ 4.04.2020 - 23:44) Так, может, там не гипотезы надо тестировать, а подгонять модель в пространстве состояний? Впрочем, без конкретики сложно сказать больше, чем уже сказано... Да вроде нет :-). Представьте - на медицинском примере - у вас один пациент, о котором вы получаете множество разных параметров - температура, давление, сахар... бла-бла-бла. Каждый параметр - это временной ряд. По каждому временному ряду В КАЖДЫЙ ВРЕМЕННОЙ ПЕРИОД вы можете снять некоторую статистику - от элементарных средних, дисперсии и пр, до параметров моделей ARIMA, Х-В, и т.д. Некоторые параметры могут быть ранговыми, а некоторые - даже номинальными - но и для них можно снять некоторую (свою) статистику. Итого - у нас в наличии очень многомерное пространство, в котором состояние объекта за данный период времени - это точка, а координаты ее - это значение измеренных статистик. Теперь наступил следующий период времени, мы вновь насчитали статистики, т.е. получили вторую точку в том-же пространстве.. Затем можно сразу пытаться понять принадлежат-ли эти две точки одному кластеру. Но тут стоит вопрос - как увязать совершенно разнотипные параметры, как обосновать это различие. Как я писал - можно пытаться нормировать все параметры. Традиционно, но семантически не совсем прозрачно. Можно в качестве меры близости использовать меры от Евклида до косинуса, но это детали. Другой путь - рассматривать не сами параметры, а их изменения, причем не абсолютные, а как p-value тестов на различие этих значений статистики в последовательные периоды времени. Теперь мы перешли в другое пространство, где каждая точка имеет координаты в пределах от 0 до 1, причем это семантически ясные значения, и теперь точка этого пространства - это показательизменения состояния нашего пациента между интервалами наблюдения. Вот такая цепочка рассуждения приводит к тому, что нам надо сказать - изменение состояния, выраженное в координатах пространства значений p-values значимо или нет. Т.е. мы можем говорить, что состояние пациента изменилось и с какой значимостью, или нет. Еще более обще - наблюдается-ли некоторая аномалия в состоянии "пациента". (Аномалии могут быть выражены не только изменения базовых статистик, но и быть контекстно-зависимыми, групповыми и т.д. - но это отдельная тема, которую я тут пока даже не затрагиваю). Кроме того, как я указал, мой "пациент" может вести себя настолько плохо, что может даже пытаться замаскировать некоторые параметры так, что-бы затруднить обнаружение его изменения - но это тоже другая тема, которую я я пока выношу за скобки. Вот как-то примерно так.

Сообщений в этой теме

passant Метаанализ, его методы и описание. 4.04.2020 - 00:08

nokh По объединени р-значений. Я качал когда-то пару-тр... 4.04.2020 - 06:33

p2004r Цитата(passant @ 4.04.2020 - 00:08) ... 4.04.2020 - 08:37

Med_Elena "Итак, формальная постановка задачи". Ур... 4.04.2020 - 15:57

passant Цитата(Med_Elena @ 4.04.2020 - 14:57... 4.04.2020 - 21:25

100$ ЦитатаИтак... необходимо подтвердить H0 гипотезу о... 5.04.2020 - 00:00

passant Цитата(100$ @ 4.04.2020 - 23:00... 5.04.2020 - 00:23

100$ Цитата(passant @ 5.04.2020 - 00:23) ... 5.04.2020 - 00:44

passant Цитата(100$ @ 4.04.2020 - 23:44... 5.04.2020 - 10:50

100$ Т.е. у нас есть некий многомерный временной ряд (к... 5.04.2020 - 14:24

passant Цитата(100$ @ 5.04.2020 - 13:24... 5.04.2020 - 17:04

100$ Цитата(passant @ 5.04.2020 - 17:04) ... 5.04.2020 - 17:25

passant Цитата(100$ @ 5.04.2020 - 16:25... 5.04.2020 - 18:02

Б_Т_Г Цитата(passant @ 5.04.2020 - 18:02) ... 7.04.2020 - 17:36

passant Цитата(Б_Т_Г @ 7.04.2020 - 16:36) pa... 7.04.2020 - 18:02

Б_Т_Г Цитата(passant @ 7.04.2020 - 18:02) ... 7.04.2020 - 20:18

passant Спасибо, конечно. Если вы про книгу Sumeet Dua и ... 7.04.2020 - 22:28

passant ..... 7.04.2020 - 22:30

« Предыдущая тема · Медицинская статистика · Следующая тема »