Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Метаанализ, его методы и описание.
passant
сообщение 4.04.2020 - 00:08
Сообщение #1





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Уважаемые коллеги-медики.

Поскольку в последнее время наметился некоторый застой на этом интереснейшем форуме rolleyes.gif и что-бы несколько стимулировать активность участников, осмелюсь предложить вам проблему, которая - как я полагаю - в медицинской среде должна быть более исследована, чем в остальных областях применения статистики. Я имею ввиду практику метаанализа, которая распространена (по крайней мере мне, НЕ специализирующемуся на медицинских задачах, так кажется) в области медстатистики и которая слабо исследована в других предметных областях.

Итак, формальная постановка задачи. Необходимо подтвердить H0 гипотезу отсутствия различий между двумя наборами данных. Таких тестов проводится множество. Результаты каждого теста представлены в виде соответствующего p-value. Необходимо поставить "окончательный диагноз", т.е. основываясь на указанном наборе p-value's дать окончательную оценку относительно принятия-отклонения гипотезы. В виде некоторого "обобщенного" p-value, разумеется. Получается такая себе "многомерная проверка гипотез".

Задача - как мне видется, возможно я и ошибаюсь - имеет несколько подвариантов.

Первый и самый, наверное, простой - все тесты проводятся одним и тем-же методом. Т.е. в области медицины - множество групп пациентов, например - в различных клиниках, каждая считает и предоставляет свои данные, например, по эффективности определенного лекарственного средства. Результаты должны быть формально обобщены. Как?

Второй - оценивается два объекта (в медицинских терминах, наверное - групп пациентов) каждая по множеству разных параметров (давление, рост, вес.....). Необходимо проанализировав p-value отличия по каждому из параметров, формально определить, различаются-ли эти группы пациентов.

Третий - у нас один параметр, но тестов мы проводим много (ну, самое простое - t-Стюдента, F-Фишера, тесты на различие моментов более высокого порядка, тест на постоянство автокорреляции, тест на постоянство коэффициента Херста - не важно). И решение надо принять по совокупности p-value, полученных на разных тестах.. (Ну, например, отслеживаем изменение этого параметра у пациента во времени).

Возможно, есть и другие варианты постановки задачи, но я их пока не вижу.

Итак, вопрос. Занимается-ли медстатистика такими задачами и если да (полагаю, что так и есть), то посоветуйте пожалуйста, натолкните на работы, где такие подходы разбираются. Ну и хочу все-таки отметить, что меня интересует не медицинская сторона этих работ, а именно формально-математико-статистическая.

Заранее благодарю за любую информацию, и извиняюсь, если непрофессиональностью медицинских примеров задел чьи-то тонкие струны души :hi.gif:
Всем не хворать, а тем кто на карантине - стойко его выдержать. smile.gif

Сообщение отредактировал passant - 4.04.2020 - 00:14
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
100$
сообщение 5.04.2020 - 00:00
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата
Итак... необходимо подтвердить H0 гипотезу отсутствия различий между двумя наборами данных. Таких тестов проводится множество. Результаты каждого теста представлены в виде соответствующего p-value. Необходимо поставить "окончательный диагноз", т.е. основываясь на указанном наборе p-value's дать окончательную оценку относительно принятия-отклонения гипотезы. В виде некоторого "обобщенного" p-value, разумеется. Получается такая себе "многомерная проверка гипотез".


По этому пункту навскидку сюда


Цитата
Второй - оценивается два объекта (в медицинских терминах, наверное - групп пациентов) каждая по множеству разных параметров (давление, рост, вес.....). Необходимо проанализировав p-value отличия по каждому из параметров, формально определить, различаются-ли эти группы пациентов.


Это- жесть, как она есть методологически неверно: совместное распределение координат признакового описания объекта изучается методами многомерной статистики. Нельзя с каждой координатой возиться, как котенок с клубком.

Цитата
Третий - у нас один параметр, но тестов мы проводим много (ну, самое простое - t-Стюдента, F-Фишера, тесты на различие моментов более высокого порядка, тест на постоянство автокорреляции, тест на постоянство коэффициента Херста - не важно). И решение надо принять по совокупности p-value, полученных на разных тестах.. (Ну, например, отслеживаем изменение этого параметра у пациента во времени).


Если разными тестами проверяется одна и та же гипотеза, то эта процедура по существу представляет собой такой же статистический ("композитный"- термин мой) тест с неизвестными статистическими свойствами.
Здесь можно применять два подхода:
а) модель "объединения отвержений нулевой гипотезы"
б) модель "пересечения отвержений нулевой гипотезы".
В обоих случаях надо изучать их статистические свойства: состоятельность, несмещенность, способность удерживать заданный (номинальный) уровень ошибки I и мощность.

У меня все.

Сообщение отредактировал 100$ - 5.04.2020 - 00:10
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 5.04.2020 - 00:23
Сообщение #3





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(100$ @ 4.04.2020 - 23:00) *
По этому пункту навскидку сюда

Да, спасибо. Я уже понял, что проблема потихоньку перетекает в проблему множественной проверки гипотез, причем особенность моих задач - гипотезы разные, выполняются разными тестами но относятся к поведению (состоянию) одного объекта.

Цитата(100$)
совместное распределение координат признакового описания объекта изучается методами многомерной статистики. Нельзя с каждой координатой возиться, как котенок с клубком.
Да, в моем плане тут попробовать применить методы из области классификации и кластерного анализа. Разумеется - многомерных.

Цитата(100$)
В обоих случаях надо изучать их статистические свойства: состоятельность, несмещенность, способность удерживать заданный (номинальный) уровень ошибки I и мощность.
Спасибо, как раз накопал несколько несколько забугорных источников. Но там расматриваются в основном случаи однотипных гипотез. Буду копать дальше.

Сообщение отредактировал passant - 5.04.2020 - 00:28
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 5.04.2020 - 00:44
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(passant @ 5.04.2020 - 00:23) *
... но относятся к поведению (состоянию) одного объекта.


Так, может, там не гипотезы надо тестировать, а подгонять модель в пространстве состояний?
Впрочем, без конкретики сложно сказать больше, чем уже сказано...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 5.04.2020 - 10:50
Сообщение #5





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(100$ @ 4.04.2020 - 23:44) *
Так, может, там не гипотезы надо тестировать, а подгонять модель в пространстве состояний?
Впрочем, без конкретики сложно сказать больше, чем уже сказано...

Да вроде нет :-).
Представьте - на медицинском примере - у вас один пациент, о котором вы получаете множество разных параметров - температура, давление, сахар... бла-бла-бла.
Каждый параметр - это временной ряд. По каждому временному ряду В КАЖДЫЙ ВРЕМЕННОЙ ПЕРИОД вы можете снять некоторую статистику - от элементарных средних, дисперсии и пр, до параметров моделей ARIMA, Х-В, и т.д. Некоторые параметры могут быть ранговыми, а некоторые - даже номинальными - но и для них можно снять некоторую (свою) статистику.
Итого - у нас в наличии очень многомерное пространство, в котором состояние объекта за данный период времени - это точка, а координаты ее - это значение измеренных статистик.
Теперь наступил следующий период времени, мы вновь насчитали статистики, т.е. получили вторую точку в том-же пространстве..
Затем можно сразу пытаться понять принадлежат-ли эти две точки одному кластеру. Но тут стоит вопрос - как увязать совершенно разнотипные параметры, как обосновать это различие.
Как я писал - можно пытаться нормировать все параметры. Традиционно, но семантически не совсем прозрачно. Можно в качестве меры близости использовать меры от Евклида до косинуса, но это детали.
Другой путь - рассматривать не сами параметры, а их изменения, причем не абсолютные, а как p-value тестов на различие этих значений статистики в последовательные периоды времени.
Теперь мы перешли в другое пространство, где каждая точка имеет координаты в пределах от 0 до 1, причем это семантически ясные значения, и теперь точка этого пространства - это показательизменения состояния нашего пациента между интервалами наблюдения.
Вот такая цепочка рассуждения приводит к тому, что нам надо сказать - изменение состояния, выраженное в координатах пространства значений p-values значимо или нет.
Т.е. мы можем говорить, что состояние пациента изменилось и с какой значимостью, или нет.
Еще более обще - наблюдается-ли некоторая аномалия в состоянии "пациента". (Аномалии могут быть выражены не только изменения базовых статистик, но и быть контекстно-зависимыми, групповыми и т.д. - но это отдельная тема, которую я тут пока даже не затрагиваю).
Кроме того, как я указал, мой "пациент" может вести себя настолько плохо, что может даже пытаться замаскировать некоторые параметры так, что-бы затруднить обнаружение его изменения - но это тоже другая тема, которую я я пока выношу за скобки.
Вот как-то примерно так.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- passant   Метаанализ, его методы и описание.   4.04.2020 - 00:08
- - nokh   По объединени р-значений. Я качал когда-то пару-тр...   4.04.2020 - 06:33
- - p2004r   Цитата(passant @ 4.04.2020 - 00:08) ...   4.04.2020 - 08:37
- - Med_Elena   "Итак, формальная постановка задачи". Ур...   4.04.2020 - 15:57
|- - passant   Цитата(Med_Elena @ 4.04.2020 - 14:57...   4.04.2020 - 21:25
- - 100$   ЦитатаИтак... необходимо подтвердить H0 гипотезу о...   5.04.2020 - 00:00
|- - passant   Цитата(100$ @ 4.04.2020 - 23:00...   5.04.2020 - 00:23
|- - 100$   Цитата(passant @ 5.04.2020 - 00:23) ...   5.04.2020 - 00:44
|- - passant   Цитата(100$ @ 4.04.2020 - 23:44...   5.04.2020 - 10:50
- - 100$   Т.е. у нас есть некий многомерный временной ряд (к...   5.04.2020 - 14:24
- - passant   Цитата(100$ @ 5.04.2020 - 13:24...   5.04.2020 - 17:04
- - 100$   Цитата(passant @ 5.04.2020 - 17:04) ...   5.04.2020 - 17:25
- - passant   Цитата(100$ @ 5.04.2020 - 16:25...   5.04.2020 - 18:02
- - Б_Т_Г   Цитата(passant @ 5.04.2020 - 18:02) ...   7.04.2020 - 17:36
- - passant   Цитата(Б_Т_Г @ 7.04.2020 - 16:36) pa...   7.04.2020 - 18:02
- - Б_Т_Г   Цитата(passant @ 7.04.2020 - 18:02) ...   7.04.2020 - 20:18
- - passant   Спасибо, конечно. Если вы про книгу Sumeet Dua и ...   7.04.2020 - 22:28
- - passant   .....   7.04.2020 - 22:30


Добавить ответ в эту темуОткрыть тему