Здравствуйте, гость ( Вход | Регистрация )
4.04.2020 - 00:08
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Уважаемые коллеги-медики.
Поскольку в последнее время наметился некоторый застой на этом интереснейшем форуме Итак, формальная постановка задачи. Необходимо подтвердить H0 гипотезу отсутствия различий между двумя наборами данных. Таких тестов проводится множество. Результаты каждого теста представлены в виде соответствующего p-value. Необходимо поставить "окончательный диагноз", т.е. основываясь на указанном наборе p-value's дать окончательную оценку относительно принятия-отклонения гипотезы. В виде некоторого "обобщенного" p-value, разумеется. Получается такая себе "многомерная проверка гипотез". Задача - как мне видется, возможно я и ошибаюсь - имеет несколько подвариантов. Первый и самый, наверное, простой - все тесты проводятся одним и тем-же методом. Т.е. в области медицины - множество групп пациентов, например - в различных клиниках, каждая считает и предоставляет свои данные, например, по эффективности определенного лекарственного средства. Результаты должны быть формально обобщены. Как? Второй - оценивается два объекта (в медицинских терминах, наверное - групп пациентов) каждая по множеству разных параметров (давление, рост, вес.....). Необходимо проанализировав p-value отличия по каждому из параметров, формально определить, различаются-ли эти группы пациентов. Третий - у нас один параметр, но тестов мы проводим много (ну, самое простое - t-Стюдента, F-Фишера, тесты на различие моментов более высокого порядка, тест на постоянство автокорреляции, тест на постоянство коэффициента Херста - не важно). И решение надо принять по совокупности p-value, полученных на разных тестах.. (Ну, например, отслеживаем изменение этого параметра у пациента во времени). Возможно, есть и другие варианты постановки задачи, но я их пока не вижу. Итак, вопрос. Занимается-ли медстатистика такими задачами и если да (полагаю, что так и есть), то посоветуйте пожалуйста, натолкните на работы, где такие подходы разбираются. Ну и хочу все-таки отметить, что меня интересует не медицинская сторона этих работ, а именно формально-математико-статистическая. Заранее благодарю за любую информацию, и извиняюсь, если непрофессиональностью медицинских примеров задел чьи-то тонкие струны души : Всем не хворать, а тем кто на карантине - стойко его выдержать. Сообщение отредактировал passant - 4.04.2020 - 00:14 |
|
|
![]() |
![]() |
![]() |
5.04.2020 - 00:00
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Цитата Итак... необходимо подтвердить H0 гипотезу отсутствия различий между двумя наборами данных. Таких тестов проводится множество. Результаты каждого теста представлены в виде соответствующего p-value. Необходимо поставить "окончательный диагноз", т.е. основываясь на указанном наборе p-value's дать окончательную оценку относительно принятия-отклонения гипотезы. В виде некоторого "обобщенного" p-value, разумеется. Получается такая себе "многомерная проверка гипотез". По этому пункту навскидку сюда Цитата Второй - оценивается два объекта (в медицинских терминах, наверное - групп пациентов) каждая по множеству разных параметров (давление, рост, вес.....). Необходимо проанализировав p-value отличия по каждому из параметров, формально определить, различаются-ли эти группы пациентов. Это- Цитата Третий - у нас один параметр, но тестов мы проводим много (ну, самое простое - t-Стюдента, F-Фишера, тесты на различие моментов более высокого порядка, тест на постоянство автокорреляции, тест на постоянство коэффициента Херста - не важно). И решение надо принять по совокупности p-value, полученных на разных тестах.. (Ну, например, отслеживаем изменение этого параметра у пациента во времени). Если разными тестами проверяется одна и та же гипотеза, то эта процедура по существу представляет собой такой же статистический ("композитный"- термин мой) тест с неизвестными статистическими свойствами. Здесь можно применять два подхода: а) модель "объединения отвержений нулевой гипотезы" б) модель "пересечения отвержений нулевой гипотезы". В обоих случаях надо изучать их статистические свойства: состоятельность, несмещенность, способность удерживать заданный (номинальный) уровень ошибки I и мощность. У меня все. Сообщение отредактировал 100$ - 5.04.2020 - 00:10 |
|
|
![]() |
![]() |
5.04.2020 - 00:23
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
По этому пункту навскидку сюда Да, спасибо. Я уже понял, что проблема потихоньку перетекает в проблему множественной проверки гипотез, причем особенность моих задач - гипотезы разные, выполняются разными тестами но относятся к поведению (состоянию) одного объекта. Цитата(100$) совместное распределение координат признакового описания объекта изучается методами многомерной статистики. Нельзя с каждой координатой возиться, как котенок с клубком. Да, в моем плане тут попробовать применить методы из области классификации и кластерного анализа. Разумеется - многомерных.Цитата(100$) В обоих случаях надо изучать их статистические свойства: состоятельность, несмещенность, способность удерживать заданный (номинальный) уровень ошибки I и мощность. Спасибо, как раз накопал несколько несколько забугорных источников. Но там расматриваются в основном случаи однотипных гипотез. Буду копать дальше.
Сообщение отредактировал passant - 5.04.2020 - 00:28 |
|
|
![]() |
![]() |
5.04.2020 - 00:44
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|
|
![]() |
![]() |
5.04.2020 - 10:50
Сообщение
#5
|
|
|
Группа: Пользователи Сообщений: 231 Регистрация: 27.04.2016 Пользователь №: 28223 |
Так, может, там не гипотезы надо тестировать, а подгонять модель в пространстве состояний? Впрочем, без конкретики сложно сказать больше, чем уже сказано... Да вроде нет :-). Представьте - на медицинском примере - у вас один пациент, о котором вы получаете множество разных параметров - температура, давление, сахар... бла-бла-бла. Каждый параметр - это временной ряд. По каждому временному ряду В КАЖДЫЙ ВРЕМЕННОЙ ПЕРИОД вы можете снять некоторую статистику - от элементарных средних, дисперсии и пр, до параметров моделей ARIMA, Х-В, и т.д. Некоторые параметры могут быть ранговыми, а некоторые - даже номинальными - но и для них можно снять некоторую (свою) статистику. Итого - у нас в наличии очень многомерное пространство, в котором состояние объекта за данный период времени - это точка, а координаты ее - это значение измеренных статистик. Теперь наступил следующий период времени, мы вновь насчитали статистики, т.е. получили вторую точку в том-же пространстве.. Затем можно сразу пытаться понять принадлежат-ли эти две точки одному кластеру. Но тут стоит вопрос - как увязать совершенно разнотипные параметры, как обосновать это различие. Как я писал - можно пытаться нормировать все параметры. Традиционно, но семантически не совсем прозрачно. Можно в качестве меры близости использовать меры от Евклида до косинуса, но это детали. Другой путь - рассматривать не сами параметры, а их изменения, причем не абсолютные, а как p-value тестов на различие этих значений статистики в последовательные периоды времени. Теперь мы перешли в другое пространство, где каждая точка имеет координаты в пределах от 0 до 1, причем это семантически ясные значения, и теперь точка этого пространства - это показательизменения состояния нашего пациента между интервалами наблюдения. Вот такая цепочка рассуждения приводит к тому, что нам надо сказать - изменение состояния, выраженное в координатах пространства значений p-values значимо или нет. Т.е. мы можем говорить, что состояние пациента изменилось и с какой значимостью, или нет. Еще более обще - наблюдается-ли некоторая аномалия в состоянии "пациента". (Аномалии могут быть выражены не только изменения базовых статистик, но и быть контекстно-зависимыми, групповыми и т.д. - но это отдельная тема, которую я тут пока даже не затрагиваю). Кроме того, как я указал, мой "пациент" может вести себя настолько плохо, что может даже пытаться замаскировать некоторые параметры так, что-бы затруднить обнаружение его изменения - но это тоже другая тема, которую я я пока выношу за скобки. Вот как-то примерно так. |
|
|
![]() |
![]() |
passant Метаанализ, его методы и описание. 4.04.2020 - 00:08
nokh По объединени р-значений. Я качал когда-то пару-тр... 4.04.2020 - 06:33
p2004r Цитата(passant @ 4.04.2020 - 00:08) ... 4.04.2020 - 08:37
Med_Elena "Итак, формальная постановка задачи".
Ур... 4.04.2020 - 15:57
passant Цитата(Med_Elena @ 4.04.2020 - 14:57... 4.04.2020 - 21:25
100$ Т.е. у нас есть некий многомерный временной ряд (к... 5.04.2020 - 14:24
passant Цитата(100$ @ 5.04.2020 - 13:24... 5.04.2020 - 17:04
100$ Цитата(passant @ 5.04.2020 - 17:04) ... 5.04.2020 - 17:25
passant Цитата(100$ @ 5.04.2020 - 16:25... 5.04.2020 - 18:02
Б_Т_Г Цитата(passant @ 5.04.2020 - 18:02) ... 7.04.2020 - 17:36
passant Цитата(Б_Т_Г @ 7.04.2020 - 16:36) pa... 7.04.2020 - 18:02
Б_Т_Г Цитата(passant @ 7.04.2020 - 18:02) ... 7.04.2020 - 20:18
passant Спасибо, конечно. Если вы про книгу Sumeet Dua и ... 7.04.2020 - 22:28
passant ..... 7.04.2020 - 22:30![]() ![]() |