Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Сравнение частично зависимых выборок, 95% ДИ и ресэмплинг-техниками
nokh
сообщение 25.01.2024 - 22:55
Сообщение #1





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Здравствуйте, уважаемые участники форума. Уже второй раз сталкиваюсь с нетривиальной похожей задачей, которую собираюсь решать похожим способом. Поэтому решил создать тему под это и обсудить верность стратегии.

Иногда возникают случаи, когда нужно сравнивать выборки, содержащие частично одни и те же объекты, т.е. они не являются в чистом виде ни независимыми, ни зависимыми. Приведу 2 своих примера.

Пример 1. Работа по организации здравоохранения. В областной больнице был проведён анонимный опрос, касающийся качества работы, удовлетворённостью работой, взаимодействием с начальством и всякое такое у разных категорий работников (немедицинский персонал и градации медицинского). Варианты ответов предлагались в анкете. По завершению этого этапа были посчитаны % вариантов ответов, сравнили что было интересно по теме работы критериями типа хи-квадрат, сделали выводы и разработали план коррекции ситуации в лучшую сторону. Далее согласно этому плану с работниками были проведены некие мероприятия и после этого спустя год или два опрос повторили. Тоже рассчитали % и т.д. Задача: оценить статистически эффективность проведённых мероприятий: типа какие-то % увеличились, какие-то уменьшились. Я назвал задачу нетривиальной, т.к. за время между двумя опросами кто-то уволился, кто-то был принят на работу, т.е. выборка респондентов немного изменилась. Но даже если бы это были в точности те же люди организовать сравнение зависимых выборок не получилось бы ввиду анонимности (она была нужна для получения более честной и объективной картины). Поэтому единственный вариант, который напрашивался, - сравнение через сопоставление 95% ДИ: будут перекрываться - значит различия незначимы, имеем дело с одной генеральной совокупностью, не будут - различия значимы, имеем 2 ГС: "до мероприятий" и "после". Поскольку ДИ рассчитываются для каждой выборки изолированно от другой такой подход получается консервативным, однако снимает проблему частично зависимых выборок.

Пример 2. Работа по ветеринарии. Из разных популяций взяли выборки животных и определили в них 1) животных без явных нарушений по комплексу показателей, 2) со слабыми отклонениями от нормы (типа предпатология) и 3) сильными отклонениями, указывающими на разную патологию. Посчитали %, сравнили популяции между собой. Теперь стало нужно определить какие показатели и насколько отклоняются от нормы в ту или другую сторону в популяциях и о чём это говорит. Поскольку норма из книжек/статей не очень хороша и к тому же "плывёт" во времени, было решено скомпоновать свою норму: из всех популяций всех здоровых животных объединили в одну группу, охарактеризовали, в планах - расчёт референтных ("референсных") интервалов (кстати для их расчётов по EPC28A3C / C28-A3c всё нужное есть в MedCalc и R ("referenceIntervals" и др.)). Теперь нужно сравнить каждую популяцию с этой нормой, чтобы оценить по каким показателям и в какую сторону отклонения, рассчитать дельту в %. Таким образом имеем две оценки, как некие самостоятельные характеристики:
1) популяционные оценки показателей (медианы не для всех годились, беру средние с ДИ бутстрэпом) и
2) значения нормы, но рассчитанные частично по животным, входящим в эти популяции.
Сначала тоже хотел сравнить по 95% ДИ, а потом решил получить р-значения и вышел на литературу по сравнению partially overlapping samples, ссылки на пару статей - внизу. В ней есть много подходов и формул, но не увидел сопоставления 95% ДИ и вполне логичного сравнения средних в таких группах техникой Монте-Карло. В связи с чем начал сомневаться, читать про гипотезы, которые проверяют ресэмплинг-техники и т.п. В этом втором примере у меня есть полная информация по степени и структуре перекрытия выборок, и сравнить по формулам из статей в принципе можно, но муторно и не универсально, хочу универсального подхода для кода в R)))

А вы что по этому поводу думаете? Буду признателен за советы/критику/парустатей.

https://www.tqmp.org/RegularArticles/vol18-1/p055/p055.pdf
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9042157/

Сообщение отредактировал nokh - 25.01.2024 - 23:13
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
ИНО
сообщение 15.02.2024 - 20:05
Сообщение #2





Группа: Пользователи
Сообщений: 262
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



У меня нет такого модуля, но все ж думается, что так он работать не должен. Может, там в настройках подкрутить чего надо? Да и зачем вообще его припрягать, если он такой глючный?

Ваше оправдание относительно форм распределений - это нечто замечательное! Раз Вы - доктор, то вот несмешной анекдот на медицинскую тему: врач осматривает пациентку и, указывая на ее большой живот ставит диагноз - беременность. Пациентка возражает, говоря, что является девственницей, а большой живот - результат ожирения, да и по форме сходство с животом беременной имеет весьма отдаленное. Тогда врач открывает дверь и указывает на худого мужчину, стоящего в очереди, говоря: "Вот он - совсем не беременный, а Вас прими за таковую.

Аналогию уловили?

В целом, предложенный Вами метод проверки нормальности по пятибиновой гистограмме сам по себе "гениален"! И хотя в приведенном примере даже столь грубый инструмент позволяет уверенно отвергнуть нормальность для обеих групп, во многих других ситуациях, несмотря на большое отклонение от нормального закона, обнаружить его таким способом не удастся.

P. S, Только сейчас заметил, что для мужиков гистограмма вообще трехбиновая!

Сообщение отредактировал ИНО - 16.02.2024 - 13:18
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- nokh   Сравнение частично зависимых выборок   25.01.2024 - 22:55
- - ИНО   Ух ты, форум еще не умер! Думается здесь осно...   27.01.2024 - 22:51
|- - logvin   Цитата(ИНО @ 27.01.2024 - 22:51) Ух ...   29.01.2024 - 19:29
- - comisora   Доброго дня. Первая задача мне напоминает single ...   28.01.2024 - 11:33
- - ИНО   Давно уже не работал со смешанными моделямм, но ес...   28.01.2024 - 18:31
- - ИНО   Вспомнилась хорошая книга: http://libgen.is/search...   29.01.2024 - 04:21
- - ИНО   Большинство ровесников уже давно в могиле. Но я им...   29.01.2024 - 21:06
- - Игорь   Цитата(nokh @ 25.01.2024 - 23:55) Но...   31.01.2024 - 07:36
- - ИНО   Ух, там еще и анонимность - не дочитал. Тогда ой, ...   31.01.2024 - 20:45
- - nokh   Благодарю участников за мнения. Как-то безрадостно...   4.02.2024 - 21:43
|- - DoctorStat   Цитата(nokh @ 4.02.2024 - 21:43) Мне...   10.02.2024 - 22:39
|- - comisora   Цитата(nokh @ 4.02.2024 - 21:43) Бла...   18.02.2024 - 00:07
- - ИНО   Больница не может быть генеральной совокупностью, ...   5.02.2024 - 03:42
- - ИНО   Точную цитату - в студию! А вообще, можно - п...   10.02.2024 - 23:14
|- - DoctorStat   Цитата(ИНО @ 10.02.2024 - 23:14) Но ...   14.02.2024 - 10:20
- - ИНО   Ну и бред же! По вертикали (оси ординат) в соо...   14.02.2024 - 17:53
|- - DoctorStat   Цитата(ИНО @ 14.02.2024 - 17:53) Так...   14.02.2024 - 19:37
|- - Игорь   Цитата(ИНО @ 14.02.2024 - 17:53) Так...   22.03.2024 - 07:49
- - ИНО   К чему это здесь? Вы полагаете, у меня есть кумир ...   14.02.2024 - 21:59
- - ИНО   Кстати о "колоколах: сходил я по ссылке, что ...   15.02.2024 - 00:48
|- - DoctorStat   Цитата(ИНО @ 15.02.2024 - 00:48) Ну ...   15.02.2024 - 16:48
- - ИНО   У меня нет такого модуля, но все ж думается, что т...   15.02.2024 - 20:05
- - ИНО   Это смотря для какого вывода. Для вывода типа ...   18.02.2024 - 11:13
|- - comisora   Цитата(ИНО @ 18.02.2024 - 11:13) ...   18.02.2024 - 12:49
- - ИНО   Но в таком случае затраты на проведение просветите...   18.02.2024 - 13:45
- - "Наташа"   Здравствуйте. Скажите пожалуйста, а как относиться...   27.06.2024 - 17:44
|- - ИНО   Цитата("Наташа @ 27.06.2024 - 17...   29.06.2024 - 17:07
|- - "Наташа"   Цитата(ИНО @ 29.06.2024 - 17:07) Про...   30.06.2024 - 15:37
- - ИНО   Контроль тоже "лечили" и измеряли повтор...   1.07.2024 - 14:56
- - "Наташа"   Здравствуйте еще раз Нет, группу контроля не трога...   6.07.2024 - 13:36
- - ИНО   Какие критерии применяли?   6.07.2024 - 15:21
- - nokh   Благодарю всех поучаствовавших в обсуждении пробле...   4.08.2024 - 20:49


Добавить ответ в эту темуОткрыть тему