Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Сравнение частично зависимых выборок, 95% ДИ и ресэмплинг-техниками
nokh
сообщение 25.01.2024 - 22:55
Сообщение #1





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Здравствуйте, уважаемые участники форума. Уже второй раз сталкиваюсь с нетривиальной похожей задачей, которую собираюсь решать похожим способом. Поэтому решил создать тему под это и обсудить верность стратегии.

Иногда возникают случаи, когда нужно сравнивать выборки, содержащие частично одни и те же объекты, т.е. они не являются в чистом виде ни независимыми, ни зависимыми. Приведу 2 своих примера.

Пример 1. Работа по организации здравоохранения. В областной больнице был проведён анонимный опрос, касающийся качества работы, удовлетворённостью работой, взаимодействием с начальством и всякое такое у разных категорий работников (немедицинский персонал и градации медицинского). Варианты ответов предлагались в анкете. По завершению этого этапа были посчитаны % вариантов ответов, сравнили что было интересно по теме работы критериями типа хи-квадрат, сделали выводы и разработали план коррекции ситуации в лучшую сторону. Далее согласно этому плану с работниками были проведены некие мероприятия и после этого спустя год или два опрос повторили. Тоже рассчитали % и т.д. Задача: оценить статистически эффективность проведённых мероприятий: типа какие-то % увеличились, какие-то уменьшились. Я назвал задачу нетривиальной, т.к. за время между двумя опросами кто-то уволился, кто-то был принят на работу, т.е. выборка респондентов немного изменилась. Но даже если бы это были в точности те же люди организовать сравнение зависимых выборок не получилось бы ввиду анонимности (она была нужна для получения более честной и объективной картины). Поэтому единственный вариант, который напрашивался, - сравнение через сопоставление 95% ДИ: будут перекрываться - значит различия незначимы, имеем дело с одной генеральной совокупностью, не будут - различия значимы, имеем 2 ГС: "до мероприятий" и "после". Поскольку ДИ рассчитываются для каждой выборки изолированно от другой такой подход получается консервативным, однако снимает проблему частично зависимых выборок.

Пример 2. Работа по ветеринарии. Из разных популяций взяли выборки животных и определили в них 1) животных без явных нарушений по комплексу показателей, 2) со слабыми отклонениями от нормы (типа предпатология) и 3) сильными отклонениями, указывающими на разную патологию. Посчитали %, сравнили популяции между собой. Теперь стало нужно определить какие показатели и насколько отклоняются от нормы в ту или другую сторону в популяциях и о чём это говорит. Поскольку норма из книжек/статей не очень хороша и к тому же "плывёт" во времени, было решено скомпоновать свою норму: из всех популяций всех здоровых животных объединили в одну группу, охарактеризовали, в планах - расчёт референтных ("референсных") интервалов (кстати для их расчётов по EPC28A3C / C28-A3c всё нужное есть в MedCalc и R ("referenceIntervals" и др.)). Теперь нужно сравнить каждую популяцию с этой нормой, чтобы оценить по каким показателям и в какую сторону отклонения, рассчитать дельту в %. Таким образом имеем две оценки, как некие самостоятельные характеристики:
1) популяционные оценки показателей (медианы не для всех годились, беру средние с ДИ бутстрэпом) и
2) значения нормы, но рассчитанные частично по животным, входящим в эти популяции.
Сначала тоже хотел сравнить по 95% ДИ, а потом решил получить р-значения и вышел на литературу по сравнению partially overlapping samples, ссылки на пару статей - внизу. В ней есть много подходов и формул, но не увидел сопоставления 95% ДИ и вполне логичного сравнения средних в таких группах техникой Монте-Карло. В связи с чем начал сомневаться, читать про гипотезы, которые проверяют ресэмплинг-техники и т.п. В этом втором примере у меня есть полная информация по степени и структуре перекрытия выборок, и сравнить по формулам из статей в принципе можно, но муторно и не универсально, хочу универсального подхода для кода в R)))

А вы что по этому поводу думаете? Буду признателен за советы/критику/парустатей.

https://www.tqmp.org/RegularArticles/vol18-1/p055/p055.pdf
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9042157/

Сообщение отредактировал nokh - 25.01.2024 - 23:13
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
ИНО
сообщение 14.02.2024 - 17:53
Сообщение #2





Группа: Пользователи
Сообщений: 204
Регистрация: 1.06.2022
Из: Донецк
Пользователь №: 39632



Ну и бред же! По вертикали (оси ординат) в соответствии с общепринятым стандартом откладывается не артериальное давление, а плотность распределения (кол-во человек в класс-интервале в случае с гиснораммой)! Так что сдвинутся наш колокол должен по горизонтали (оси абсцисс), и именно сдвинуться, а не сжаться. Если он от действия таблетки еще и сжимаетеся, то "обычный Стьюдент" не канает, нуден Уэлч. Это если мы забиваем на то, что артериальное давление не может иметь нормального распределение по своей природе, хотя бы потому что даже на бесконечном количестве живых людей мы не найдем ни одного с отрицательным давлением или давлением в 10 атмосфер smile.gif. Но, в принципе, забить на это можно, так как погрешность в достигаемый уровень значимости в данном пример внесет пренебрежимо малую. А вот на то, что половина испытуемых в перерыве между измерениями была заменена, так просто забить уже не получится. В вашем примере этого обстоятельства, кстати нет, в отличие от примера ТС. Поэтому можно предположить, что Вы плохо вникли в ситуацию.

Так где цитата из Гланца?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 22.03.2024 - 07:49
Сообщение #3





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(ИНО @ 14.02.2024 - 17:53) *
Так где цитата из Гланца?
Реплика, так сказать, "по поводу". К книге Гланца прилагается программное обеспечение, которое работает только в Windows версии до 7 включительно. Чтобы посмотреть, пришлось запускать под Windows 10 в виртуальной среде. Это если кто будет пробовать.

Сообщение отредактировал Игорь - 22.03.2024 - 07:50


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- nokh   Сравнение частично зависимых выборок   25.01.2024 - 22:55
- - ИНО   Ух ты, форум еще не умер! Думается здесь осно...   27.01.2024 - 22:51
|- - logvin   Цитата(ИНО @ 27.01.2024 - 22:51) Ух ...   29.01.2024 - 19:29
- - comisora   Доброго дня. Первая задача мне напоминает single ...   28.01.2024 - 11:33
- - ИНО   Давно уже не работал со смешанными моделямм, но ес...   28.01.2024 - 18:31
- - ИНО   Вспомнилась хорошая книга: http://libgen.is/search...   29.01.2024 - 04:21
- - ИНО   Большинство ровесников уже давно в могиле. Но я им...   29.01.2024 - 21:06
- - Игорь   Цитата(nokh @ 25.01.2024 - 23:55) Но...   31.01.2024 - 07:36
- - ИНО   Ух, там еще и анонимность - не дочитал. Тогда ой, ...   31.01.2024 - 20:45
- - nokh   Благодарю участников за мнения. Как-то безрадостно...   4.02.2024 - 21:43
|- - DoctorStat   Цитата(nokh @ 4.02.2024 - 21:43) Мне...   10.02.2024 - 22:39
|- - comisora   Цитата(nokh @ 4.02.2024 - 21:43) Бла...   18.02.2024 - 00:07
- - ИНО   Больница не может быть генеральной совокупностью, ...   5.02.2024 - 03:42
- - ИНО   Точную цитату - в студию! А вообще, можно - п...   10.02.2024 - 23:14
|- - DoctorStat   Цитата(ИНО @ 10.02.2024 - 23:14) Но ...   14.02.2024 - 10:20
- - ИНО   Ну и бред же! По вертикали (оси ординат) в соо...   14.02.2024 - 17:53
|- - DoctorStat   Цитата(ИНО @ 14.02.2024 - 17:53) Так...   14.02.2024 - 19:37
|- - Игорь   Цитата(ИНО @ 14.02.2024 - 17:53) Так...   22.03.2024 - 07:49
- - ИНО   К чему это здесь? Вы полагаете, у меня есть кумир ...   14.02.2024 - 21:59
- - ИНО   Кстати о "колоколах: сходил я по ссылке, что ...   15.02.2024 - 00:48
|- - DoctorStat   Цитата(ИНО @ 15.02.2024 - 00:48) Ну ...   15.02.2024 - 16:48
- - ИНО   У меня нет такого модуля, но все ж думается, что т...   15.02.2024 - 20:05
- - ИНО   Это смотря для какого вывода. Для вывода типа ...   18.02.2024 - 11:13
|- - comisora   Цитата(ИНО @ 18.02.2024 - 11:13) ...   18.02.2024 - 12:49
- - ИНО   Но в таком случае затраты на проведение просветите...   18.02.2024 - 13:45


Добавить ответ в эту темуОткрыть тему