Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Прошу помощи со сравнением двух групп

Автор: DJAp 28.01.2019 - 00:48

Здравствуйте. Я новичок в статистике и не совсем понимаю какими методами можно реализовать сравнение двух групп по частоте встречающихся признаков. Пытался найти что нибудь похожее, но не смог.
Есть пример, пациенты принимали два разных лекарства и получали эффект, который оценивался от 0 до 5.
Таким образом, нужно сравнить, есть ли в этих двух группах (лекарствах) достоверные отличия по частоте явления. То есть, эффект 0 был у 39 пациентов, эффект 1 у 3 пациентов и так далее (таблица ниже).
Как я понял, что если сравнивать количество пациентов есть эффект/нет эффекта, можно использовать критерии Фишера/хи2 в четырехпольных таблицах, например в ПО Statistica.
А в случае когда нужно сравнить несколько вариантов? Есть ли какое то решение этой проблемы?


преп1 преп2
0 39 28
1 3 1
2 3 5
3 6 8
4 0 3
5 3 4

Спасибо.

Автор: leo_biostat 28.01.2019 - 08:33

Цитата(DJAp @ 28.01.2019 - 00:48) *
Здравствуйте. Я новичок в статистике и не совсем понимаю какими методами можно реализовать сравнение двух групп по частоте встречающихся признаков. Пытался найти что нибудь похожее, но не смог.
Есть пример, пациенты принимали два разных лекарства и получали эффект, который оценивался от 0 до 5.
Таким образом, нужно сравнить, есть ли в этих двух группах (лекарствах) достоверные отличия по частоте явления. То есть, эффект 0 был у 39 пациентов, эффект 1 у 3 пациентов и так далее (таблица ниже).
Как я понял, что если сравнивать количество пациентов есть эффект/нет эффекта, можно использовать критерии Фишера/хи2 в четырехпольных таблицах, например в ПО Statistica.
А в случае когда нужно сравнить несколько вариантов? Есть ли какое то решение этой проблемы?


преп1 преп2
0 39 28
1 3 1
2 3 5
3 6 8
4 0 3
5 3 4

Спасибо.



hi.gif!
Увы, Ваш подход в такой ситуации не продуктивный. А уровень такого подхода адекватен уровню желаемой пользы возможного результата, ожидаемого
новичком в статистике. В реальной медицинской практике учитываются не только два разных лекарства, но и очень многие ценные и полезные признаки
пациентов. То есть нужно использовать не такую пару признаков, а гораздо больше признаков. И в этом случае нужно использовать набор нескольких
многомерных методов статистического анализа. Что, естественно, доступно не новичкам в статистике, а профессионалам по биостатистике. Если Вам
действительно нужны очень полезные для медицинской практики результаты продуктивного статистического анализа, высылайте мне свою базу данных
с большим набором наблюдений и признаков, и будем обсуждать возможности анализа такой базы данных.




Автор: passant 28.01.2019 - 20:47

Я не врач, поэтому не могу обсуждать, продуктивен или нет подход, который хочет применить ТС. Более того, я уверен, что если-бы у него было больше признаков, то можно было бы и более мощные критерии применять, и более точные результаты получать. Хоть самостоятельно, хоть обратившись к профессионалам.
Однако, просто прочитав вопрос (возможно - учебный), хочу сразу же просто указать ТС, что он ошибается в той части, где пишет что можно использовать только четехпольную таблицу. На самом деле таблица может быть "сколько-угодно-польная". Я специально попытался найти обсуждение этого вопроса именно для врачей.
https://lit-review.ru/biostatistika/kriterijj-khi-kvadrat-pirsona
https://cyberleninka.ru/article/n/analiz-poryadkovyh-dannyh
Посмотрите также известную книгу В.М. Зайцев и др. "Прикладная медицинская статистика". На стр.303 есть пример весьма подобный вашему.
Можно - при необходимости- и другие источники поискать.
Так что в поставленной формулировке решение задачи "по зубам" даже студенту-медику. На сколько его можно применять в реальных врачебных ситуациях - оставляю для обсуждения профессиональным медикам.

Автор: DJAp 28.01.2019 - 22:03

Цитата(leo_biostat @ 28.01.2019 - 08:33) *
hi.gif!
Увы, Ваш подход в такой ситуации не продуктивный. А уровень такого подхода адекватен уровню желаемой пользы возможного результата, ожидаемого
новичком в статистике. В реальной медицинской практике учитываются не только два разных лекарства, но и очень многие ценные и полезные признаки
пациентов. То есть нужно использовать не такую пару признаков, а гораздо больше признаков. И в этом случае нужно использовать набор нескольких
многомерных методов статистического анализа. Что, естественно, доступно не новичкам в статистике, а профессионалам по биостатистике. Если Вам
действительно нужны очень полезные для медицинской практики результаты продуктивного статистического анализа, высылайте мне свою базу данных
с большим набором наблюдений и признаков, и будем обсуждать возможности анализа такой базы данных.

Насколько я понял, в этой задаче оценка приведенных мной выше количество пациентов, имеющих признак, всего лишь один из оцениваемых параметров. Анализ "целиком" включает в себя гораздо большее количество параметров. Поэтому тут скорее частный случай, вырванный из контекста.

Цитата(passant @ 28.01.2019 - 20:47) *
Я не врач, поэтому не могу обсуждать, продуктивен или нет подход, который хочет применить ТС. Более того, я уверен, что если-бы у него было больше признаков, то можно было бы и более мощные критерии применять, и более точные результаты получать. Хоть самостоятельно, хоть обратившись к профессионалам.
Однако, просто прочитав вопрос (возможно - учебный), хочу сразу же просто указать ТС, что он ошибается в той части, где пишет что можно использовать только четехпольную таблицу. На самом деле таблица может быть "сколько-угодно-польная". Я специально попытался найти обсуждение этого вопроса именно для врачей.
https://lit-review.ru/biostatistika/kriterijj-khi-kvadrat-pirsona
https://cyberleninka.ru/article/n/analiz-poryadkovyh-dannyh
Посмотрите также известную книгу В.М. Зайцев и др. "Прикладная медицинская статистика". На стр.303 есть пример весьма подобный вашему.
Можно - при необходимости- и другие источники поискать.
Так что в поставленной формулировке решение задачи "по зубам" даже студенту-медику. На сколько его можно применять в реальных врачебных ситуациях - оставляю для обсуждения профессиональным медикам.


Именно подобный ответ я и искал. У меня было предположение, что полей может быть сколь угодно много (в разумных пределах, естественно), но предположение ничем не было подкреплено, поскольку не смог найти схожих случаев, либо критериев позволяющих проводить подобную оценку.
В ближайшее время изучу представленную литературу и попробую решить эту задачу. Если будет угодно, пожалуй, смогу описать свою логику.
Но все это не быстро, поскольку занимаюсь этим в свободное от основного рода деятельности время.
Спасибо большое за отклики.

Автор: nokh 29.01.2019 - 01:05

Цитата(DJAp @ 28.01.2019 - 02:48) *
Есть пример, пациенты принимали два разных лекарства и получали эффект, который оценивался от 0 до 5.
Таким образом, нужно сравнить, есть ли в этих двух группах (лекарствах) достоверные отличия по частоте явления. То есть, эффект 0 был у 39 пациентов, эффект 1 у 3 пациентов и так далее (таблица ниже).
Как я понял, что если сравнивать количество пациентов есть эффект/нет эффекта, можно использовать критерии Фишера/хи2 в четырехпольных таблицах, например в ПО Statistica.
А в случае когда нужно сравнить несколько вариантов? Есть ли какое то решение этой проблемы?
преп1 преп2
0 39 28
1 3 1
2 3 5
3 6 8
4 0 3
5 3 4

1) Как уже сказали, таблица сопряжённости может быть не только 2 x 2 но и r x c, и даже быть не двумерной, а многомерной. Её можно обсчитать хи-квадратом Пирсона, отношением правдоподобия (G-критерий), критерием Фримана -Тьюки и т.д. Но все критерии, опирающиеся на статистическое распределение хи-квадрат имеют проблему допустимого минимального ожидаемого, т.е. имеются требования к насыщенности ячеек таблицы данными. Ваша таблица слабонасыщенная (есть даже нули), а значит использовать классические критерии некорректно. Нужно использовать точные рандомизационные критерии (exact permutation) или хотя бы рандомизацию Монте-Карло.
2) В вашем случае даже при таком корректном обсчёте мощность сравнения будет недостаточной, т.к. при простом анализе таблиц сопряжённости упорядоченность категорий игнорируется. Т.е. вы просто обнаружите (а для ваших данных - не обнаружите) различие распределения пациентов по категориям. Чтобы учесть упорядоченность ("получали эффект, который оценивался от 0 до 5") нужно использовать другие методы. Например, анализ на тренд методом Кохрана - Армитаж, есть другие малоизвестные методы на нелинейный тренд.
3) Также можно развернуть таблицу сопряжённости в длинный формат и сравнить выборки критерием Манна - Уитни. Т.е. для первого препарата набить 39 нулей, 3 единицы, 3 двойки, 6 троек и т.д. Аналогично для второго и сравнить. Таким способом обсчитывает таблицы с упорядоченными категориями один из самых продвинутых пакетов StatXact. Критерий Манна -Уитни будет искать именно сдвиг.
4) Рекомендации 1-3 даны только для независимых выборок. Если препараты оценивались на одних и тех же пациентах - нужны другие методы.



Автор: DJAp 29.01.2019 - 17:50

Цитата(nokh @ 29.01.2019 - 01:05) *
2) В вашем случае даже при таком корректном обсчёте мощность сравнения будет недостаточной, т.к. при простом анализе таблиц сопряжённости упорядоченность категорий игнорируется. Т.е. вы просто обнаружите (а для ваших данных - не обнаружите) различие распределения пациентов по категориям. Чтобы учесть упорядоченность ("получали эффект, который оценивался от 0 до 5") нужно использовать другие методы. Например, анализ на тренд методом Кохрана - Армитаж, есть другие малоизвестные методы на нелинейный тренд.


К сожалению, я неправильно выразился. Моя ошибка. Имелось в виду, получали 6 разных эффектов, которые не были связаны друг с другом.
В таком случае, приведенные выше методы будут актуальны?

Автор: nokh 29.01.2019 - 19:49

Цитата(DJAp @ 29.01.2019 - 19:50) *
К сожалению, я неправильно выразился. Моя ошибка. Имелось в виду, получали 6 разных эффектов, которые не были связаны друг с другом.
В таком случае, приведенные выше методы будут актуальны?

Тогда только 1)

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)