Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Прошу помощи со сравнением двух групп
DJAp
сообщение 28.01.2019 - 00:48
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 28.01.2019
Пользователь №: 32706



Здравствуйте. Я новичок в статистике и не совсем понимаю какими методами можно реализовать сравнение двух групп по частоте встречающихся признаков. Пытался найти что нибудь похожее, но не смог.
Есть пример, пациенты принимали два разных лекарства и получали эффект, который оценивался от 0 до 5.
Таким образом, нужно сравнить, есть ли в этих двух группах (лекарствах) достоверные отличия по частоте явления. То есть, эффект 0 был у 39 пациентов, эффект 1 у 3 пациентов и так далее (таблица ниже).
Как я понял, что если сравнивать количество пациентов есть эффект/нет эффекта, можно использовать критерии Фишера/хи2 в четырехпольных таблицах, например в ПО Statistica.
А в случае когда нужно сравнить несколько вариантов? Есть ли какое то решение этой проблемы?


преп1 преп2
0 39 28
1 3 1
2 3 5
3 6 8
4 0 3
5 3 4

Спасибо.

Сообщение отредактировал DJAp - 28.01.2019 - 02:24
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
leo_biostat
сообщение 28.01.2019 - 08:33
Сообщение #2





Группа: Пользователи
Сообщений: 105
Регистрация: 23.11.2016
Пользователь №: 28953



Цитата(DJAp @ 28.01.2019 - 00:48) *
Здравствуйте. Я новичок в статистике и не совсем понимаю какими методами можно реализовать сравнение двух групп по частоте встречающихся признаков. Пытался найти что нибудь похожее, но не смог.
Есть пример, пациенты принимали два разных лекарства и получали эффект, который оценивался от 0 до 5.
Таким образом, нужно сравнить, есть ли в этих двух группах (лекарствах) достоверные отличия по частоте явления. То есть, эффект 0 был у 39 пациентов, эффект 1 у 3 пациентов и так далее (таблица ниже).
Как я понял, что если сравнивать количество пациентов есть эффект/нет эффекта, можно использовать критерии Фишера/хи2 в четырехпольных таблицах, например в ПО Statistica.
А в случае когда нужно сравнить несколько вариантов? Есть ли какое то решение этой проблемы?


преп1 преп2
0 39 28
1 3 1
2 3 5
3 6 8
4 0 3
5 3 4

Спасибо.



hi.gif!
Увы, Ваш подход в такой ситуации не продуктивный. А уровень такого подхода адекватен уровню желаемой пользы возможного результата, ожидаемого
новичком в статистике. В реальной медицинской практике учитываются не только два разных лекарства, но и очень многие ценные и полезные признаки
пациентов. То есть нужно использовать не такую пару признаков, а гораздо больше признаков. И в этом случае нужно использовать набор нескольких
многомерных методов статистического анализа. Что, естественно, доступно не новичкам в статистике, а профессионалам по биостатистике. Если Вам
действительно нужны очень полезные для медицинской практики результаты продуктивного статистического анализа, высылайте мне свою базу данных
с большим набором наблюдений и признаков, и будем обсуждать возможности анализа такой базы данных.



Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 28.01.2019 - 20:47
Сообщение #3





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Я не врач, поэтому не могу обсуждать, продуктивен или нет подход, который хочет применить ТС. Более того, я уверен, что если-бы у него было больше признаков, то можно было бы и более мощные критерии применять, и более точные результаты получать. Хоть самостоятельно, хоть обратившись к профессионалам.
Однако, просто прочитав вопрос (возможно - учебный), хочу сразу же просто указать ТС, что он ошибается в той части, где пишет что можно использовать только четехпольную таблицу. На самом деле таблица может быть "сколько-угодно-польная". Я специально попытался найти обсуждение этого вопроса именно для врачей.
https://lit-review.ru/biostatistika/kriteri...kvadrat-pirsona
https://cyberleninka.ru/article/n/analiz-poryadkovyh-dannyh
Посмотрите также известную книгу В.М. Зайцев и др. "Прикладная медицинская статистика". На стр.303 есть пример весьма подобный вашему.
Можно - при необходимости- и другие источники поискать.
Так что в поставленной формулировке решение задачи "по зубам" даже студенту-медику. На сколько его можно применять в реальных врачебных ситуациях - оставляю для обсуждения профессиональным медикам.

Сообщение отредактировал passant - 28.01.2019 - 20:48
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DJAp
сообщение 28.01.2019 - 22:03
Сообщение #4





Группа: Пользователи
Сообщений: 3
Регистрация: 28.01.2019
Пользователь №: 32706



Цитата(leo_biostat @ 28.01.2019 - 08:33) *
hi.gif!
Увы, Ваш подход в такой ситуации не продуктивный. А уровень такого подхода адекватен уровню желаемой пользы возможного результата, ожидаемого
новичком в статистике. В реальной медицинской практике учитываются не только два разных лекарства, но и очень многие ценные и полезные признаки
пациентов. То есть нужно использовать не такую пару признаков, а гораздо больше признаков. И в этом случае нужно использовать набор нескольких
многомерных методов статистического анализа. Что, естественно, доступно не новичкам в статистике, а профессионалам по биостатистике. Если Вам
действительно нужны очень полезные для медицинской практики результаты продуктивного статистического анализа, высылайте мне свою базу данных
с большим набором наблюдений и признаков, и будем обсуждать возможности анализа такой базы данных.

Насколько я понял, в этой задаче оценка приведенных мной выше количество пациентов, имеющих признак, всего лишь один из оцениваемых параметров. Анализ "целиком" включает в себя гораздо большее количество параметров. Поэтому тут скорее частный случай, вырванный из контекста.

Цитата(passant @ 28.01.2019 - 20:47) *
Я не врач, поэтому не могу обсуждать, продуктивен или нет подход, который хочет применить ТС. Более того, я уверен, что если-бы у него было больше признаков, то можно было бы и более мощные критерии применять, и более точные результаты получать. Хоть самостоятельно, хоть обратившись к профессионалам.
Однако, просто прочитав вопрос (возможно - учебный), хочу сразу же просто указать ТС, что он ошибается в той части, где пишет что можно использовать только четехпольную таблицу. На самом деле таблица может быть "сколько-угодно-польная". Я специально попытался найти обсуждение этого вопроса именно для врачей.
https://lit-review.ru/biostatistika/kriteri...kvadrat-pirsona
https://cyberleninka.ru/article/n/analiz-poryadkovyh-dannyh
Посмотрите также известную книгу В.М. Зайцев и др. "Прикладная медицинская статистика". На стр.303 есть пример весьма подобный вашему.
Можно - при необходимости- и другие источники поискать.
Так что в поставленной формулировке решение задачи "по зубам" даже студенту-медику. На сколько его можно применять в реальных врачебных ситуациях - оставляю для обсуждения профессиональным медикам.


Именно подобный ответ я и искал. У меня было предположение, что полей может быть сколь угодно много (в разумных пределах, естественно), но предположение ничем не было подкреплено, поскольку не смог найти схожих случаев, либо критериев позволяющих проводить подобную оценку.
В ближайшее время изучу представленную литературу и попробую решить эту задачу. Если будет угодно, пожалуй, смогу описать свою логику.
Но все это не быстро, поскольку занимаюсь этим в свободное от основного рода деятельности время.
Спасибо большое за отклики.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 29.01.2019 - 01:05
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(DJAp @ 28.01.2019 - 02:48) *
Есть пример, пациенты принимали два разных лекарства и получали эффект, который оценивался от 0 до 5.
Таким образом, нужно сравнить, есть ли в этих двух группах (лекарствах) достоверные отличия по частоте явления. То есть, эффект 0 был у 39 пациентов, эффект 1 у 3 пациентов и так далее (таблица ниже).
Как я понял, что если сравнивать количество пациентов есть эффект/нет эффекта, можно использовать критерии Фишера/хи2 в четырехпольных таблицах, например в ПО Statistica.
А в случае когда нужно сравнить несколько вариантов? Есть ли какое то решение этой проблемы?
преп1 преп2
0 39 28
1 3 1
2 3 5
3 6 8
4 0 3
5 3 4

1) Как уже сказали, таблица сопряжённости может быть не только 2 x 2 но и r x c, и даже быть не двумерной, а многомерной. Её можно обсчитать хи-квадратом Пирсона, отношением правдоподобия (G-критерий), критерием Фримана -Тьюки и т.д. Но все критерии, опирающиеся на статистическое распределение хи-квадрат имеют проблему допустимого минимального ожидаемого, т.е. имеются требования к насыщенности ячеек таблицы данными. Ваша таблица слабонасыщенная (есть даже нули), а значит использовать классические критерии некорректно. Нужно использовать точные рандомизационные критерии (exact permutation) или хотя бы рандомизацию Монте-Карло.
2) В вашем случае даже при таком корректном обсчёте мощность сравнения будет недостаточной, т.к. при простом анализе таблиц сопряжённости упорядоченность категорий игнорируется. Т.е. вы просто обнаружите (а для ваших данных - не обнаружите) различие распределения пациентов по категориям. Чтобы учесть упорядоченность ("получали эффект, который оценивался от 0 до 5") нужно использовать другие методы. Например, анализ на тренд методом Кохрана - Армитаж, есть другие малоизвестные методы на нелинейный тренд.
3) Также можно развернуть таблицу сопряжённости в длинный формат и сравнить выборки критерием Манна - Уитни. Т.е. для первого препарата набить 39 нулей, 3 единицы, 3 двойки, 6 троек и т.д. Аналогично для второго и сравнить. Таким способом обсчитывает таблицы с упорядоченными категориями один из самых продвинутых пакетов StatXact. Критерий Манна -Уитни будет искать именно сдвиг.
4) Рекомендации 1-3 даны только для независимых выборок. Если препараты оценивались на одних и тех же пациентах - нужны другие методы.


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DJAp
сообщение 29.01.2019 - 17:50
Сообщение #6





Группа: Пользователи
Сообщений: 3
Регистрация: 28.01.2019
Пользователь №: 32706



Цитата(nokh @ 29.01.2019 - 01:05) *
2) В вашем случае даже при таком корректном обсчёте мощность сравнения будет недостаточной, т.к. при простом анализе таблиц сопряжённости упорядоченность категорий игнорируется. Т.е. вы просто обнаружите (а для ваших данных - не обнаружите) различие распределения пациентов по категориям. Чтобы учесть упорядоченность ("получали эффект, который оценивался от 0 до 5") нужно использовать другие методы. Например, анализ на тренд методом Кохрана - Армитаж, есть другие малоизвестные методы на нелинейный тренд.


К сожалению, я неправильно выразился. Моя ошибка. Имелось в виду, получали 6 разных эффектов, которые не были связаны друг с другом.
В таком случае, приведенные выше методы будут актуальны?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 29.01.2019 - 19:49
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(DJAp @ 29.01.2019 - 19:50) *
К сожалению, я неправильно выразился. Моя ошибка. Имелось в виду, получали 6 разных эффектов, которые не были связаны друг с другом.
В таком случае, приведенные выше методы будут актуальны?

Тогда только 1)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему