Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Выбор методов, Mixed-effects models, непараметрические аналоги
E_VA
сообщение 6.06.2016 - 19:36
Сообщение #1





Группа: Пользователи
Сообщений: 17
Регистрация: 18.10.2015
Пользователь №: 27589



Добрый день, Уважаемые участники форума!

Прошу Вашего совета с решением следующей задачи (не могу определиться с корректными методами и алгоритмами).
Пациенты разбиты на 3 группы по типу операции (50-30-30 человек), каждый характеризуется набором показателей до операции (7 шт) и они же после.
Стоят следующие задачи:
1) Сравнить показатели до и после операции в каждой группе (нужно ответить на вопрос эффективности операции и поменялся ли каждый показатель).
2) Сравнить группы до и после операции между собой по 7 показателям (нужно ответить на вопрос - есть ли среди набора показателей те, которые бы отличались в группах как до, так и после операции)
3) Разбить каждую группу на 2 подгруппы по значениям одного из 7 характеризующих их показателей (значение до какого-то балла шкалы и после) и провести сравнения для подгрупп (цель - проверка одной зарубежной статьи).

Нормальности распределений в целом нет, показатели - шкалы (0-10), (0-50) и числовые значения. Различные преобразования к нормальности тоже не приводят.
Насколько я понимаю предмет, то спотыкаюсь на проблему множественных сравнений во всей красе (вопросы 1 и 2), если сравнивать известными тестами (групповыми и парными). Надо делать корректировку на 7 показателей * 2 сравнения по времени (если сравнивать группы Краскелом-Уоллисом) + 7 показателей *3 группы (сравнение до и после в каждой группе) = 35 сравнений. И это я не затрагиваю вопрос 3.

Если смотреть рекомендации с данного форума, то основная ? дисперсионный анализ. Это вроде как Mixed-effects models. Но это было бы корректно, если бы данные были нормально распределены.
Может быть, конечно, что-то я пропустила, в этом случае буду благодарна, если отправят по нужному ?адресу?.

Единственный вариант, который благодаря p2004r пришел в голову для одновременного решения вопросов 1-2: построение деревьев классификаций при максимально возможном разбиении на группы: (время обследования + тип операции= 6 групп), а потом смотреть какие факторы позволили (и вообще позволили ли) сделать классификацию с допустимым уровнем ошибки. Потом можно объединять неразличимые группы и заново строить деревья. НО, когда задача спускается до вопроса 3, то 2*3*2=12 групп и в каждой немного данных. Сработает ли там этот подход? И будет ли это корректно? А самое главное, очень хочется врачам увидеть волшебное p.

Если есть возможность, то натолкните, пожалуйста, на корректное решение проблемы. Так как приходится использовать бесплатное ПО, то буду благодарна ссылке на функции из R.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
100$
сообщение 6.06.2016 - 22:16
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(E_VA @ 6.06.2016 - 19:36) *
Добрый день, Уважаемые участники форума!

Прошу Вашего совета с решением следующей задачи (не могу определиться с корректными методами и алгоритмами).
Пациенты разбиты на 3 группы по типу операции (50-30-30 человек), каждый характеризуется набором показателей до операции (7 шт) и они же после.
Стоят следующие задачи:
1) Сравнить показатели до и после операции в каждой группе (нужно ответить на вопрос эффективности операции и поменялся ли каждый показатель).
2) Сравнить группы до и после операции между собой по 7 показателям (нужно ответить на вопрос - есть ли среди набора показателей те, которые бы отличались в группах как до, так и после операции)
3) Разбить каждую группу на 2 подгруппы по значениям одного из 7 характеризующих их показателей (значение до какого-то балла шкалы и после) и провести сравнения для подгрупп (цель - проверка одной зарубежной статьи).

Нормальности распределений в целом нет, показатели - шкалы (0-10), (0-50) и числовые значения. Различные преобразования к нормальности тоже не приводят.
Насколько я понимаю предмет, то спотыкаюсь на проблему множественных сравнений во всей красе (вопросы 1 и 2), если сравнивать известными тестами (групповыми и парными). Надо делать корректировку на 7 показателей * 2 сравнения по времени (если сравнивать группы Краскелом-Уоллисом) + 7 показателей *3 группы (сравнение до и после в каждой группе) = 35 сравнений. И это я не затрагиваю вопрос 3.

Если смотреть рекомендации с данного форума, то основная ? дисперсионный анализ. Это вроде как Mixed-effects models. Но это было бы корректно, если бы данные были нормально распределены.
Может быть, конечно, что-то я пропустила, в этом случае буду благодарна, если отправят по нужному ?адресу?.

Единственный вариант, который благодаря p2004r пришел в голову для одновременного решения вопросов 1-2: построение деревьев классификаций при максимально возможном разбиении на группы: (время обследования + тип операции= 6 групп), а потом смотреть какие факторы позволили (и вообще позволили ли) сделать классификацию с допустимым уровнем ошибки. Потом можно объединять неразличимые группы и заново строить деревья. НО, когда задача спускается до вопроса 3, то 2*3*2=12 групп и в каждой немного данных. Сработает ли там этот подход? И будет ли это корректно? А самое главное, очень хочется врачам увидеть волшебное p.

Если есть возможность, то натолкните, пожалуйста, на корректное решение проблемы. Так как приходится использовать бесплатное ПО, то буду благодарна ссылке на функции из R.


Все описанное вами прекрасно решается в рамках многомерного дисперсионного анализа - MANOVA. К отклонениям от нормальности вроде бы устойчив.

Однако по опыту знаю, что особенно благосклоннно медики относятся к дисперсионному анализу по каждой переменной. Тут вы вольны 7 раз проделать ANOV'у по каждой из 7-ми координат вектора.

В качестве оффтопа - несколько замечаний из серии "музыкой навеяло":

поскольку для данной задачи понятие "эффективность" не определено (и не выводится напрямую из случайного вектора с 7-ю координатами), то в целях сведения многомерной задачи к одномерной (зачем вам это нужно - решать вам) можно попытаться:
1. Определить среди 7 компонент случайного вектора самую драгоценную, отождествить с ней понятие "эффективность" и решать задачу методом главного критерия;
2. Ввести в рассмотрение вектор весов а=(a1,a2,...,a7), таких что их сумма=1 и состряпать упомянутую эффективность как взвешенную сумму a1*x1+a2*x2+...+a7*x7. Это - обычная аддитивная свертка - способ сведения многокритериальной задачи к однокритериальной. Каким-то самым нужным показателям назначаем веса побольше, менее важным - поменьше. Тут, правда, желательно мнение научного сообщества по поводу важности частных критериев и их весов.

А любое обучение по прецедентам имеет целью получение решающего правила (алгоритма классификации), позволяющего отнести вновь поступающий объект к существующим классам. Н-р, для вновь поступившего пациента с конкретным набором 7 цифр понять, какой тип операции ему показан. Хотя я не уверен, что это статистическая задача, а не сугубо медицинская (требующая знаний из предметной области).

Сообщение отредактировал 100$ - 6.06.2016 - 22:39
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
E_VA
сообщение 7.06.2016 - 14:55
Сообщение #3





Группа: Пользователи
Сообщений: 17
Регистрация: 18.10.2015
Пользователь №: 27589



Цитата(100$ @ 7.06.2016 - 01:16) *
Все описанное вами прекрасно решается в рамках многомерного дисперсионного анализа - MANOVA. К отклонениям от нормальности вроде бы устойчив.


Думаю, что найти процедуру и формально запихнуть данные в такой анализ реально. Но, тогда надо будет ссылаться на литературу, где бы говорилось про устойчивость метода к отклонениям от нормальности. К сожалению, пока что такими ссылками не обладаю frown.gif

Цитата(100$ @ 7.06.2016 - 01:16) *
В качестве оффтопа - несколько замечаний из серии "музыкой навеяло":

поскольку для данной задачи понятие "эффективность" не определено (и не выводится напрямую из случайного вектора с 7-ю координатами), то в целях сведения многомерной задачи к одномерной (зачем вам это нужно - решать вам) можно попытаться:
1. Определить среди 7 компонент случайного вектора самую драгоценную, отождествить с ней понятие "эффективность" и решать задачу методом главного критерия;
2. Ввести в рассмотрение вектор весов а=(a1,a2,...,a7), таких что их сумма=1 и состряпать упомянутую эффективность как взвешенную сумму a1*x1+a2*x2+...+a7*x7. Это - обычная аддитивная свертка - способ сведения многокритериальной задачи к однокритериальной. Каким-то самым нужным показателям назначаем веса побольше, менее важным - поменьше. Тут, правда, желательно мнение научного сообщества по поводу важности частных критериев и их весов.

А любое обучение по прецедентам имеет целью получение решающего правила (алгоритма классификации), позволяющего отнести вновь поступающий объект к существующим классам. Н-р, для вновь поступившего пациента с конкретным набором 7 цифр понять, какой тип операции ему показан. Хотя я не уверен, что это статистическая задача, а не сугубо медицинская (требующая знаний из предметной области).


По вопросу эффективности. Тоже долго думали на эту тему, так как казалось логичным решением постараться соединить в одно. Но в итоге все-равно решили, что это разные характеристики состояния пациента: оценка боли в одной части тела, в другой, оценка качества жизни и т.д. Так и анализируется эффективность по разным направлениям. Как пример: пациенты здоров, но один оптимист, а другой пессимист, вот и будут разные баллы по оценке качества жизни, так что портить ими картину других более объективных характеристик не хочется.

В исследовании не стоит задача рекомендовать тип операции - это делается на основании других характеристик, которые в имеющуюся табличку не вошли. Тут, в частности, рассматривается такой вопрос - пациентов с разными характеристиками на входе и разными типами операций смогли ли довести до одинаково хорошего состояния, другими словами, так как были разные по сложности и степени вмешательства операции, то отразилось ли это в итоге на их послеоперационном состоянии.
А еще одна гипотеза, что люди одной группы со значением показателя до определенного уровня должны себя чувствовать лучше, чем оставшаяся часть - полностью мед. гипотеза. "Лучше" - это надо смотреть по всем шкалам...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему