Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Выбор методов, Mixed-effects models, непараметрические аналоги
E_VA
сообщение 6.06.2016 - 19:36
Сообщение #1





Группа: Пользователи
Сообщений: 17
Регистрация: 18.10.2015
Пользователь №: 27589



Добрый день, Уважаемые участники форума!

Прошу Вашего совета с решением следующей задачи (не могу определиться с корректными методами и алгоритмами).
Пациенты разбиты на 3 группы по типу операции (50-30-30 человек), каждый характеризуется набором показателей до операции (7 шт) и они же после.
Стоят следующие задачи:
1) Сравнить показатели до и после операции в каждой группе (нужно ответить на вопрос эффективности операции и поменялся ли каждый показатель).
2) Сравнить группы до и после операции между собой по 7 показателям (нужно ответить на вопрос - есть ли среди набора показателей те, которые бы отличались в группах как до, так и после операции)
3) Разбить каждую группу на 2 подгруппы по значениям одного из 7 характеризующих их показателей (значение до какого-то балла шкалы и после) и провести сравнения для подгрупп (цель - проверка одной зарубежной статьи).

Нормальности распределений в целом нет, показатели - шкалы (0-10), (0-50) и числовые значения. Различные преобразования к нормальности тоже не приводят.
Насколько я понимаю предмет, то спотыкаюсь на проблему множественных сравнений во всей красе (вопросы 1 и 2), если сравнивать известными тестами (групповыми и парными). Надо делать корректировку на 7 показателей * 2 сравнения по времени (если сравнивать группы Краскелом-Уоллисом) + 7 показателей *3 группы (сравнение до и после в каждой группе) = 35 сравнений. И это я не затрагиваю вопрос 3.

Если смотреть рекомендации с данного форума, то основная ? дисперсионный анализ. Это вроде как Mixed-effects models. Но это было бы корректно, если бы данные были нормально распределены.
Может быть, конечно, что-то я пропустила, в этом случае буду благодарна, если отправят по нужному ?адресу?.

Единственный вариант, который благодаря p2004r пришел в голову для одновременного решения вопросов 1-2: построение деревьев классификаций при максимально возможном разбиении на группы: (время обследования + тип операции= 6 групп), а потом смотреть какие факторы позволили (и вообще позволили ли) сделать классификацию с допустимым уровнем ошибки. Потом можно объединять неразличимые группы и заново строить деревья. НО, когда задача спускается до вопроса 3, то 2*3*2=12 групп и в каждой немного данных. Сработает ли там этот подход? И будет ли это корректно? А самое главное, очень хочется врачам увидеть волшебное p.

Если есть возможность, то натолкните, пожалуйста, на корректное решение проблемы. Так как приходится использовать бесплатное ПО, то буду благодарна ссылке на функции из R.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
100$
сообщение 6.06.2016 - 22:16
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(E_VA @ 6.06.2016 - 19:36) *
Добрый день, Уважаемые участники форума!

Прошу Вашего совета с решением следующей задачи (не могу определиться с корректными методами и алгоритмами).
Пациенты разбиты на 3 группы по типу операции (50-30-30 человек), каждый характеризуется набором показателей до операции (7 шт) и они же после.
Стоят следующие задачи:
1) Сравнить показатели до и после операции в каждой группе (нужно ответить на вопрос эффективности операции и поменялся ли каждый показатель).
2) Сравнить группы до и после операции между собой по 7 показателям (нужно ответить на вопрос - есть ли среди набора показателей те, которые бы отличались в группах как до, так и после операции)
3) Разбить каждую группу на 2 подгруппы по значениям одного из 7 характеризующих их показателей (значение до какого-то балла шкалы и после) и провести сравнения для подгрупп (цель - проверка одной зарубежной статьи).

Нормальности распределений в целом нет, показатели - шкалы (0-10), (0-50) и числовые значения. Различные преобразования к нормальности тоже не приводят.
Насколько я понимаю предмет, то спотыкаюсь на проблему множественных сравнений во всей красе (вопросы 1 и 2), если сравнивать известными тестами (групповыми и парными). Надо делать корректировку на 7 показателей * 2 сравнения по времени (если сравнивать группы Краскелом-Уоллисом) + 7 показателей *3 группы (сравнение до и после в каждой группе) = 35 сравнений. И это я не затрагиваю вопрос 3.

Если смотреть рекомендации с данного форума, то основная ? дисперсионный анализ. Это вроде как Mixed-effects models. Но это было бы корректно, если бы данные были нормально распределены.
Может быть, конечно, что-то я пропустила, в этом случае буду благодарна, если отправят по нужному ?адресу?.

Единственный вариант, который благодаря p2004r пришел в голову для одновременного решения вопросов 1-2: построение деревьев классификаций при максимально возможном разбиении на группы: (время обследования + тип операции= 6 групп), а потом смотреть какие факторы позволили (и вообще позволили ли) сделать классификацию с допустимым уровнем ошибки. Потом можно объединять неразличимые группы и заново строить деревья. НО, когда задача спускается до вопроса 3, то 2*3*2=12 групп и в каждой немного данных. Сработает ли там этот подход? И будет ли это корректно? А самое главное, очень хочется врачам увидеть волшебное p.

Если есть возможность, то натолкните, пожалуйста, на корректное решение проблемы. Так как приходится использовать бесплатное ПО, то буду благодарна ссылке на функции из R.


Все описанное вами прекрасно решается в рамках многомерного дисперсионного анализа - MANOVA. К отклонениям от нормальности вроде бы устойчив.

Однако по опыту знаю, что особенно благосклоннно медики относятся к дисперсионному анализу по каждой переменной. Тут вы вольны 7 раз проделать ANOV'у по каждой из 7-ми координат вектора.

В качестве оффтопа - несколько замечаний из серии "музыкой навеяло":

поскольку для данной задачи понятие "эффективность" не определено (и не выводится напрямую из случайного вектора с 7-ю координатами), то в целях сведения многомерной задачи к одномерной (зачем вам это нужно - решать вам) можно попытаться:
1. Определить среди 7 компонент случайного вектора самую драгоценную, отождествить с ней понятие "эффективность" и решать задачу методом главного критерия;
2. Ввести в рассмотрение вектор весов а=(a1,a2,...,a7), таких что их сумма=1 и состряпать упомянутую эффективность как взвешенную сумму a1*x1+a2*x2+...+a7*x7. Это - обычная аддитивная свертка - способ сведения многокритериальной задачи к однокритериальной. Каким-то самым нужным показателям назначаем веса побольше, менее важным - поменьше. Тут, правда, желательно мнение научного сообщества по поводу важности частных критериев и их весов.

А любое обучение по прецедентам имеет целью получение решающего правила (алгоритма классификации), позволяющего отнести вновь поступающий объект к существующим классам. Н-р, для вновь поступившего пациента с конкретным набором 7 цифр понять, какой тип операции ему показан. Хотя я не уверен, что это статистическая задача, а не сугубо медицинская (требующая знаний из предметной области).

Сообщение отредактировал 100$ - 6.06.2016 - 22:39
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему