Здравствуйте, гость ( Вход | Регистрация )
6.06.2016 - 19:36
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 17 Регистрация: 18.10.2015 Пользователь №: 27589 |
Добрый день, Уважаемые участники форума!
Прошу Вашего совета с решением следующей задачи (не могу определиться с корректными методами и алгоритмами). Пациенты разбиты на 3 группы по типу операции (50-30-30 человек), каждый характеризуется набором показателей до операции (7 шт) и они же после. Стоят следующие задачи: 1) Сравнить показатели до и после операции в каждой группе (нужно ответить на вопрос эффективности операции и поменялся ли каждый показатель). 2) Сравнить группы до и после операции между собой по 7 показателям (нужно ответить на вопрос - есть ли среди набора показателей те, которые бы отличались в группах как до, так и после операции) 3) Разбить каждую группу на 2 подгруппы по значениям одного из 7 характеризующих их показателей (значение до какого-то балла шкалы и после) и провести сравнения для подгрупп (цель - проверка одной зарубежной статьи). Нормальности распределений в целом нет, показатели - шкалы (0-10), (0-50) и числовые значения. Различные преобразования к нормальности тоже не приводят. Насколько я понимаю предмет, то спотыкаюсь на проблему множественных сравнений во всей красе (вопросы 1 и 2), если сравнивать известными тестами (групповыми и парными). Надо делать корректировку на 7 показателей * 2 сравнения по времени (если сравнивать группы Краскелом-Уоллисом) + 7 показателей *3 группы (сравнение до и после в каждой группе) = 35 сравнений. И это я не затрагиваю вопрос 3. Если смотреть рекомендации с данного форума, то основная ? дисперсионный анализ. Это вроде как Mixed-effects models. Но это было бы корректно, если бы данные были нормально распределены. Может быть, конечно, что-то я пропустила, в этом случае буду благодарна, если отправят по нужному ?адресу?. Единственный вариант, который благодаря p2004r пришел в голову для одновременного решения вопросов 1-2: построение деревьев классификаций при максимально возможном разбиении на группы: (время обследования + тип операции= 6 групп), а потом смотреть какие факторы позволили (и вообще позволили ли) сделать классификацию с допустимым уровнем ошибки. Потом можно объединять неразличимые группы и заново строить деревья. НО, когда задача спускается до вопроса 3, то 2*3*2=12 групп и в каждой немного данных. Сработает ли там этот подход? И будет ли это корректно? А самое главное, очень хочется врачам увидеть волшебное p. Если есть возможность, то натолкните, пожалуйста, на корректное решение проблемы. Так как приходится использовать бесплатное ПО, то буду благодарна ссылке на функции из R. |
|
|
![]() |
![]() |
![]() |
6.06.2016 - 22:16
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Добрый день, Уважаемые участники форума! Прошу Вашего совета с решением следующей задачи (не могу определиться с корректными методами и алгоритмами). Пациенты разбиты на 3 группы по типу операции (50-30-30 человек), каждый характеризуется набором показателей до операции (7 шт) и они же после. Стоят следующие задачи: 1) Сравнить показатели до и после операции в каждой группе (нужно ответить на вопрос эффективности операции и поменялся ли каждый показатель). 2) Сравнить группы до и после операции между собой по 7 показателям (нужно ответить на вопрос - есть ли среди набора показателей те, которые бы отличались в группах как до, так и после операции) 3) Разбить каждую группу на 2 подгруппы по значениям одного из 7 характеризующих их показателей (значение до какого-то балла шкалы и после) и провести сравнения для подгрупп (цель - проверка одной зарубежной статьи). Нормальности распределений в целом нет, показатели - шкалы (0-10), (0-50) и числовые значения. Различные преобразования к нормальности тоже не приводят. Насколько я понимаю предмет, то спотыкаюсь на проблему множественных сравнений во всей красе (вопросы 1 и 2), если сравнивать известными тестами (групповыми и парными). Надо делать корректировку на 7 показателей * 2 сравнения по времени (если сравнивать группы Краскелом-Уоллисом) + 7 показателей *3 группы (сравнение до и после в каждой группе) = 35 сравнений. И это я не затрагиваю вопрос 3. Если смотреть рекомендации с данного форума, то основная ? дисперсионный анализ. Это вроде как Mixed-effects models. Но это было бы корректно, если бы данные были нормально распределены. Может быть, конечно, что-то я пропустила, в этом случае буду благодарна, если отправят по нужному ?адресу?. Единственный вариант, который благодаря p2004r пришел в голову для одновременного решения вопросов 1-2: построение деревьев классификаций при максимально возможном разбиении на группы: (время обследования + тип операции= 6 групп), а потом смотреть какие факторы позволили (и вообще позволили ли) сделать классификацию с допустимым уровнем ошибки. Потом можно объединять неразличимые группы и заново строить деревья. НО, когда задача спускается до вопроса 3, то 2*3*2=12 групп и в каждой немного данных. Сработает ли там этот подход? И будет ли это корректно? А самое главное, очень хочется врачам увидеть волшебное p. Если есть возможность, то натолкните, пожалуйста, на корректное решение проблемы. Так как приходится использовать бесплатное ПО, то буду благодарна ссылке на функции из R. Все описанное вами прекрасно решается в рамках многомерного дисперсионного анализа - MANOVA. К отклонениям от нормальности вроде бы устойчив. Однако по опыту знаю, что особенно благосклоннно медики относятся к дисперсионному анализу по каждой переменной. Тут вы вольны 7 раз проделать ANOV'у по каждой из 7-ми координат вектора. В качестве оффтопа - несколько замечаний из серии "музыкой навеяло": поскольку для данной задачи понятие "эффективность" не определено (и не выводится напрямую из случайного вектора с 7-ю координатами), то в целях сведения многомерной задачи к одномерной (зачем вам это нужно - решать вам) можно попытаться: 1. Определить среди 7 компонент случайного вектора самую драгоценную, отождествить с ней понятие "эффективность" и решать задачу методом главного критерия; 2. Ввести в рассмотрение вектор весов а=(a1,a2,...,a7), таких что их сумма=1 и состряпать упомянутую эффективность как взвешенную сумму a1*x1+a2*x2+...+a7*x7. Это - обычная аддитивная свертка - способ сведения многокритериальной задачи к однокритериальной. Каким-то самым нужным показателям назначаем веса побольше, менее важным - поменьше. Тут, правда, желательно мнение научного сообщества по поводу важности частных критериев и их весов. А любое обучение по прецедентам имеет целью получение решающего правила (алгоритма классификации), позволяющего отнести вновь поступающий объект к существующим классам. Н-р, для вновь поступившего пациента с конкретным набором 7 цифр понять, какой тип операции ему показан. Хотя я не уверен, что это статистическая задача, а не сугубо медицинская (требующая знаний из предметной области). Сообщение отредактировал 100$ - 6.06.2016 - 22:39 |
|
|
![]() |
![]() |
E_VA Выбор методов 6.06.2016 - 19:36
E_VA Цитата(100$ @ 7.06.2016 - 01:16... 7.06.2016 - 14:55
p2004r Цитата(E_VA @ 6.06.2016 - 19:36) Доб... 7.06.2016 - 09:51
E_VA Цитата(p2004r @ 7.06.2016 - 12:51) 2... 7.06.2016 - 15:09
p2004r Цитата(E_VA @ 7.06.2016 - 15:09) Изв... 7.06.2016 - 16:29
E_VA Цитата(p2004r @ 7.06.2016 - 19:29) Т... 7.06.2016 - 20:25
p2004r Цитата(E_VA @ 7.06.2016 - 20:25) Вер... 8.06.2016 - 09:36
nokh Цитата(E_VA @ 6.06.2016 - 21:36) ...... 13.06.2016 - 20:47
E_VA Цитата(nokh @ 13.06.2016 - 23:47) Пр... 14.06.2016 - 08:47

p2004r Цитата(E_VA @ 14.06.2016 - 08:47) Пр... 14.06.2016 - 14:29

E_VA Цитата(p2004r @ 14.06.2016 - 17:29) ... 16.06.2016 - 06:49
p2004r Цитата(nokh @ 13.06.2016 - 20:47) Тр... 15.06.2016 - 10:40
nokh >E_VA
1) Писалось и обсуждалось уже столько ра... 27.06.2016 - 19:02
p2004r Цитата(nokh @ 27.06.2016 - 19:02) ... 27.06.2016 - 22:25![]() ![]() |