Здравствуйте, гость ( Вход | Регистрация )
6.06.2016 - 19:36
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 17 Регистрация: 18.10.2015 Пользователь №: 27589 |
Добрый день, Уважаемые участники форума!
Прошу Вашего совета с решением следующей задачи (не могу определиться с корректными методами и алгоритмами). Пациенты разбиты на 3 группы по типу операции (50-30-30 человек), каждый характеризуется набором показателей до операции (7 шт) и они же после. Стоят следующие задачи: 1) Сравнить показатели до и после операции в каждой группе (нужно ответить на вопрос эффективности операции и поменялся ли каждый показатель). 2) Сравнить группы до и после операции между собой по 7 показателям (нужно ответить на вопрос - есть ли среди набора показателей те, которые бы отличались в группах как до, так и после операции) 3) Разбить каждую группу на 2 подгруппы по значениям одного из 7 характеризующих их показателей (значение до какого-то балла шкалы и после) и провести сравнения для подгрупп (цель - проверка одной зарубежной статьи). Нормальности распределений в целом нет, показатели - шкалы (0-10), (0-50) и числовые значения. Различные преобразования к нормальности тоже не приводят. Насколько я понимаю предмет, то спотыкаюсь на проблему множественных сравнений во всей красе (вопросы 1 и 2), если сравнивать известными тестами (групповыми и парными). Надо делать корректировку на 7 показателей * 2 сравнения по времени (если сравнивать группы Краскелом-Уоллисом) + 7 показателей *3 группы (сравнение до и после в каждой группе) = 35 сравнений. И это я не затрагиваю вопрос 3. Если смотреть рекомендации с данного форума, то основная ? дисперсионный анализ. Это вроде как Mixed-effects models. Но это было бы корректно, если бы данные были нормально распределены. Может быть, конечно, что-то я пропустила, в этом случае буду благодарна, если отправят по нужному ?адресу?. Единственный вариант, который благодаря p2004r пришел в голову для одновременного решения вопросов 1-2: построение деревьев классификаций при максимально возможном разбиении на группы: (время обследования + тип операции= 6 групп), а потом смотреть какие факторы позволили (и вообще позволили ли) сделать классификацию с допустимым уровнем ошибки. Потом можно объединять неразличимые группы и заново строить деревья. НО, когда задача спускается до вопроса 3, то 2*3*2=12 групп и в каждой немного данных. Сработает ли там этот подход? И будет ли это корректно? А самое главное, очень хочется врачам увидеть волшебное p. Если есть возможность, то натолкните, пожалуйста, на корректное решение проблемы. Так как приходится использовать бесплатное ПО, то буду благодарна ссылке на функции из R. |
|
|
![]() |
![]() |
![]() |
27.06.2016 - 19:02
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
>E_VA
1) Писалось и обсуждалось уже столько раз, что писать сил нет. Но если не писать - это будет нечестно по отношению к тем, кто пришёл на форум позже. А потом - ещё позже... Нормально должны быть распределены не данные, а остатки модели, в данном случае - модели ANOVA. Естественно, что раз ваш показатель различается в группах, то ничего кроме полимодального распределения быть не может и эту полимодальность не снять никакими преобразованими, да и незачем снимать. Но если из каждого значения в группе вычесть среднее его группы, то полимодальное распределение сводится к унимодальному со средним равным нулю. Оно и должно быть нормальным и в идеале ещё иметь одинаковые дисперсии для всех групп. В более сложных вариантах ANOVA сложнее, но принцип такой же. Короче, смотреть нужно Residuals! 2) По поводу деревьев классификации и прочего. Быстро время идёт... Помню ещё не так давно специально ставил WEKA чтобы иметь доступ к нескольким классическим алгоритмам построения деревьев, а по-русски прочитать про них можно было только на сайте разработчиков Deductor... А сейчас где и каких только нет, леса целые выросли > p2004r Мой путь в биостатистику начался с книг Cокала и Рольфа (Biometry), Монтгомери (Планирование эксперимента...), Аптона (Таблицы сопряжённости), и далее - работ представителей канадской и французской школ экологов с их всякими наработками по многомерным техникам. Из переводных - Закс (статистическое оценивание), Хальд (Мат. статистика с техническими приложениями), из отчественных - Урбах, Лакин, Плохинский. Естественно первые книги откладывают определённый отпечаток и задают некий коридор для развития. Во всех этих учебниках большое место отводилось именно моделям дисперсионного анализа - классической техники разработанной создателем теории планирования эксперимента Р. Фишером, а также моделям логлинейного анализа (С. и Р., Аптон), как функционального аналога ANOVA для качественных признаков. Вероятно, такой опыт отчасти давлеет над полной свободой выбора, но я и не против Сообщение отредактировал nokh - 27.06.2016 - 19:07 |
|
|
![]() |
![]() |
27.06.2016 - 22:25
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
> p2004r Мой путь в биостатистику начался с книг Cокала и Рольфа (Biometry), Монтгомери (Планирование эксперимента...), Аптона (Таблицы сопряжённости), и далее - работ представителей канадской и французской школ экологов с их всякими наработками по многомерным техникам. Из переводных - Закс (статистическое оценивание), Хальд (Мат. статистика с техническими приложениями), из отчественных - Урбах, Лакин, Плохинский. Естественно первые книги откладывают определённый отпечаток и задают некий коридор для развития. Во всех этих учебниках большое место отводилось именно моделям дисперсионного анализа - классической техники разработанной создателем теории планирования эксперимента Р. Фишером, а также моделям логлинейного анализа (С. и Р., Аптон), как функционального аналога ANOVA для качественных признаков. Вероятно, такой опыт отчасти давлеет над полной свободой выбора, но я и не против 1) Мой путь начался с рекурсивного (по спискам литературы друг друга) прочтения всей русской библиографии руководств по многомерному анализу доступной через межбиб (старт в 1986 году) Проверка гипотезы это простая геометрия, формулируется просто --- 1) можно ли провести границ(у|ы) в пространстве образованном параметрами эксперимента отделяющую данные (варианты населяющие это пространство) по целевой переменной друг от друга 2) насколько надежна эта граница отличит "очередной вариант". За пределы этой "геометрии" никакая "алгебра" описывающая границу и считающая надежность границы выпрыгнуть не в состоянии принципиально. Можно строить прямые в кривом пространстве, кривые в линейном пространстве и т.д. и т.п., сути дела это не меняет. (на случай непрерывной величины все естественно прекрасно обобщается) Если какой нибудь "случайный бор" сделав тысячи перевыборок не находит способа разделить по экспериментальному воздействию выборки, то никакая классическая статистика помочь не в состоянии. Более того, если она и сможет в описанной ситуации, то тем хуже для "классической" статистики (так как явно в методологии доказательства не обошлось без натяжки совы на глобус). 2) Принципиально эксперимент или наблюдение может быть описан целиком в виде конфигурации для WinBUGS которая породит проверяющий этот набор условий Монте-Карло эксперимент и снимет всякие возражения на тему "что проверялось" и "насколько полно проведена проверка". То есть можно претензии формулировать только в виде конкурирующей модели описании эксперимента-наблюдения. Это очень важно, поскольку формулировкой эксперимента (или наблюдения) активно (я бы даже сказал агрессивно) пренебрегает большинство. Что и ведет к катастрофе воспроизводимости. ![]() |
|
|
![]() |
![]() |
E_VA Выбор методов 6.06.2016 - 19:36
100$ Цитата(E_VA @ 6.06.2016 - 19:36) Доб... 6.06.2016 - 22:16
E_VA Цитата(100$ @ 7.06.2016 - 01:16... 7.06.2016 - 14:55
p2004r Цитата(E_VA @ 6.06.2016 - 19:36) Доб... 7.06.2016 - 09:51
E_VA Цитата(p2004r @ 7.06.2016 - 12:51) 2... 7.06.2016 - 15:09
p2004r Цитата(E_VA @ 7.06.2016 - 15:09) Изв... 7.06.2016 - 16:29
E_VA Цитата(p2004r @ 7.06.2016 - 19:29) Т... 7.06.2016 - 20:25
p2004r Цитата(E_VA @ 7.06.2016 - 20:25) Вер... 8.06.2016 - 09:36
nokh Цитата(E_VA @ 6.06.2016 - 21:36) ...... 13.06.2016 - 20:47
E_VA Цитата(nokh @ 13.06.2016 - 23:47) Пр... 14.06.2016 - 08:47

p2004r Цитата(E_VA @ 14.06.2016 - 08:47) Пр... 14.06.2016 - 14:29

E_VA Цитата(p2004r @ 14.06.2016 - 17:29) ... 16.06.2016 - 06:49
p2004r Цитата(nokh @ 13.06.2016 - 20:47) Тр... 15.06.2016 - 10:40![]() ![]() |