Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Дисперсионный анализ?

Автор: Zamira 14.06.2017 - 12:43

Добрый день! Прошу помочь разобраться в достаточно "заезженной" теме дисперсионного анализа с повторными измерениями.
Есть две группы (контроль (12 чел) и группа терапии (12 чел)) пациентов с сахарным диабетом 1 типа. несколько параметров (углеводный, липидный обмен, маркеры диабетической нефропатии (ДН)) оценивались в начале исследования и через 6 мес. после присоединения исследуемого препарата в группе терапии. Исходно группы не отличались, предполагается, что присоединение препарата в группе терапии привело к уменьшению маркеров ДН, т.е. оказало нефропротективный эффект. Полагаю, что в данном случае будет уместно проведение дисперсионного анализа (провожу в СПСС, общая линейная модель-повторные измерения). В качестве внутригруппового фактора использую ?время 0-6 мес?, межгрупповой фактор ?контроль-1, терапия-2?. Возникли трудности с интерпретацией полученных данных. Вопрос 1: можно ли вносить одноврменно несколько параметров (глик.гемоглобин, ХС, маркеры ДН) или для каждого нужно проводить отдельный тест. Вопрос 2: нужно ли проводить трансформацию Бокса-Кокса, если да, как и где это можно сделать?
Консультировалась по месту работы с Ребровой О.Ю., она сказала делать попарные сравнения "контроль -терапия" до и после используя тест Манн-Уитни. Если появились межгрупповеы различия после присоединения препарата, можно предположить, что нефропротективный эффект есть.
help.gif, пожалуйста.

Нашла в статистике в блоке трансформация - Бокс-Кокс, полагаю, можно и там провести. Просто внести разом все данные с группирующей переменной?

Автор: 100$ 14.06.2017 - 14:22

Цитата(Zamira @ 14.06.2017 - 12:43) *
Добрый день! Прошу помочь разобраться в достаточно "заезженной" теме дисперсионного анализа с повторными измерениями.
Есть две группы (контроль (12 чел) и группа терапии (12 чел)) пациентов с сахарным диабетом 1 типа. несколько параметров (углеводный, липидный обмен, маркеры диабетической нефропатии (ДН)) оценивались в начале исследования и через 6 мес. после присоединения исследуемого препарата в группе терапии. Исходно группы не отличались, предполагается, что присоединение препарата в группе терапии привело к уменьшению маркеров ДН, т.е. оказало нефропротективный эффект. Полагаю, что в данном случае будет уместно проведение дисперсионного анализа (провожу в СПСС, общая линейная модель-повторные измерения). В качестве внутригруппового фактора использую ?время 0-6 мес?, межгрупповой фактор ?контроль-1, терапия-2?. Возникли трудности с интерпретацией полученных данных. Вопрос 1: можно ли вносить одноврменно несколько параметров (глик.гемоглобин, ХС, маркеры ДН) или для каждого нужно проводить отдельный тест. Вопрос 2: нужно ли проводить трансформацию Бокса-Кокса, если да, как и где это можно сделать?
Консультировалась по месту работы с Ребровой О.Ю., она сказала делать попарные сравнения "контроль -терапия" до и после используя тест Манн-Уитни. Если появились межгрупповеы различия после присоединения препарата, можно предположить, что нефропротективный эффект есть.
help.gif, пожалуйста.


Тема дисперсионного анализа совершенно неисчерпаемая, даже не знаю, с чего лучше начать, поэтому начну с конца.

Рекомендация Ребровой (в вашей редакции) - лучезарная чушь. Во-первых, он формально неприменим для дизайна с повторными измерениями (н-р, тест Левена для внутригруппового эффекта отключен). Во-вторых, теоретически при этом возникает проблема множественных сравнений, когда индивидуальные достигаемые уровни значимости надо корректировать, н-р, процедурой Беньямини - Йекутили (с учетом взаимной коррелированности результатов). В-третьих, надо понимать, что в идеале статистические данные собираются под конкретный метод стат. обработки, и в этом смысле надо еще на этапе планирования эксперимента определиться, интересуют ли запланированные исследования в дисперсионном комплексе (тогда надо пользоваться различными контрастными сравнениями на интересующих уровнях внуригруппового фактора), или идти "вслепую" с помощью пост-хоков. А уж пост-хок критериев в СПСС - немеряно: тут тебе и для случаев равной дисперсии и неравной: и Фишер, и Тьюки, и Даннетт, и Тамхейн, и Геймс с Хауэллом, и вообще несть им числа. Вот только Манна - Уитни среди них по-прежнему нет.

А вообще, конечно, многомерная версия ДА (ака МАНОВА) предпочтительнее уже тем, что относительно устойчива к отклонениям от (многомерной) нормальности и при этом а качестве бонуса выдает еще и все одномерные (Univariate) тесты по каждой переменной многомерной выборки. Апострериорные сравнения в МАНОВЕ невозбранно сделать с помощью парной версии критерия Хотеллинга (реализован а ПАСТ, ПАСТ - софтина бесплатная).

А применительно к Боксу с Коксом надо отдавать себе отчет в том, что если суть некоторого алгоритма заключена в оптимизации некоторого параметра (читай, лямбда), оцениваемого по выборке, данные при этом утрачивают свойство статистической независимости, и полученные на трансформироанных данных результаты надо уметь аккуратно перенести на исходные ("сырые") с.в. Только и всего.

Похоже, это мой самый длинный пост на форуме за много лет.







Автор: Zamira 14.06.2017 - 15:23

то бишь, метод выбарла правильный и алгоритм реализации правильный ?
К вопросу о трансформации, в статистике выдает значение лямбда, моя задача подставить это значение в формулу и получить на выходе трансформированное значение? А представлять эти трансформированные данные, например, так: логХС? извините, что такие въедливые и, возможно, глупые вопросы, но приходится разбираться самой. Нашла еще программу RundomBC 1.0, там по идее должен сразу вылезти результат, но постоянно выдает ошибку - недопустимы значения с плавающей запятой.
Или я несу чушь?

Автор: 100$ 14.06.2017 - 15:54

Цитата(Zamira @ 14.06.2017 - 15:23) *
то бишь, метод выбарла правильный и алгоритм реализации правильный ?
К вопросу о трансформации, в статистике выдает значение лямбда, моя задача подставить это значение в формулу и получить на выходе трансформированное значение? А представлять эти трансформированные данные, например, так: логХС? извините, что такие въедливые и, возможно, глупые вопросы, но приходится разбираться самой. Нашла еще программу RundomBC 1.0, там по идее должен сразу вылезти результат, но постоянно выдает ошибку - недопустимы значения с плавающей запятой.
Или я несу чушь?


Цитата
то бишь, метод выбарла правильный и алгоритм реализации правильный ?


Давайте по-взрослому: а вы мой ответ вообще читали? вы опубликовали в виде вопроса некоторые наброски к исследованию, я вам обозначил его краеугольные камни, вы, не ознакомив меня с вашим решением: будете ли использовать многомерный подход или обойдетесь 100500 одномерными исследованиями, желали бы узнать правильно это или нет?

По поводу лямбд и логарифмов. Дисперсионный анализ в рамках General Linear Model (GLM) рассматривается как линейная регрессия, оцениваемая методом наименьших квадратов. Чтобы эти оценки имели хорошие статистические свойства, должны выполняться условия теоремы Гаусса-Маркова. В частности, остатки модели должны быть независимыми нормально распределенными величинами. Если этого не произошло, надо либо менять метод оценивания модели, либо саму модель, либо затевать шаманизм с данными, в частности - трансформировать Боксом-Коксом. Но я так и не понял - вы все это проделали с сырыми данными, и результат вас не устроил? Как в этой истории появились Бокс с Коксом? Трансформациями занимаются не от нечего делать, это - терапия отчаяния.

И не спешите с ответами, а то мы так и будем вопросами разговаривать.

Автор: passant 14.06.2017 - 16:53

Цитата(Zamira @ 14.06.2017 - 12:43) *
Консультировалась по месту работы с Ребровой О.Ю., она сказала делать попарные сравнения "контроль -терапия" до и после используя тест Манн-Уитни.

Вспомните, Реброва именно так формулировала ответ ? Или она сказала "метод Вилкоксона", потом Вы , по привычке, интерпретировали это как метод "Викоксона-Манна-Уитни", потом "Вилкоксон" отпал?
Дело в том, что "метод Вилкоксона" и "метод Викоксона-Манна-Уитни" (иногда - просто "Манна-Уитни") - это разные методы. Первый - для связных выборок, второй - для несвязных. Вряд-ли Реброва так круто ошиблась.

Автор: Zamira 14.06.2017 - 21:41

Цитата(100$ @ 14.06.2017 - 14:22) *
Тема дисперсионного анализа совершенно неисчерпаемая, даже не знаю, с чего лучше начать, поэтому начну с конца.

Рекомендация Ребровой (в вашей редакции) - лучезарная чушь. Во-первых, он формально неприменим для дизайна с повторными измерениями (н-р, тест Левена для внутригруппового эффекта отключен). Во-вторых, теоретически при этом возникает проблема множественных сравнений, когда индивидуальные достигаемые уровни значимости надо корректировать, н-р, процедурой Беньямини - Йекутили (с учетом взаимной коррелированности результатов). В-третьих, надо понимать, что в идеале статистические данные собираются под конкретный метод стат. обработки, и в этом смысле надо еще на этапе планирования эксперимента определиться, интересуют ли запланированные исследования в дисперсионном комплексе (тогда надо пользоваться различными контрастными сравнениями на интересующих уровнях внуригруппового фактора), или идти "вслепую" с помощью пост-хоков. А уж пост-хок критериев в СПСС - немеряно: тут тебе и для случаев равной дисперсии и неравной: и Фишер, и Тьюки, и Даннетт, и Тамхейн, и Геймс с Хауэллом, и вообще несть им числа. Вот только Манна - Уитни среди них по-прежнему нет.

А вообще, конечно, многомерная версия ДА (ака МАНОВА) предпочтительнее уже тем, что относительно устойчива к отклонениям от (многомерной) нормальности и при этом а качестве бонуса выдает еще и все одномерные (Univariate) тесты по каждой переменной многомерной выборки. Апострериорные сравнения в МАНОВЕ невозбранно сделать с помощью парной версии критерия Хотеллинга (реализован а ПАСТ, ПАСТ - софтина бесплатная).

А применительно к Боксу с Коксом надо отдавать себе отчет в том, что если суть некоторого алгоритма заключена в оптимизации некоторого параметра (читай, лямбда), оцениваемого по выборке, данные при этом утрачивают свойство статистической независимости, и полученные на трансформироанных данных результаты надо уметь аккуратно перенести на исходные ("сырые") с.в. Только и всего.

Похоже, это мой самый длинный пост на форуме за много лет.

извините, если не совсем ясно изложила свою мысль. планировала делать одномерный анализ с повторными измерениями.
трансформацию Бокса-Кокса, тк распределение ненормальное, почитав информацию в том числе на форуме, пришла к выводу, что и мне нужно проделать это

Автор: Zamira 14.06.2017 - 21:43

Цитата(passant @ 14.06.2017 - 16:53) *
Вспомните, Реброва именно так формулировала ответ ? Или она сказала "метод Вилкоксона", потом Вы , по привычке, интерпретировали это как метод "Викоксона-Манна-Уитни", потом "Вилкоксон" отпал?
Дело в том, что "метод Вилкоксона" и "метод Викоксона-Манна-Уитни" (иногда - просто "Манна-Уитни") - это разные методы. Первый - для связных выборок, второй - для несвязных. Вряд-ли Реброва так круто ошиблась.

точно, сначала я вообще делала сравнения до-после в группе контроля и терапии Вилкоксоном, после чего была исправлена, что необходимо делать межгрупповые сравнения, и если появтся различия между группами "контроль-терапия после", можно будет предположить, что они обусловлены действием препарата

Автор: nokh 14.06.2017 - 23:31

Цитата(Zamira @ 14.06.2017 - 18:23) *
то бишь, метод выбарла правильный и алгоритм реализации правильный ?
К вопросу о трансформации, в статистике выдает значение лямбда, моя задача подставить это значение в формулу и получить на выходе трансформированное значение? А представлять эти трансформированные данные, например, так: логХС? извините, что такие въедливые и, возможно, глупые вопросы, но приходится разбираться самой. Нашла еще программу RundomBC 1.0, там по идее должен сразу вылезти результат, но постоянно выдает ошибку - недопустимы значения с плавающей запятой.
Или я несу чушь?

1. Подставлять лямбду никуда не нужно, нужно только выписать. Хорошая программа сама все преобразует. RundomBC 1.0 - хорошая программа.

2. Раз уж вы раздобыли RundomBC 1.0 - добейтесь, чтобы она работала. Для этого нужно читать помощь, в данном случае - файл howto.txt, который идёт вместе с программой. Сейчас специально проверил под Windows 7 - прекрасно работает, преобразовал 2 выборки (см. скриншот). Если вы в первые 4 колонки внесёте свои выборки и выберите "normality and homogeneity of variances", то в колонках 5-8 получите значения, которые будут не только распределены близко к нормальному, но и иметь однородные дисперсии - это дополнительная страховка от проблем с нарушением сферичности в анализе повторных измерений, ну и приятная фишка программы.

3. По поводу трансформации - ретрансформации. Должно использоваться обратное преобразование. Например, при работе с площадями (распределены ненормально) прямое преобразование - квадратный корень из площади (распределены примерно нормально). Преобразовав и отработав с цифрами (средние, ДИ, сравнения) ретрансформируем полученные значения в исходную шкалу площадей - возводим в квадрат. Если логарифмировали - потенцируем. Если Бокс - Кокс - делаем обратное преобразование, изменив формулу на обратную, вот здесь-то и понадобится выписанное значение лямбды.

4. Описанная в (3) ретрансформация называется у профессионалов "наивной" (naive retransformation). Для сравнений это не принципиально, но для получения несмещённой оценки среднего - принципиально, т.к. наивная ретрансформация даёт несколько смещённые оценки (смещение тем сильнее, чем больше дисперсия данных). Тем не менее, это обычно игнорируется практиками. Вплоть до того, что даже в руководствах по вычислению референтных интервалов медицинских показателей используется наивная ретрансформация (правда в последнее время рекомендуется не однопараметрическое преобразование Бокса - Кокса, а двухпараметрическое). Но это - дебри и тонкости, вам достаточно наивной.

5. Могу выложить статьи по грамотной (ненаивной) ретрансформации, в т.ч. Бокса - Кокса, если участникам форума это интересно (про дисперсионный анализ и его всевозможные варианты - уже совсем неинтересно).

 

Автор: Zamira 15.06.2017 - 11:55

спасибо, nokh!!! yahoo.gif

Автор: maxandron 21.06.2017 - 16:58

Цитата(nokh @ 14.06.2017 - 23:31) *
5. Могу выложить статьи по грамотной (ненаивной) ретрансформации, в т.ч. Бокса - Кокса, если участникам форума это интересно (про дисперсионный анализ и его всевозможные варианты - уже совсем неинтересно).

Был бы благодарен, если бы Вы выложили статьи или дали бы ссылки на них. Заранее спасибо.

Автор: nokh 21.06.2017 - 21:00

Цитата(maxandron @ 21.06.2017 - 19:58) *
Был бы благодарен, если бы Вы выложили статьи или дали бы ссылки на них. Заранее спасибо.

Подобрал кое-что по ретрансформации логарифмов, Бокса- Кокса и арксинуса: https://yadi.sk/d/yd9ihstL3KLVuD

Автор: mix3d 17.12.2017 - 22:20

Здравствуйте! Простите, что вмешался в чужой топик. Но очень хочется написать, как можно все перевернуть с ног на голову.
Довелось проводить экспертизу диссертации. Диссертант о значимой динамике показателей на фоне терапии в нескольких рандомизированных группах судит не с помощью ANOVA с повторными измерениями или t-критерию или критерию Вилкоксона, а рассчитывает разницу между повторным измерением и исходным значением (т.е. дельту), а затем сравнивает исходные значения, повторные значения и де льту попарно с помощью критерия Манна-Уитни.
Эффективность терапии при этом обосновывается (1) отсутствием различий исходно между группами по критерию Манна-Уитни, но (2) наличием значимых различий при повторном измерении и (3) значимых различий дельт.
А также, дополнительный тезис "Т.к. по критерию Манна-Уитни медиана дельты (изменения показателя в динамике) в одной группе отличалась от таковых в других группах, то, следовательно, вариант терапии, примененный в этой группе, был эффективнее, чем в других".
Мое замечание, что такой вариант анализа и интерпретации в принципе ошибочный, а критерий Манна-Уитни не предназначен для таких целей - стена непонимания.

Автор: 100$ 17.12.2017 - 23:09

Цитата(mix3d @ 17.12.2017 - 22:20) *
Диссертант о значимой динамике показателей на фоне терапии в нескольких рандомизированных группах судит не с помощью ANOVA с повторными измерениями или t-критерию или критерию Вилкоксона, а рассчитывает разницу между повторным измерением и исходным значением (т.е. дельту), а затем сравнивает исходные значения, повторные значения и де льту попарно с помощью критерия Манна-Уитни.


Мдя... Познавательно. Я вам даже по-доброму завидую: такой эталонный образец химически чистого солнечного идиотизма встречается не каждый день.

Однако. Шутки - шутками, но "базовая"(читай: "самая популярная") нулевая гипотеза для Манна - Уитни: H0: P(X<Y)=1/2 легко переформулируется в нулевую гипотезу о том, что медиана разностей X-Y равна нулю. Вот только диссертанта это не оправдывает.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)