Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Параметрические или непараметрические методы
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Страницы: 1, 2
Alex_Z
Не могу найти ответ на вопрос.
(
У меня есть показатели (дискретные значения) - индексы по шкале, измеренные в трех временных точках (1,2 и 3) у двух сравниваемых групп.
Нужно сравнить средние значения в каждой временной точке. Но вот проблема: распределения то отличаются от нормального, то нет.
Нормальность смотрел критерием Колмогорова-Смирнова.
Группа 1:
1 точка - р-0,017
2 точка - р-0,033
3 точка - р-0,7.

Группа 2:
1 точка - р-0,241
2 точка - р-0,01
3 точка - р-0,000.

Т.е. точки 2 у двух групп можно сравнить критерием Манн-Уитни, т.к. выборки не подчиняются нормальному закону. А какой метод использовать для точек 1 и 3, когда распределения разные? Параметрический или нет?

И как описывать средние в отчете? В литературе рекомендуется при нормальном распределении описывать как среднее и СО (или 95% ДИ). При ненормальном - как медиану и интерквартильный размах.

Будет ли правильно написать так:
1 измерение:
1 гр. среднее (СО) ---- 2 гр. медиана (интерквартильный размах), р<0,0.... Правильно это? Или тогда обе группы описывать одинаковым способом вне зависимости от распределения?

P.S. Странно, я думал, что параметрические критерии более чувствительны к тому, чтобы уловить различия между группами. Посчитал по Стьюденту, Манн-Уитни и Колмогорову-Смирнову по SPSS.

Так, Стьюдент:
Точка 1 р-1,000
Точка 2 р-0,294
Точка 3 р-0,163.

Манн-Уитни:
Точка 1 р-0,81
Точка 2 р-0,068
Точка 3 р-0,037.

По Колмогорову-Смирнову еще интереснее:
Точка 1 р-0,74
Точка 2 р-0,011
Точка 3 р-0,000.

Т.е. получается - по Стьюденту, различий между группами нет ни в одной временной точке. По М-У - только в 3, а по К-С во 2 и 3.
Запутался.... Подскажите, пожалуйста.
100$
Если вы отдаете себе отчет в том, что

Цитата
... есть показатели (дискретные значения) - индексы по шкале....


то это значает, что нормальность незачем и проверять. Нормальное распределение - это непрерывное распределение, а дискретное - оно и в Африке дискретное.
Alex_Z
То есть применять только непараметрические критерии?

А как мне описывать результаты? Как среднее и СО или медиану и интерквартильный размах?
100$
Цитата(Alex_Z @ 4.01.2012 - 18:24) *
То есть применять только непараметрические критерии?

А как мне описывать результаты? Как среднее и СО или медиану и интерквартильный размах?


Это зависит от природы индексов (т.е. от того, по какой шкале они измерены). Если индексы выражены в баллах (ординальная шкала), то там среднее арифметическое вообще не определено. Тогда остается беспроигрышный вариант - медиана, мода и межквартильный размах.
Olga_
Цитата(Alex_Z @ 4.01.2012 - 10:31) *
У меня есть показатели (дискретные значения) - индексы по шкале, измеренные в трех временных точках (1,2 и 3) у двух сравниваемых групп.


Что вы анализируете?
Alex_Z
Да, вы правы, шкала именно такая.

Пока рылся - нашел ссылочку на этот же форум: http://forum.disser.ru/index.php?showtopic=2593

Я правильно понимаю, что даже для ординальной шкалы можно применить параметрические методы, но потом перепроверить их непараметрическими методами (сравнив не средние, а медианы) и представить данные в конечном счете как медиану и ДИ (95% ДИ-?)? Или как медиану и размах?
Alex_Z
2 Ольга

Индексы по шкалам APACHE II и SOFA до лечения, а также на 1 и 5 сутки.
Olga_
Цитата(Alex_Z @ 4.01.2012 - 16:53) *
2 Ольга

Индексы по шкалам APACHE II и SOFA до лечения, а также на 1 и 5 сутки.



Нда, ожидала несколько иной ответ..
Изучать указанные шкалы в пабмеде, мне честно говоря лень, как и предполагать, какие конкретные цели, количество пациентов, дизайн исследования и т.д.

Да, если вы используете дискретные данные, то проверять нормальность тоже не нужно, т.к. обычно они имеют распределение Пауссона
p2004r
Цитата(Alex_Z @ 4.01.2012 - 18:53) *
2 Ольга

Индексы по шкалам APACHE II и SOFA до лечения, а также на 1 и 5 сутки.


Вам надо все таки построить сначала parallel coordinates plot http://en.wikipedia.org/wiki/Parallel_coordinates
а потом уже делать проверки.

Скорее всего надо сравнивать всю траекторию как целое, или по крайней мере иметь повод так не делать.
Alex_Z
Изучается эффективность одного метода лечения сепсиса.

Для того, чтобы показать эффективность метода, оценивается динамика указанных шкал. По сути, они отражают степень нарушения различных систем организма. Шкала АПАЧИ, кроме всего прочего учитывает и наличие хронических нарушений здоровья, был ли пациент прооперирован (экстренно или планово), а также позволяет расчитать риск летального исхода.

В исследовани выделена основная группа (которая конкретному подверглась лечению), состоящая из 110 человек (пока, работа еще не закончена, хочу подвести промежуточные итоги). Также имеется группа сравнения, тоже состоящася из 110 человек, у которых поставлен такой же диагноз и проводилась подобная терапия за исключением примененного метода.

Конкретных задач передо мной не стоит. Точнее дан простор для творчества. Возможно будут найдены достоверные различия в динамике по шкалам между группами. Возможно (как получилось ранее, когда группы были меньшими), достоверные различия в динамике обнаружатся только при раздельном сравнении выживших и умерших пациентов обеих групп. Кроме шкал также планируется проанализировать другие параметры: возраст, примененные препараты, сутки смерти и др. Если достоверной динамики между группами не определится, то, возможно, получится выделить подгруппы, у которых метод лечения обладал высокой эффективностью, что зависило от высеваемой бактериальной флоры, наличия вирусной инфекции или фунгальной флоры.

Пока мне хотелось бы просто сравнить эти группы целиком в трех временных точках. Точнее, изолированно сравнить индексы по этим шкалам. Потом, скорее всего, я поделю группы на выживших и умерших, отдельно проанализирую их показатели.

Каким методом это лучше сделать? Сравнивать средние или медианы? И как потом правильно представить результаты?

Прошу прощения, если не могу сразу понятно сформулировать задачу.
Alex_Z
2 p2004r Спасибо.
Тааак... Полез читать.
Olga_
Цитата(Alex_Z @ 4.01.2012 - 17:39) *
Изучается эффективность одного метода лечения сепсиса.

Для того, чтобы показать эффективность метода, оценивается динамика указанных шкал. По сути, они отражают степень нарушения различных систем организма. Шкала АПАЧИ, кроме всего прочего учитывает и наличие хронических нарушений здоровья, был ли пациент прооперирован (экстренно или планово), а также позволяет расчитать риск летального исхода.

...



Попробую все систематизировать.
Вы проводите клиническое исследование, правильно?

Primary Outcome Measures:
Новый метод лечения будете анализировать используя СОФА и АПАЧИ, кстати, все пациенты были протестированы с использованием обеих указанных шкал?

Secondary Outcome Measures:
Выживаемость
возраст, примененные препараты?? eek.gif

Для каждой цели свой статистический метод, который также зависит от дизайна РКИ.
Для начала прочитайте о клинических исследованиях, а также будет ОЧЕНь полезно прочитать похожие РКИ

http://www.ncbi.nlm.nih.gov/pmc/articles/P.../pdf/cc9382.pdf
http://bja.oxfordjournals.org/content/98/2/216.full.pdf+html
http://clinicaltrials.gov/ct2/show/NCT0071...ofa&rank=20
p2004r
Цитата(Olga_ @ 4.01.2012 - 20:26) *


Боюсь эпитафия всем этим методам будет:

"treated with randomized therapy".
Olga_
Цитата(p2004r @ 4.01.2012 - 18:52) *
Боюсь эпитафия всем этим методам будет:

"treated with randomized therapy".


Вы о каких методах речь ведете?
p2004r
Цитата(Olga_ @ 4.01.2012 - 20:55) *
Вы о каких методах речь ведете?


из статьи по ссылке
Olga_
Цитата(p2004r @ 4.01.2012 - 18:57) *
из статьи по ссылке


Первая статья ето multicenter, randomized, double-blind, parallel, controlled, dose comparison phase 2 study.

Где Protein C deficient patients were randomized to standard therapy (24 μg/kg/hr infusion for 96 hours) or alternative therapy (higher dose and/or variable duration; 24/30/ 36 μg/kg/hr for 48 to 168 hours).

Вторая статья ето observational study

Вы иронизируете по поводу чего?
p2004r
Цитата(Olga_ @ 4.01.2012 - 21:07) *
Первая статья ето multicenter, randomized, double-blind, parallel, controlled, dose comparison phase 2 study.

Где Protein C deficient patients were randomized to standard therapy (24 μg/kg/hr infusion for 96 hours) or alternative therapy (higher dose and/or variable duration; 24/30/ 36 μg/kg/hr for 48 to 168 hours).

Вторая статья ето observational study

Вы иронизируете по поводу чего?


Вторая статья это практически одномоментно набранная выборка без цензуры.

All adult patients admitted to the 198 participating intensive care units (ICUs)
during a 15-day period were enrolled.

По моему как и в первом случае слово "наблюдение" уж очень строгие условия предполагает.

Впрочем я могу ошибаться (даю 1/20 на такой вариант) и данные у Топикстартера и рандомизированы, и без цензуры.
Alex_Z
Ну....наверное мои изыскания можно назвать и клиническим исследованием. Если так можно назвать заполнение разработанных мной стат.карт на тематических больных в течение двух лет. А уж применен мой метод лечения или нет - это уже на самом деле дело случая. Так постепенно и набрались две группы.

Ольга, спаисбо вам за ссылку - http://bja.oxfordjournals.org/content/98/2/216.full.pdf+html. С большим интересом ее изучаю.
В материалах и методах при описании статистических методов написано, что ВСЕ показатели проверялись на нормальность. Я так понимаю, что и индемы по шкалам? (1 вопрос)
Почему на иллюстрации 2 (концентрации креатинина и мочевины) данные представлены как медиана, интерквартильная широта и 95%ДИ (если я правильно понял). Потому, что распределение не по нормальному закону? Как все таки лучше представить было бы эти данные в табличном виде? (2 вопрос).
3. Почему индексы по шкалам САПС и СОФА даны как среднее и СО?


Olga_
Цитата(p2004r @ 4.01.2012 - 19:37) *
Вторая статья это практически одномоментно набранная выборка без цензуры.

All adult patients admitted to the 198 participating intensive care units (ICUs)
during a 15-day period were enrolled.

По моему как и в первом случае слово "наблюдение" уж очень строгие условия предполагает.

Впрочем я могу ошибаться (даю 1/20 на такой вариант) и данные у Топикстартера и рандомизированы, и без цензуры.


Условия как раз то нормальные, если мы об одних и тех же условиях говорим.

Кстати, вот КОНСОРТ требования к описанию параллельных РКИ

http://www.bmj.com/highwire/section-pdf/8848/10/1

ПС. Что такое данные без цензуры?

Olga_
Цитата(Alex_Z @ 4.01.2012 - 20:09) *
Ну....наверное мои изыскания можно назвать и клиническим исследованием. Если так можно назвать заполнение разработанных мной стат.карт на тематических больных в течение двух лет. А уж применен мой метод лечения или нет - это уже на самом деле дело случая. Так постепенно и набрались две группы.

Ольга, спаисбо вам за ссылку - http://bja.oxfordjournals.org/content/98/2/216.full.pdf+html. С большим интересом ее изучаю.
В материалах и методах при описании статистических методов написано, что ВСЕ показатели проверялись на нормальность. Я так понимаю, что и индемы по шкалам? (1 вопрос)
Почему на иллюстрации 2 (концентрации креатинина и мочевины) данные представлены как медиана, интерквартильная широта и 95%ДИ (если я правильно понял). Потому, что распределение не по нормальному закону? Как все таки лучше представить было бы эти данные в табличном виде? (2 вопрос).
3. Почему индексы по шкалам САПС и СОФА даны как среднее и СО?


1. ЧИТАЕМ ВНИМАТЕЛьНО. На нормальность проверялись только continuous variables . The Kolmogorov-Smirnov test was used to verify the normality of distribution of continuous variables. Если данные были не нормальные)), то использовались непараметрические методы. Non-parametric tests of comparison were used for variables evaluated as not normally distributed.

2. Это дело вкуса, если хотите представьте в виде таблицы.

2. Про СОФА тож все написано. The Wilcoxon test was used to compare initial renal SOFA scores and maximum renal SOFA scores according to the type of fluid administered. The Kruskal-Wallis test was used to compare the change in renal SOFA score according to the type of fluid used.
Про СОФА это я вас должна спрашивать))
Alex_Z
Так....
По первому вопросу - все понятно. Спасибо!
На счет шкал - выше было написано господином 100$, что "Если индексы выражены в баллах (ординальная шкала), то там среднее арифметическое вообще не определено.". Тогда почему в статье индексы представлены как среднне и СО?

И на счет самого первого вопроса в теме... Я верно понимаю, что если шкала дискретная (шкалы), то применимы методы непараметрической статистики, т.к. параметрическая статистика применяется при анализе данных, распределенных по нормальному закону (а это только непрерывная шкала)? Если нам просто нужно сравнить достоверность отличий (медиан-?) по индексам между двумя группами.
Olga_
Цитата(Alex_Z @ 4.01.2012 - 20:31) *
Так....
По первому вопросу - все понятно. Спасибо!
На счет шкал - выше было написано господином 100$, что "Если индексы выражены в баллах (ординальная шкала), то там среднее арифметическое вообще не определено.". Тогда почему в статье индексы представлены как среднне и СО?

И на счет самого первого вопроса в теме... Я верно понимаю, что если шкала дискретная (шкалы), то применимы методы непараметрической статистики, т.к. параметрическая статистика применяется при анализе данных, распределенных по нормальному закону (а это только непрерывная шкала)? Если нам просто нужно сравнить достоверность отличий (медиан-?) по индексам между двумя группами.


Повторяю, нет времени искать и подробно читать про СОФА. Поетому на етот вопрос вы должны ответить сами, а именно какие переменные в СОФА и какие из них вы собираетесь анализировать.

Если данные дискретные, например заболеваемость, смертность, количество колоний, поступлений и т.д., то распределение у них преимущественно Пуассона, и используется, например, пуассоновская регрессия.
Alex_Z
В шкале СОФА данные тоже только дискретные. Однако, в приведенных вами статьях указываются непараметрические методы...пуассоновской регресии я там не нашел. Если честно, и в имеющихся у меня книгах тоже.
Olga_
Цитата(Alex_Z @ 4.01.2012 - 21:00) *
В шкале СОФА данные тоже только дискретные. Однако, в приведенных вами статьях указываются непараметрические методы...пуассоновской регресии я там не нашел. Если честно, и в имеющихся у меня книгах тоже.


Вы думаете, что а привела примеры со всеми возможными статистическими методами)))

Что такое renal SOFA score, ответ/копипаст ожидаю подробный
Alex_Z
Нет-нет, поверьте, я не сомневаюсь, что их существует множество и вы владете многими. Говорю абсолютно без иронии. Я лишь пытаюсь определиться с оптимальными необходимыми мне критериями. Просто я смотрю на таблицу в статье... Я бы тоже описал шкалы как среднее и СО. Если это применимо к дискретным шкалам. А количество баллов что по СОФА, что по АПАЧИ - это всегда целое число.

"renal SOFA score"
Я так понимаю, тут имеется в виду степень нарушения почечной функции, оцененная по концентрации креатинина в крови или диурезу. В зависимости от того, в какой интервал значений попадают показатели у больного, ему присваивается некое количество баллов (от 0 до 4). Вот ( http://criticare.chat.ru/s-003.html ) наглядный пример.

p2004r
Цитата(Olga_ @ 4.01.2012 - 22:10) *
ПС. Что такое данные без цензуры?


Когда из всех неслучайно выбираются "тематические", а некоторые по разным причинам не выбираются. Это ведь просто наблюдение там где удалось наблюдать, и применение метода там где обстоятельства позволили применить метод.

PS Я вообще против любые данные вслепую пихать в любые тесты. Даже если эксперимент был спланирован и проводился под контролем, и уж тем более когда это просто наблюдение. Сначала надо что то увидеть в данных и потом уже гонять все эти тесты подтверждая что удалось увидеть в данных. Тесты это не метод анализа, а метод подтверждения выдвинутых гипотез. Иначе простите минимум 5% выполненных изысканий (а на самом деле значительно больше поскольку и тестов и их вариантов применения к данным много больше) будет оканчиваться полным "успехом" даже если данные будет поставлять генератор случайных чисел.

Olga_
Цитата(Alex_Z @ 4.01.2012 - 21:43) *
Нет-нет, поверьте, я не сомневаюсь, что их существует множество и вы владете многими. Говорю абсолютно без иронии. Я лишь пытаюсь определиться с оптимальными необходимыми мне критериями. Просто я смотрю на таблицу в статье... Я бы тоже описал шкалы как среднее и СО. Если это применимо к дискретным шкалам. А количество баллов что по СОФА, что по АПАЧИ - это всегда целое число.

"renal SOFA score"
Я так понимаю, тут имеется в виду степень нарушения почечной функции, оцененная по концентрации креатинина в крови или диурезу. В зависимости от того, в какой интервал значений попадают показатели у больного, ему присваивается некое количество баллов (от 0 до 4). Вот ( http://criticare.chat.ru/s-003.html ) наглядный пример.


Я нашла сама, но надеялась, что вы сами поймете. У меня нагляднее ссылка, только написано по французски. http://www.outcomerea.org/index2.php?optio...&Itemid=122

ОК, renal SOFA score это уровень креатинина (непрерывные/continuous данные), которые сгруппировали в 4 возрастающие в зависимости от уровня креатинина группы, получились ordered categorical variables.

Для анализа они используют непрерывные данные (уровень креатинина), поэтому оценивают среднее значение.

Alex_Z
Но в этой же статье они оценивают не только баллы renal SOFA score, но и общие баллы SOFA и SAPS II. Да, я согласен, что в основе этих шкал лежит анализ непрерывных показателей (концентрации различных веществ и прочее), но когда мы "загоняем" эти показатели в шкалы, разве у нас не получаются дискретные переменные?
Olga_
Цитата(Alex_Z @ 4.01.2012 - 22:22) *
Но в этой же статье они оценивают не только баллы renal SOFA score, но и общие баллы SOFA и SAPS II. Да, я согласен, что в основе этих шкал лежит анализ непрерывных показателей (концентрации различных веществ и прочее), но когда мы "загоняем" эти показатели в шкалы, разве у нас не получаются дискретные переменные?


Нет. Непрерывные и дискретные данные относятся к числовым данным. Непрерывные переменные можно расположить на непрерывной шкале, примеры описаны выше.
Дискретные переменные могут иметь ограниченное количество величин и это целые числа, например, количество рожденных детей в год, количество эпизодов диарреи, количество госпитализаций и т.д.

Если мы данные естественно упорядочиваем, как например в СОФА или же социальный класс (высокий, средний, низкий), уровень образования, то этo ordered categorical variables.

Читайте правильные книжки
http://books.google.ch/books?id=txVquBd-5W...ics&f=false
Alex_Z
Спасибо, Ольга!
Буду изучать. Чем дальше в лес...
Olga_
П.С. Статьи приведенные в качестве примера не "золотой стандарт", эт просто свободные статьи с похожим исследованием из пабмеда.

Статья о которой мы так долго дискутировали, меня несколько смущает, а именно, анализ renal SOFA score.
Авторы и пишут, что Continuous data are presented as mean (SD) and categorical as number (%), unless otherwise indicated.

Неужели СОФА это непрерывные данные...

Рекомендую прочитать другие исследования используюшие шкалы СОФА и АПАЧИ, и посмотреть, как эти данные классифицированы.
Olga_
Вам уже дали хорошие рекомендации
http://forum.disser.ru/index.php?showtopic=2941

"Сами же шкалы (Apache II, SOFA, Ranson, SAPS) показали себя куда более слабыми предикторами: площадь под ROC-кривой для всех шкал была в диапазоне 0,69 - 0,75. Можете тоже сделать ROC-анализ, но если материала мало и задача прогноза не стоит - просто сравните доли летальных случаев в таблице сопряжённости."

Незнаю какое лечение вы исследуете, но меня, как врача интересовало бы влияние нового лечения на смертность/выживемость пациентов с сепсисом. Надеюсь, что при выборе первичной конечной точки (разница по шкалам СОФА и АПАЧЕ между группами пациентов), вы руковоствовались уже проведенными исследованиями...
Alex_Z
Да, ключевое значение, разумеется имеет именно выживаемость. Однако при применении экстракорпоральных методов детоксикации (в статьях) оценка динамики баллов по различным шкалам - весьма распространено. Причем как у нас, так и за рубежом. ПРичем, если достоверная динамика не прослеживается, то это тоже интересный результат. Если получается выявить фактор, котор влияет на динамику состояния, то это очень ценно. Признаюсь, раньше при чтении статей и особо не вчитывался, каким статистическим методом исследовалась динамика. Важны были выводы, к которым пришли авторы. Но по моему личному опыту, иностранцы, как правило, описывают баллы как среднее и СО. При этом динамика по шкалам совершенно не обязательно рассматривается как предиктор исхода. Само наличие или отсутствие ожидаемой динамики - уже важный факт....как мне кажется. При отсутствии динамики, можно задуматься о том, что, вероятно, есть неучтенный фактор в лечении конкретного больного.
Olga_
Вынудили меня все таки прочитать про СОФА, будет полезно и для вас тоже, включая указанных референтов в цитате

Mean- and max-score derivatives were introduced for SOFA by Moreno et al. [23] in 1999 and Ferreira et al. [24] in 2001. These methods were extended by Ceriani et al. [14] in 2003. ... However, it should be remembered that calculating the mean- and max-values adds some degree of selectivity to the model. The mean-derivative of a model reflects the overall average, whereas the max-derivative highlights the peak of organ dysfunction during the postoperative ICU stay;...
http://www.cardiothoracicsurgery.org/content/6/1/21


Теперь начнем с начала, проверяем нормальность непрерывных данных.
Что это значит, какую гипотезу тестируете по Колмогорову-Смирнову ?
"Странно, я думал, что параметрические критерии более чувствительны к тому, чтобы уловить различия между группами. Посчитал по Стьюденту, Манн-Уитни и Колмогорову-Смирнову по SPSS.
...
По Колмогорову-Смирнову еще интереснее:
Точка 1 р-0,74
Точка 2 р-0,011
Точка 3 р-0,000"
Вопрос скорее риторический. rolleyes.gif

Как проверить нормальность v SPSS http://statistics.laerd.com/spss-tutorials...-statistics.php



Alex_Z
У меня русский 17 SPSS. В разделе непараметрические статистики есть одновыборочный критерий Колмогорова-Смирнова. Там можно поставить галочку "проверяемое распределение" (нормальное).
Им и проверял нормальность. Нулевая гипотеза - выборка соответствует нормальному закону, альтернативная - нет. А ссылка по SPSS интересная, спасибо. У меня по SPSS книга Наследова.

А для сравнения различий между двумя выборками (ненормальное распределение) я использовал Z-Колмогорова-Смирнова. Так в русском SPSS.

Olga_
Цитата(Alex_Z @ 5.01.2012 - 18:47) *
У меня русский 17 SPSS. В разделе непараметрические статистики есть одновыборочный критерий Колмогорова-Смирнова. Там можно поставить галочку "проверяемое распределение" (нормальное).
Им и проверял нормальность. Нулевая гипотеза - выборка соответствует нормальному закону, альтернативная - нет. А ссылка по SPSS интересная, спасибо. У меня по SPSS книга Наследова.

А для сравнения различий между двумя выборками (ненормальное распределение) я использовал Z-Колмогорова-Смирнова. Так в русском SPSS.



С СПСС никогда не работала, книг по статистике на русском тоже не читала.
В Стате, с которой я в основном работаю, К-С тест используется, чтобы определить, подчиняются ли две выборки одному закону (two-sample), либо определить, подчиняется ли полученное распределение данных референтному распределению (one-sample).

Касательно статистического анализа шкал, как я понимаю, данные распределены не нормально. Непараметрического метода для повторных измерений, да еще с анализом подгрупп, я не знаю. Здесь возможно использование linear mixed-effects model. Подробно напишу позднее.
Olga_
Если будете сравнивать только среднее значение без анализа подгрупп (кстати, в РКИ не рекомедуют увлекаться детальным анализом подгрупп, который должен быть ограничен только теми переменными, которые являются строгими предикторами исхода), есть непараметрическая альтернатива repeated measures ANOVA - Friedman`s test.

Или же лог трансформация с последующим использованием параметрических тестов.


Alex_Z
Я так понимаю это хи-квадрат тест Фридмана - непараметрический аналог ANOVA?

SPSS считает только "общее" различие. А попарного сравнения как в post hoc тестах не делает... Чтобы узнать достоверность различий 1-2, 2-3, 1-3 групп можнол потом сравнить их просто попарно?
Olga_
Цитата(Alex_Z @ 7.01.2012 - 16:04) *
Я так понимаю это хи-квадрат тест Фридмана - непараметрический аналог ANOVA?

SPSS считает только "общее" различие. А попарного сравнения как в post hoc тестах не делает... Чтобы узнать достоверность различий 1-2, 2-3, 1-3 групп можнол потом сравнить их просто попарно?


АЛех, хочу сразу предупредить, что в фармации не работала, поэтому особенности статанализа КИ не знаю. Если данные распределены не нормально или различное СО, то обычно проводится лог трансформация данных. В КИ, которые я просмотрела используют всегда непараметрические методы, с чем это связано было бы интересно узнать.

Что же делают в таких случаях как ваш

"The Friedman test was used to determine differences in CRP and IL-6 concentrations between periods. If the overall P value obtained from the Friedman test was < 0.05, then post hoc pairwise comparisons were done with the use of Wilcoxon?s signed-rank test and the Mann-Whitney U test."

Или
For nonparametric variables (vasoactive drugs requirements and alanine transaminase levels) we used the Kruskal-Wallis test for
comparison within groups and the Mann-Whitney U test with Bonferroni?s adjustment for comparisons between pairs. Differences between groups were analyzed by linear mixed-effects models to consider death-related dropouts.
http://www.ncbi.nlm.nih.gov/pubmed/17019548
Alex_Z
"The Friedman test was used to determine differences in CRP and IL-6 concentrations between periods. If the overall P value obtained from the Friedman test was < 0.05, then post hoc pairwise comparisons were done with the use of Wilcoxon?s signed-rank test and the Mann-Whitney U test."

Спасибо! То, что нужно. Но вот интересно, эти авторы (первая цитата) в post hoc тестах учитывали поправку Бонферрони?


Сейчас смотрю статьи по сепсису. У меня их ооооочень много уже. В подавляющем большинстве случаев, авторы описывают баллы как среднее и СО. При этом практически везде (в источниках по статистике) пишут, что по нормально распределенные данные - это только непрерывные. Странно.





nokh
Цитата(Alex_Z @ 7.01.2012 - 22:18) *
Спасибо! То, что нужно. Но вот интересно, эти авторы (первая цитата) в post hoc тестах учитывали поправку Бонферрони?
Сейчас смотрю статьи по сепсису. У меня их ооооочень много уже. В подавляющем большинстве случаев, авторы описывают баллы как среднее и СО. При этом практически везде (в источниках по статистике) пишут, что по нормально распределенные данные - это только непрерывные. Странно.

Методы апостериорных (post hoc) сравнений специально разрабатывались для апостериорных сравнений, а потому никакие поправки не нужны. Тем более такие консервативные как Бонферрони. Для меня, как читателя, наличие в публикации поправки Бонферрони указывает на неспособность автора грамотно обсчитать свои данные. (1) Если речь идёт о задаче сравнения выборок по каким-то мерам положения, то поправку используют обычно так: сравнивают группы попарно и вводят поправку. А это вообще концептуально неверно. Если групп несколько, то нужно использовать омнибусные тесты, которые на выбранном уровне значимости проверяют сразу несколько простых гипотез. Т.е. в рамках параметрического подхода - дисперсионный анализ, в рамках непараметрического - анализ Краскела - Уоллиса. Если омнибусный тест не показывает межгрупповых различий - нечего дальше и ковыряться. Если показывает - тогда далее разбираемся за счёт каких групп или их сочетаний в ходе апостериорных сравнений специальными тестами. Бонферрони предложил один из таких тестов, но это не то, что называют поправкой Бонферрони. Получается в грамотном анализе никакой поправке места нет. (2) Если речь идёт о корреляционном анализе, когда корреляций так много, что некоторые случайные связи могут показаться достоверными, то и здесь поправка Бонферрони - не тонкий статистический инструмент, а кувалда, которая сносит напрочь любые тонкие и, как правило, самые интересные связи, оставляя лишь те, которые всем уже давно известны. Недостаточно квалифицированному исследователю только этого и надо: вместо кучи статистически значимых связей, которые сложно интерпретировать остаются лишь несколько примитивных, которые легко обсуждать. Грамотный же анализ связей переводит задачу в многомерную плоскость, где (а) ординационными техниками находят главные компоненты, координаты или факторы, (б) интерпретируют их, (в) проверяют полученное решение на устойчивость (г) классифицируют или сравнивают объекты по полученным шкалам. И здесь также нет места поправке Бонферрони.

Поэтому все статьи, где группы сравнивали дисперсионным анализом, а попарные различия искали t-критерием Стьюдента сразу бракуйте как некорректные. Аналогично, те где после Краскела-Уоллиса делели попарные сравнения по Манну-Уитни - бракуйте. Также отсейте статьи, где как вы считаете статистический анализ не делался или вы не поняли, что делали авторы: если у человека в голове порядок, то он и пишет понятно (справедливо обратное). В разных областях ситуация разнится, но мой личный опыт позволяет предположить, что останется порядка 20% статей. На них и равняйтесь: что дают в таблицах, а что на графиках; как выстраивают структуру доказательств, на что ссылаются. Ещё около 5-10% будут статьи в которых используются какие-то нетрадиционные подходы: они просто выбиваются из общего хора - такие можно отложить почитать на ближайшее после защиты будущее.

Распространённых непараметрических аналогов двухфакторному ДА с повторными измерениями нет. Фридман или Квейд всё огрубят, кроме того в пакетах почти не встречается тестов для ранговых апостериорных сравнений: Коновера-Инмана, Стила-Двасса, Немени (более известного как тест Шайха-Хамерли). Я бы всё же считал ДА. К тому же выборки не нужно проверять на нормальность: ДА требует, чтобы нормально была распределена ошибка анализа, а как это прикинуть в вашем случае я уже писал.
Alex_Z
"Если омнибусный тест не показывает межгрупповых различий - нечего дальше и ковыряться. Если показывает - тогда далее разбираемся за счёт каких групп или их сочетаний в ходе апостериорных сравнений специальными тестами."

Какими например (если можно, то применительно к SPSS)? Шеффе, Тьюки?

И, если позволите, еще пару вопросов. 1. Если Краскел-Уоллис (или Фридман) не нашел различий, а ДА нашел (или наоборот) что делать, кому верить? 2. Однофакторный ДА применим, когда сравниваются 3-4 связанные выборки?
Olga_
Цитата(nokh @ 7.01.2012 - 19:17) *
Распространённых непараметрических аналогов двухфакторному ДА с повторными измерениями нет. Фридман или Квейд всё огрубят, кроме того в пакетах почти не встречается тестов для ранговых апостериорных сравнений: Коновера-Инмана, Стила-Двасса, Немени (более известного как тест Шайха-Хамерли). Я бы всё же считал ДА. К тому же выборки не нужно проверять на нормальность: ДА требует, чтобы нормально была распределена ошибка анализа, а как это прикинуть в вашем случае я уже писал.
eek.gif

В книгах по статистике всегда написано, что Two-way anova, like all anovas, assumes that the observations are normally distributed and have equal variances.



100$
-> Nokh, а у Вас совершенно случайно нет ссылочки на тест Неменьи (63 г) с таблицей критических значений при N>25? А то что-то попадаются только до 25 включительно.
Olga_
Цитата(Olga_ @ 7.01.2012 - 20:05) *
eek.gif

В книгах по статистике всегда написано, что Two-way anova, like all anovas, assumes that the observations are normally distributed and have equal variances.


Проводили ли вы лог трансформацию данных для анализа в АНОВА? Если нет, то сравнение некорректно.
Про шкалы прочитайте, пожалуйста, самостоятельно (см. пост34)

В опубликованных КИ очень кратко описан алгоритм статистического анализа, поэтому, чтобы понять почему был использован тот или иной метод,нужно быть уже подготовленным пользователем. Читайте книги, просматривайте референтов в статье и, конечно, гугл всегда поможет))

Я бы порекомендовал вам прочитать следующую книгу
http://books.google.ch/books?id=LEDJ-6bPa8...hoc&f=false

Просмотрите Statistical Principles for Clinical Trials, здесь информация в основном общая информация
http://www.emea.europa.eu/docs/en_GB/docum...WC500002928.pdf

П.С. Since version 18 SPSS provides comparable post-hoc tests by default. Найдите 18 версию)
http://timo.gnambs.at/en/scripts/friedmanposthoc
p2004r
Я иногда заглядывал в википедию (на редкость вменяемое описание статмоделирования касающегося DA)
http://en.wikipedia.org/wiki/Analysis_of_v...ptions_of_ANOVA

1) требуется именно нормальность _остатков_ (the distributions of the residuals are normal.) что крайне логично.

2) вот остальные требования куда более существенны, это "Randomization-based analysis". в случае наблюдениея -- "In practice, the estimates of treatment-effects from observational studies generally are often inconsistent. In practice, "statistical models" and observational data are useful for suggesting hypotheses that should be treated very cautiously by the public."

Главное в обсуждаемом наблюдении, то что из логики последующие результаты явно зависимы от предыдущих. И надо анализировать данные а не считать в слепую модели. Никакого эксперимента управляемого в случае наблюдения нет, а значит нет и структуры модели параметры которой надо определить.
Olga_
Цитата(p2004r @ 8.01.2012 - 10:43) *
Я иногда заглядывал в википедию (на редкость вменяемое описание статмоделирования касающегося DA)
http://en.wikipedia.org/wiki/Analysis_of_v...ptions_of_ANOVA

1) требуется именно нормальность _остатков_ (the distributions of the residuals are normal.) что крайне логично.

2) вот остальные требования куда более существенны, это "Randomization-based analysis". в случае наблюдениея -- "In practice, the estimates of treatment-effects from observational studies generally are often inconsistent. In practice, "statistical models" and observational data are useful for suggesting hypotheses that should be treated very cautiously by the public."

Главное в обсуждаемом наблюдении, то что из логики последующие результаты явно зависимы от предыдущих. И надо анализировать данные а не считать в слепую модели. Никакого эксперимента управляемого в случае наблюдения нет, а значит нет и структуры модели параметры которой надо определить.


Я обычно читаю лекции по биостатистике, рекомендованные книги и статьи. wink.gif

Из той же вики
Assumptions to use two-way anova

Just like other parametric test, we make the following assumptions when using two-way ANOVA:

?The populations from which the samples are obtained must be normally distributed.

?Sampling is done correctly. Observations for within and between groups must be independent.

?The variances among populations must be equal (homogeneity).

?Data are interval or nominal

или же
The results of a one-way ANOVA can be considered reliable as long as the following assumptions are met:
Response variable must be normally distributed (or approximately normally distributed).
Samples are independent.
Variances of populations are equal.
Responses for a given group are independent and identically distributed normal random variables (not a simple random sample (SRS)).

ANOVA is a relatively robust procedure with respect to violations of the normality assumption[3]. If data are ordinal, a non-parametric alternative to this test should be used such as Kruskal-Wallis one-way analysis of variance.

Будем продолжать дальше цитировать вики...

То что данные зависимые это уже давно обсуждается в ходе нашей дискуссии.

А здесь я вас вообще не понимаю))
"И надо анализировать данные а не считать в слепую модели. Никакого эксперимента управляемого в случае наблюдения нет, а значит нет и структуры модели параметры которой надо определить. "
p2004r
Цитата(Olga_ @ 8.01.2012 - 16:30) *
Я обычно читаю лекции по биостатистике, рекомендованные книги и статьи. wink.gif

.................

Будем продолжать дальше цитировать вики...

То что данные зависимые это уже давно обсуждается в ходе нашей дискуссии.

А здесь я вас вообще не понимаю))
"И надо анализировать данные а не считать в слепую модели. Никакого эксперимента управляемого в случае наблюдения нет, а значит нет и структуры модели параметры которой надо определить. "



В той же вики которую цитируем --- помимо требования равенства вариации выборок, независимости случаев и нормальности остатков четко прописано когда имеет смысл ANOVA. Это случай управляемого эксперимента, а для наблюдения (тем более не полного а с неведомой цензурой) смысла подгонять модель нет. Иначе тут мы танцуем получается, а тут уже не танцуем? Какие то ограничения принципиальны, а вторые нет? smile.gif

С нормальностью данных тут вообще смешная ситуация. Вы очевидно считаете первичными группы, но на самом деле первичны факторы, в случае мало мальски сложного дизайна эксперимента это очевидно. Отсюда требование нормальности данных, хотя на самом деле требуется нормальность отклонения от эффекта (в простейшем случае средней для сочетания уровней факторов в модели эти требования эквивалентны). Не понимаю почему это может быть не понятно?

Посмотрел в инете кучу руководств по ANOVA и везде пишут об остатках. Вот например типичное
http://isogenic.info/html/the_anova.html

Assumptions
The ANOVA and Student's t-test are so-called "parametric" tests. They depend on the assumptions 1) that the observations are independent, 2) that the residuals (deviations from group means) have a normal distribution, 3) the variation is the same in each group. These last two assumptions should always be examined by studying the "residuals", i.e. deviations from group means.
p2004r
Цитата(Olga_ @ 8.01.2012 - 16:30) *
То что данные зависимые это уже давно обсуждается в ходе нашей дискуссии.


А чего тут обсуждать то? В данном наблюдении дизайн можно описать только в рамках Mixed-effects models. Имеет место три фактора: пациент, время и вид лечения.

Вот руководство http://lme4.r-forge.r-project.org/book/ пакета lme.
nokh
Цитата(Alex_Z @ 7.01.2012 - 23:30) *
"Если омнибусный тест не показывает межгрупповых различий - нечего дальше и ковыряться. Если показывает - тогда далее разбираемся за счёт каких групп или их сочетаний в ходе апостериорных сравнений специальными тестами."
Какими например (если можно, то применительно к SPSS)? Шеффе, Тьюки?

Читайте внимательнее то, что я уже вам разложил в соседней теме по ДА. Ну и книги.
Цитата(Alex_Z @ 7.01.2012 - 23:30) *
И, если позволите, еще пару вопросов. 1. Если Краскел-Уоллис (или Фридман) не нашел различий, а ДА нашел (или наоборот) что делать, кому верить? 2. Однофакторный ДА применим, когда сравниваются 3-4 связанные выборки?

1. Любой статистический метод - это определённая математическая модель, которую мы пытаемся приспособить для анализа конкретных данных. Соответственно верить нужно той модели, которая лучше приспособлена для анализа таких данных. Если выборки извлечены из генеральных совокупностей (ГС) с нормальным распределением, то Краскел-Уоллис только на 5% уступает в мощности однофакторному ДА, т.е. на практике почти всегда приводит к таким-же выводам. Если же анализируются выборки из ГС с ненормальными, но однотипными распределениями, то "верить нужно" К_У.
2. Это будет уже однофакторный ДА с повторными измерениями, т.е. по сути смешанная модель двухфакторного анализа с фиксированным фактором "Группа" и случайным "Индивид внутри Группы".
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.