Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Межгрупповой анализ при наличии повторных измерений (ординальная шкала), Выбор критерия
ivan
сообщение 26.08.2010 - 12:03
Сообщение #1





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



Посоветуйте, пожалуйста, как подступиться к статистическому анализу следующего эксперимента.
В эксперименте на мышах необходимо сравнить эффективность двух препаратов при лечении интоксикации, для которой характерно поражение центральной нервной системы. Исследование проводится на четырех группах мышей (восемь мышей в каждой группе):
1-я группа - интактные животные;
2-я группа - животные с интоксикацией без лечения
3-я группа - животные с интоксикацией, лечение препаратом А;
4-я группа - животные с интоксикацией, лечение препаратом Б.
Одним из признаков интоксикации у мышей является нарушение двигательной активности. Двигательная активность каждого животного в группах оценивается по балльной шкале от 0 до 5 (целые числа). Оценка неврологического дефицита проводится через каждые 48 часов в течение 20 дней.
Для описания данных буду рассчитывать медиану и межквартильный размах.
Далее необходимо оценить статистическую значимость различий неврологического дефицита между группами больных животных (т. е. нужно сравнить 2-ю группу с 3-й, 2-ю с 4-й и 3-ю с 4-й), а также между группой здоровых животных и группами больных животных (т. е. 2, 3 и 4-я группа по отдельности сравнивается с 1-й).
Подскажите, пожалуйста, какими критериями мне нужно воспользоваться для проведения этих сравнений???
Сравнивать медианы в разные дни наблюдения внутри группы можно с помощью критерия Фридмана, на сколько я понимаю. Но как быть с межгрупповыми сравнениями?

Сообщение отредактировал ivan - 26.08.2010 - 15:04
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
liptin
сообщение 27.08.2010 - 18:56
Сообщение #2





Группа: Пользователи
Сообщений: 5
Регистрация: 22.08.2010
Из: москва
Пользователь №: 22692



Я конечно "только учусь" но почему бы здесь не попробовать сравнение двух не зависимых групп по критерию Манна-Уитни (т.к. скорее всего это непараметрическая статистика в вашем случае) вот может пригодится http://narod.ru/disk/24167267000/rebrova2002.djv.html надеюсь с использованием дэжавю проблем нет, лично мне понравилось такое и подобное считать в СТАТИСТИКЕ
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 27.08.2010 - 20:08
Сообщение #3





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



К сожалению, критерий Манна-Уитни здесь не подойдет. Этот критерий позволяет сравнивать медианы двух несвязанных выборок, а у меня сразу четыре группы, к тому же наблюдения не однократные а в динамике... Думал про критерий Фридмана, но он позволяет анализировать в динамике каждую из четырех групп, но по отдельности, т. е. с его помощью нельзя проводить сравнения групп между собой, на сколько я понимаю. Нужно еще что-то придумать...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 27.08.2010 - 21:31
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(ivan @ 26.08.2010 - 11:03) *
Посоветуйте, пожалуйста, как подступиться к статистическому анализу следующего эксперимента.
В эксперименте на мышах необходимо сравнить эффективность двух препаратов при лечении интоксикации, для которой характерно поражение центральной нервной системы. Исследование проводится на четырех группах мышей (восемь мышей в каждой группе):
1-я группа - интактные животные;
2-я группа - животные с интоксикацией без лечения
3-я группа - животные с интоксикацией, лечение препаратом А;
4-я группа - животные с интоксикацией, лечение препаратом Б.
Одним из признаков интоксикации у мышей является нарушение двигательной активности. Двигательная активность каждого животного в группах оценивается по балльной шкале от 0 до 5 (целые числа). Оценка неврологического дефицита проводится через каждые 48 часов в течение 20 дней.


А почему не применима какая либо разновидность ANOVA?


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 27.08.2010 - 21:40
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(ivan @ 27.08.2010 - 23:08) *
К сожалению, критерий Манна-Уитни здесь не подойдет. Этот критерий позволяет сравнивать медианы двух несвязанных выборок, а у меня сразу четыре группы, к тому же наблюдения не однократные а в динамике... Думал про критерий Фридмана, но он позволяет анализировать в динамике каждую из четырех групп, но по отдельности, т. е. с его помощью нельзя проводить сравнения групп между собой, на сколько я понимаю. Нужно еще что-то придумать...

Такие сложные эксперименты эффективно непараметрикой не обсчитать. Нужно использовать дисперсионный анализ (ДА). В вашем случае трёхфакторный перекрёстно-иерархический ДА с факторами: Группа, Животное внутри Группы и Срок (=двухфакторный ДА с повторными измерениями). А после анализа отвечать на интересующие вопросы в ходе сравнений внутри дисперсионного комплекса. То, что в анализе используются баллы - не критично, ведь всё равно оценка по шестибальной шкале - это количественный признак, а не качественный (да и средний балл выглядит куда привлекательнее медианы, разве что если распределение очень скошенное). После анализа посмотрите распределение ошибки - если оно нормальное - никаких проблем, ненормальное - нужно нормальзовать.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 28.08.2010 - 08:59
Сообщение #6





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



Как провести двухфакторный ДА с повторными измерениями, я представляю. Но меня по-прежнему очень смущает то, что данные в баллах. Во всех имеющихся у меня учебниках по статистике написано, что если измерения сделаны в ординальной шкале, то данные необходимо описывать с помощью медианы, квартилей и т. д. и анализировать их нужно непараметрикой... nokh, скажите, пожалуйста, можно ли сослаться на какой-то учебник, в котором приводится пример ДА именно балльных данных. В статьях, конечно, такое проделывают сплошь и рядом, но опираться на них как на надежный источник, сами понимаете, нельзя. А не подкрепившись мнением авторитетного автора, я парировать не смогу.

Сообщение отредактировал ivan - 28.08.2010 - 11:05
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 28.08.2010 - 12:30
Сообщение #7





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



Если мы обрабатываем результаты параметрикой, то появляется средний балл... В конце концов, высчитывают же средний балл успеваемости студентов, и никого это не смущает! Выходит, что такой подход тоже оправдан... Только вот кем или чем? Здравым смыслом? Ссылка на авторитетный справочник не повредила бы...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 29.08.2010 - 14:27
Сообщение #8





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(ivan @ 28.08.2010 - 07:59) *
Как провести двухфакторный ДА с повторными измерениями, я представляю. Но меня по-прежнему очень смущает то, что данные в баллах. Во всех имеющихся у меня учебниках по статистике написано, что если измерения сделаны в ординальной шкале, то данные необходимо описывать с помощью медианы, квартилей и т. д. и анализировать их нужно непараметрикой... nokh, скажите, пожалуйста, можно ли сослаться на какой-то учебник, в котором приводится пример ДА именно балльных данных. В статьях, конечно, такое проделывают сплошь и рядом, но опираться на них как на надежный источник, сами понимаете, нельзя. А не подкрепившись мнением авторитетного автора, я парировать не смогу.


"Generalized linear modeling is a development of linear models to accommodate both non-normal response distributions and transformations to linearity in a clean and straightforward way. "

скорее всего подойдет glm(y~x,binomial), но надежнее выбрать quasi.

Или подойдет
"Generalized additive models (GAMs) are like GLMs in that they can have different error
structures and different link functions to deal with count data or proportion data. What makes
them different is that the shape of the relationship between y and a continuous variable x
is not specified by some explicit functional form. Instead, non-parametric smoothers are
used to describe the relationship. This is especially useful for relationships that exhibit
complicated shapes, such as hump-shaped curves (see p. 666). The model looks just like a
GLM, except that the relationships we want to be smoothed are prefixed by s: thus, if we had
a three-variable multiple regression (with three continuous explanatory variables w, x and
z) on count data and we wanted to smooth all three explanatory variables, we would write:
model<-gam(y~s(w)+s(x)+s(z),poisson)
These are hierarchical models, so the inclusion of a high-order interaction (such as A:B:C)
necessarily implies the inclusion of all the lower-order terms marginal to it (i.e. A:B, A:C
and B:C, along with main effects for A, B and C)."

R book есть на либрусеке


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 29.08.2010 - 14:32
Сообщение #9





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



Выкладываю интересную статью (Phytopathology 2004; 94: 33-43), в которой приводится пример трёхфакторного анализа (двухфакторного с повторными измерениями) с использованием непараметрических методов. К сожалению, моё образование не позволяет в полной мере оценить этот материал, поэтому надеюсь на комментарии специалистов. )))
Прикрепленные файлы
Прикрепленный файл  Phytopathology_2004_94_33.pdf ( 240,58 килобайт ) Кол-во скачиваний: 436
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 29.08.2010 - 14:57
Сообщение #10





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(ivan @ 29.08.2010 - 13:32) *
Выкладываю интересную статью (Phytopathology 2004; 94: 33-43), в которой приводится пример трёхфакторного анализа (двухфакторного с повторными измерениями) с использованием непараметрических методов. К сожалению, моё образование не позволяет в полной мере оценить этот материал, поэтому надеюсь на комментарии специалистов. )))


Ни в коем случае не считаю себя специалистом smile.gif. Но в конце статьи они и обсуждают возможность использования вариантов ANOVA.



Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
ivan
сообщение 29.08.2010 - 16:14
Сообщение #11





Группа: Пользователи
Сообщений: 23
Регистрация: 20.05.2007
Пользователь №: 4112



А в этой статье (Am Stat 1993; 47: 65-72) как раз критикуется обязательное использование только непараметрических методов при обработке порядковых данных. Тоже весьма любопытно. ))
Прикрепленные файлы
Прикрепленный файл  Am_Stat_1993_47_65.pdf ( 1,81 мегабайт ) Кол-во скачиваний: 401
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 29.08.2010 - 17:57
Сообщение #12





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Да, вопрос оказался, что говорится - на засыпку. Решив, что уж психологи и социологи, которые главным образом и работают с баллами что-то дельное по этому поводу написали, взялся за б/м авторитетную литературу в этой области. И ничего не нашёл. Везде одно: порядковые признаки вместе с качественными для ANOVA не годятся. Хотя, действительно, и считают так, и интуитивно понятно, что если у порядкового признака 3 градации - он почти что качественный, а если 30 - почти что количественный. Но границу пока нигде не нашёл. Можно, конечно, сделать и какой-нибудь логлинейный анализ с повторными измерениями для шестибальной шкалы (как вариант Generalized LM) - но это уже явно перебор. К тому же будет существенная потеря в мощности, т.к. классы будут обрабатываться как номинальные категории, без учёта упорядоченности - а тогда чем это лучше чем несколько простых парных тестов? На статью в Phytopathology тоже наткнулся, в ней есть ряд полезных ссылок в Обсуждении. Но раз авторы освоили более грамотную технику, естественно, что остальное они более или менее активно, но критикуют. Особенно критикуют эту уже классическую работу, в которой предлагается вообще во всех параметрических методах использовать ранги: http://www.biostat.mcg.edu/journalclub/Conover_Iman1981.pdf . Жизнь показывает, что чтобы метод прижился у практиков нужно 15-20 лет. Может через 10 лет все так и будут считать как в Phytopathology, может раньше (если его в SPSS/PASW включат). А пока что, действительно, нужно просто найти на что сослаться. Будем искать дальше.

Сообщение отредактировал nokh - 29.08.2010 - 18:13
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 29.08.2010 - 19:36
Сообщение #13





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Мне понравилась статья в Phytopathology именно тем, что это не статья по фитопатологии, а именно письмо в редакцию с целью раскрыть возможности анализа при подобных дизайнах. А такие задачи приходится решать довольно часто. Конечно, к этому нужно стремиться. Вряд ли могут существовать авторитетные источники, которые будут демонстрировать примеры при нарушении условий применимости ДА. Но в дискуссии в этой статье перечислены 4 варианта, которые используются и имеют право быть. Да, авторы продемонстрировали работу макроса SAS, но на сегодняшний день мало кто в ближнем окружении может это сделать (наш модератор). Но первый из 4 вариантов ? это игнорирование проблем ординальной шкалы и это вполне допускается в социологии, где используются рейтинговые оценки.
Рекомендация Nokh, использовать ДА для этих данных, скорее всего исходит, действительно, из здравого смысла, красоты графического решения и доступности программной реализации. Я бы тоже использовала ДА, но не для любой аудитории, а для собственного (внутреннего) употребления. Графически представить 4 группы в 10 временных точках. Посмотреть все интересующие различия, ведь не все они нужны. А затем, заменить на графике средние баллы медианами и ДИ к ним (AtteStat , по моему, их считает). Авторы статьи ограничились медианами интересующих групп на графике, проранжировали их, но это не обязательно, легенда групп будет на рисунке. А различия медиан доказать соответствующими непараметрическими тестами, конечно с учетом множественных сравнений. Как правило, те парные различия, которые в post hoc ANOVA были значимы, также будут значимы.

P.S. Ищу тоже нужные ссылки, много хороших англоязычных книг. Много примеров различных дизайнов ANOVA в "Biostatistics. A Metodology for the Health Sciences" 2004 года
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 31.08.2010 - 11:55
Сообщение #14





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(DrgLena @ 29.08.2010 - 20:36) *
Мне понравилась статья в Phytopathology именно тем, что это не статья по фитопатологии, а именно письмо в редакцию с целью раскрыть возможности анализа при подобных дизайнах. А такие задачи приходится решать довольно часто. Конечно, к этому нужно стремиться. Вряд ли могут существовать авторитетные источники, которые будут демонстрировать примеры при нарушении условий применимости ДА. Но в дискуссии в этой статье перечислены 4 варианта, которые используются и имеют право быть. Да, авторы продемонстрировали работу макроса SAS, но на сегодняшний день мало кто в ближнем окружении может это сделать (наш модератор). Но первый из 4 вариантов ? это игнорирование проблем ординальной шкалы и это вполне допускается в социологии, где используются рейтинговые оценки.
Рекомендация Nokh, использовать ДА для этих данных, скорее всего исходит, действительно, из здравого смысла, красоты графического решения и доступности программной реализации. Я бы тоже использовала ДА, но не для любой аудитории, а для собственного (внутреннего) употребления. Графически представить 4 группы в 10 временных точках. Посмотреть все интересующие различия, ведь не все они нужны. А затем, заменить на графике средние баллы медианами и ДИ к ним (AtteStat , по моему, их считает). Авторы статьи ограничились медианами интересующих групп на графике, проранжировали их, но это не обязательно, легенда групп будет на рисунке. А различия медиан доказать соответствующими непараметрическими тестами, конечно с учетом множественных сравнений. Как правило, те парные различия, которые в post hoc ANOVA были значимы, также будут значимы.

P.S. Ищу тоже нужные ссылки, много хороших англоязычных книг. Много примеров различных дизайнов ANOVA в "Biostatistics. A Metodology for the Health Sciences" 2004 года


Проблема ординальной шкалы двоякая - (1) дисперсия (точнее ее оценка) и (2) скошенность (эффект потолка и пола). Соответственно, если у Вас много данных, то проблема (1) частично решается, если средний балл около 3,5, то частично решается проблема (2). Отсюда вывод - если выполняются эти два условия, может использовать параметрический ДА с повторными измерениями. Если скошенность есть, то используется либо GEE, либо модель пропорциональных шансов (вариант логистической регрессии для упорядоченных данных). Детали можно посмотреть, например здесь http://www.lexjansen.com/pharmasug/2006/st...netics/sp08.pdf

P.S. Только вот рисовать медианы, используя обычный ДА нельзя - это фактически обман, поскольку сравниваются средние, насчет медиан Вы ничего не знаете.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 31.08.2010 - 12:35
Сообщение #15





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Я предложила рисовать медианы и ДИ к НИМ и сравнивать медианы.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему