Межгрупповой анализ при наличии повторных измерений (ординальная шкала), Выбор критерия |
Здравствуйте, гость ( Вход | Регистрация )
Межгрупповой анализ при наличии повторных измерений (ординальная шкала), Выбор критерия |
26.08.2010 - 12:03
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 23 Регистрация: 20.05.2007 Пользователь №: 4112 |
Посоветуйте, пожалуйста, как подступиться к статистическому анализу следующего эксперимента.
В эксперименте на мышах необходимо сравнить эффективность двух препаратов при лечении интоксикации, для которой характерно поражение центральной нервной системы. Исследование проводится на четырех группах мышей (восемь мышей в каждой группе): 1-я группа - интактные животные; 2-я группа - животные с интоксикацией без лечения 3-я группа - животные с интоксикацией, лечение препаратом А; 4-я группа - животные с интоксикацией, лечение препаратом Б. Одним из признаков интоксикации у мышей является нарушение двигательной активности. Двигательная активность каждого животного в группах оценивается по балльной шкале от 0 до 5 (целые числа). Оценка неврологического дефицита проводится через каждые 48 часов в течение 20 дней. Для описания данных буду рассчитывать медиану и межквартильный размах. Далее необходимо оценить статистическую значимость различий неврологического дефицита между группами больных животных (т. е. нужно сравнить 2-ю группу с 3-й, 2-ю с 4-й и 3-ю с 4-й), а также между группой здоровых животных и группами больных животных (т. е. 2, 3 и 4-я группа по отдельности сравнивается с 1-й). Подскажите, пожалуйста, какими критериями мне нужно воспользоваться для проведения этих сравнений??? Сравнивать медианы в разные дни наблюдения внутри группы можно с помощью критерия Фридмана, на сколько я понимаю. Но как быть с межгрупповыми сравнениями? Сообщение отредактировал ivan - 26.08.2010 - 15:04 |
|
27.08.2010 - 18:56
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 22.08.2010 Из: москва Пользователь №: 22692 |
Я конечно "только учусь" но почему бы здесь не попробовать сравнение двух не зависимых групп по критерию Манна-Уитни (т.к. скорее всего это непараметрическая статистика в вашем случае) вот может пригодится http://narod.ru/disk/24167267000/rebrova2002.djv.html надеюсь с использованием дэжавю проблем нет, лично мне понравилось такое и подобное считать в СТАТИСТИКЕ
|
|
27.08.2010 - 20:08
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 23 Регистрация: 20.05.2007 Пользователь №: 4112 |
К сожалению, критерий Манна-Уитни здесь не подойдет. Этот критерий позволяет сравнивать медианы двух несвязанных выборок, а у меня сразу четыре группы, к тому же наблюдения не однократные а в динамике... Думал про критерий Фридмана, но он позволяет анализировать в динамике каждую из четырех групп, но по отдельности, т. е. с его помощью нельзя проводить сравнения групп между собой, на сколько я понимаю. Нужно еще что-то придумать...
|
|
27.08.2010 - 21:31
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Посоветуйте, пожалуйста, как подступиться к статистическому анализу следующего эксперимента. В эксперименте на мышах необходимо сравнить эффективность двух препаратов при лечении интоксикации, для которой характерно поражение центральной нервной системы. Исследование проводится на четырех группах мышей (восемь мышей в каждой группе): 1-я группа - интактные животные; 2-я группа - животные с интоксикацией без лечения 3-я группа - животные с интоксикацией, лечение препаратом А; 4-я группа - животные с интоксикацией, лечение препаратом Б. Одним из признаков интоксикации у мышей является нарушение двигательной активности. Двигательная активность каждого животного в группах оценивается по балльной шкале от 0 до 5 (целые числа). Оценка неврологического дефицита проводится через каждые 48 часов в течение 20 дней. А почему не применима какая либо разновидность ANOVA? |
|
27.08.2010 - 21:40
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
К сожалению, критерий Манна-Уитни здесь не подойдет. Этот критерий позволяет сравнивать медианы двух несвязанных выборок, а у меня сразу четыре группы, к тому же наблюдения не однократные а в динамике... Думал про критерий Фридмана, но он позволяет анализировать в динамике каждую из четырех групп, но по отдельности, т. е. с его помощью нельзя проводить сравнения групп между собой, на сколько я понимаю. Нужно еще что-то придумать... Такие сложные эксперименты эффективно непараметрикой не обсчитать. Нужно использовать дисперсионный анализ (ДА). В вашем случае трёхфакторный перекрёстно-иерархический ДА с факторами: Группа, Животное внутри Группы и Срок (=двухфакторный ДА с повторными измерениями). А после анализа отвечать на интересующие вопросы в ходе сравнений внутри дисперсионного комплекса. То, что в анализе используются баллы - не критично, ведь всё равно оценка по шестибальной шкале - это количественный признак, а не качественный (да и средний балл выглядит куда привлекательнее медианы, разве что если распределение очень скошенное). После анализа посмотрите распределение ошибки - если оно нормальное - никаких проблем, ненормальное - нужно нормальзовать. |
|
28.08.2010 - 08:59
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 23 Регистрация: 20.05.2007 Пользователь №: 4112 |
Как провести двухфакторный ДА с повторными измерениями, я представляю. Но меня по-прежнему очень смущает то, что данные в баллах. Во всех имеющихся у меня учебниках по статистике написано, что если измерения сделаны в ординальной шкале, то данные необходимо описывать с помощью медианы, квартилей и т. д. и анализировать их нужно непараметрикой... nokh, скажите, пожалуйста, можно ли сослаться на какой-то учебник, в котором приводится пример ДА именно балльных данных. В статьях, конечно, такое проделывают сплошь и рядом, но опираться на них как на надежный источник, сами понимаете, нельзя. А не подкрепившись мнением авторитетного автора, я парировать не смогу.
Сообщение отредактировал ivan - 28.08.2010 - 11:05 |
|
28.08.2010 - 12:30
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 23 Регистрация: 20.05.2007 Пользователь №: 4112 |
Если мы обрабатываем результаты параметрикой, то появляется средний балл... В конце концов, высчитывают же средний балл успеваемости студентов, и никого это не смущает! Выходит, что такой подход тоже оправдан... Только вот кем или чем? Здравым смыслом? Ссылка на авторитетный справочник не повредила бы...
|
|
29.08.2010 - 14:27
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Как провести двухфакторный ДА с повторными измерениями, я представляю. Но меня по-прежнему очень смущает то, что данные в баллах. Во всех имеющихся у меня учебниках по статистике написано, что если измерения сделаны в ординальной шкале, то данные необходимо описывать с помощью медианы, квартилей и т. д. и анализировать их нужно непараметрикой... nokh, скажите, пожалуйста, можно ли сослаться на какой-то учебник, в котором приводится пример ДА именно балльных данных. В статьях, конечно, такое проделывают сплошь и рядом, но опираться на них как на надежный источник, сами понимаете, нельзя. А не подкрепившись мнением авторитетного автора, я парировать не смогу. "Generalized linear modeling is a development of linear models to accommodate both non-normal response distributions and transformations to linearity in a clean and straightforward way. " скорее всего подойдет glm(y~x,binomial), но надежнее выбрать quasi. Или подойдет "Generalized additive models (GAMs) are like GLMs in that they can have different error structures and different link functions to deal with count data or proportion data. What makes them different is that the shape of the relationship between y and a continuous variable x is not specified by some explicit functional form. Instead, non-parametric smoothers are used to describe the relationship. This is especially useful for relationships that exhibit complicated shapes, such as hump-shaped curves (see p. 666). The model looks just like a GLM, except that the relationships we want to be smoothed are prefixed by s: thus, if we had a three-variable multiple regression (with three continuous explanatory variables w, x and z) on count data and we wanted to smooth all three explanatory variables, we would write: model<-gam(y~s(w)+s(x)+s(z),poisson) These are hierarchical models, so the inclusion of a high-order interaction (such as A:B:C) necessarily implies the inclusion of all the lower-order terms marginal to it (i.e. A:B, A:C and B:C, along with main effects for A, B and C)." R book есть на либрусеке |
|
29.08.2010 - 14:32
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 23 Регистрация: 20.05.2007 Пользователь №: 4112 |
Выкладываю интересную статью (Phytopathology 2004; 94: 33-43), в которой приводится пример трёхфакторного анализа (двухфакторного с повторными измерениями) с использованием непараметрических методов. К сожалению, моё образование не позволяет в полной мере оценить этот материал, поэтому надеюсь на комментарии специалистов. )))
Прикрепленные файлы
|
|
29.08.2010 - 14:57
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Выкладываю интересную статью (Phytopathology 2004; 94: 33-43), в которой приводится пример трёхфакторного анализа (двухфакторного с повторными измерениями) с использованием непараметрических методов. К сожалению, моё образование не позволяет в полной мере оценить этот материал, поэтому надеюсь на комментарии специалистов. ))) Ни в коем случае не считаю себя специалистом . Но в конце статьи они и обсуждают возможность использования вариантов ANOVA. |
|
29.08.2010 - 16:14
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 23 Регистрация: 20.05.2007 Пользователь №: 4112 |
А в этой статье (Am Stat 1993; 47: 65-72) как раз критикуется обязательное использование только непараметрических методов при обработке порядковых данных. Тоже весьма любопытно. ))
Прикрепленные файлы
|
|
29.08.2010 - 17:57
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Да, вопрос оказался, что говорится - на засыпку. Решив, что уж психологи и социологи, которые главным образом и работают с баллами что-то дельное по этому поводу написали, взялся за б/м авторитетную литературу в этой области. И ничего не нашёл. Везде одно: порядковые признаки вместе с качественными для ANOVA не годятся. Хотя, действительно, и считают так, и интуитивно понятно, что если у порядкового признака 3 градации - он почти что качественный, а если 30 - почти что количественный. Но границу пока нигде не нашёл. Можно, конечно, сделать и какой-нибудь логлинейный анализ с повторными измерениями для шестибальной шкалы (как вариант Generalized LM) - но это уже явно перебор. К тому же будет существенная потеря в мощности, т.к. классы будут обрабатываться как номинальные категории, без учёта упорядоченности - а тогда чем это лучше чем несколько простых парных тестов? На статью в Phytopathology тоже наткнулся, в ней есть ряд полезных ссылок в Обсуждении. Но раз авторы освоили более грамотную технику, естественно, что остальное они более или менее активно, но критикуют. Особенно критикуют эту уже классическую работу, в которой предлагается вообще во всех параметрических методах использовать ранги: http://www.biostat.mcg.edu/journalclub/Conover_Iman1981.pdf . Жизнь показывает, что чтобы метод прижился у практиков нужно 15-20 лет. Может через 10 лет все так и будут считать как в Phytopathology, может раньше (если его в SPSS/PASW включат). А пока что, действительно, нужно просто найти на что сослаться. Будем искать дальше.
Сообщение отредактировал nokh - 29.08.2010 - 18:13 |
|
29.08.2010 - 19:36
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Мне понравилась статья в Phytopathology именно тем, что это не статья по фитопатологии, а именно письмо в редакцию с целью раскрыть возможности анализа при подобных дизайнах. А такие задачи приходится решать довольно часто. Конечно, к этому нужно стремиться. Вряд ли могут существовать авторитетные источники, которые будут демонстрировать примеры при нарушении условий применимости ДА. Но в дискуссии в этой статье перечислены 4 варианта, которые используются и имеют право быть. Да, авторы продемонстрировали работу макроса SAS, но на сегодняшний день мало кто в ближнем окружении может это сделать (наш модератор). Но первый из 4 вариантов ? это игнорирование проблем ординальной шкалы и это вполне допускается в социологии, где используются рейтинговые оценки.
Рекомендация Nokh, использовать ДА для этих данных, скорее всего исходит, действительно, из здравого смысла, красоты графического решения и доступности программной реализации. Я бы тоже использовала ДА, но не для любой аудитории, а для собственного (внутреннего) употребления. Графически представить 4 группы в 10 временных точках. Посмотреть все интересующие различия, ведь не все они нужны. А затем, заменить на графике средние баллы медианами и ДИ к ним (AtteStat , по моему, их считает). Авторы статьи ограничились медианами интересующих групп на графике, проранжировали их, но это не обязательно, легенда групп будет на рисунке. А различия медиан доказать соответствующими непараметрическими тестами, конечно с учетом множественных сравнений. Как правило, те парные различия, которые в post hoc ANOVA были значимы, также будут значимы. P.S. Ищу тоже нужные ссылки, много хороших англоязычных книг. Много примеров различных дизайнов ANOVA в "Biostatistics. A Metodology for the Health Sciences" 2004 года |
|
31.08.2010 - 11:55
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Мне понравилась статья в Phytopathology именно тем, что это не статья по фитопатологии, а именно письмо в редакцию с целью раскрыть возможности анализа при подобных дизайнах. А такие задачи приходится решать довольно часто. Конечно, к этому нужно стремиться. Вряд ли могут существовать авторитетные источники, которые будут демонстрировать примеры при нарушении условий применимости ДА. Но в дискуссии в этой статье перечислены 4 варианта, которые используются и имеют право быть. Да, авторы продемонстрировали работу макроса SAS, но на сегодняшний день мало кто в ближнем окружении может это сделать (наш модератор). Но первый из 4 вариантов ? это игнорирование проблем ординальной шкалы и это вполне допускается в социологии, где используются рейтинговые оценки. Рекомендация Nokh, использовать ДА для этих данных, скорее всего исходит, действительно, из здравого смысла, красоты графического решения и доступности программной реализации. Я бы тоже использовала ДА, но не для любой аудитории, а для собственного (внутреннего) употребления. Графически представить 4 группы в 10 временных точках. Посмотреть все интересующие различия, ведь не все они нужны. А затем, заменить на графике средние баллы медианами и ДИ к ним (AtteStat , по моему, их считает). Авторы статьи ограничились медианами интересующих групп на графике, проранжировали их, но это не обязательно, легенда групп будет на рисунке. А различия медиан доказать соответствующими непараметрическими тестами, конечно с учетом множественных сравнений. Как правило, те парные различия, которые в post hoc ANOVA были значимы, также будут значимы. P.S. Ищу тоже нужные ссылки, много хороших англоязычных книг. Много примеров различных дизайнов ANOVA в "Biostatistics. A Metodology for the Health Sciences" 2004 года Проблема ординальной шкалы двоякая - (1) дисперсия (точнее ее оценка) и (2) скошенность (эффект потолка и пола). Соответственно, если у Вас много данных, то проблема (1) частично решается, если средний балл около 3,5, то частично решается проблема (2). Отсюда вывод - если выполняются эти два условия, может использовать параметрический ДА с повторными измерениями. Если скошенность есть, то используется либо GEE, либо модель пропорциональных шансов (вариант логистической регрессии для упорядоченных данных). Детали можно посмотреть, например здесь http://www.lexjansen.com/pharmasug/2006/st...netics/sp08.pdf P.S. Только вот рисовать медианы, используя обычный ДА нельзя - это фактически обман, поскольку сравниваются средние, насчет медиан Вы ничего не знаете. |
|
31.08.2010 - 12:35
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Я предложила рисовать медианы и ДИ к НИМ и сравнивать медианы.
|
|