Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Дисперсионный анализ
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Blaid
Здравствуйте!

Помогите, пожалуйста, разобраться в следующем вопросе.

Допустим, есть экспериментальная модель следующего дизайна.

Группа 1 - животные, облученные в дозе 1 Гр (10 животных)
Группа 2 - животные, облученные в дозе 3 Гр (10 животных)
Т.о. фактор А (фиксированный) - группы (2 уровня градации).

У животных каждой из этих двух групп измерялся некоторый показатель (допустим, активность какого-то фермента или что-то иное). Измерение показателя проводилось на 3-и и 10-е сутки после облучения. При этом на 3-и сутки показатель в каждой из групп облученных в разных дозах животных измерялся у подгруппы из 5-ти животных, а на 10-е сутки - у другой подгруппы из 5 животных (т.е. измерение по фактору сутки проводилось у разных, а не у одних и тех же животных).
Т.о. фактор В (фиксированный) - это фактор суток (времени, прошедшего после облучения).

В итоге имеется дизайн, соответствующий двухфакторному дисперсионному анализу. Но... меня интересует вот что:
нужно ли еще вводить фактор индивидуальности животных (фактор С), который является случайным?
По каждому сроку после облучения было по 5 животных и эти 5 животных в каждом сроке (3-и и 10-е сутки при облучении в дозе 1 Гр, 3-и и 10-е сутки при облучении в дозе 3 Гр) являются случайными, попавшими в эксперимент из гипотетического множества других животных. Поэтому фактор индивидуальности животных является случайным, поскольку отбор животных для включения в эксперимент никак не контролировался.
Мой собственный ответ на интересующий меня вопрос - да, этот дополнительный фактор (фактор С, фактор индивидуальности животных) нужно вводить, поскольку это снизит влияние неконтролируемых (неучитываемых в дизайне исследования) факторов на вариацию изучаемого признака, сделает анализ точнее.
Кроме того, если так, то фактор индивидуальности животных является вложенным в фактор суток, поскольку каждые сутки (в каждой дозе облучения) имели свой набор из 5-ти животных. Сутки, в свою очередь, не вложены в фактор доз облучения (для каждой из доз были обниковые сутки - 3-и и 10-е). В итоге имеется:
фактор А (доза облучения) - 2 уровня градации, по 10 животных на каждом уровне
фактор В (сутки, время после облучения) - 4 уровня градации, по 5 животных на каждом уровне
фактор С (индивидуальность животных), вложенный в фактор В (С внутри В), 4 уровня градации, по 5 животных на каждом уровне
взаимодействие А*В - группы и сутки могут взаимодействовать

взаимодействия фактора С с фактором А быть не может (животные вложены в фактор суток)
взаимодействия фактора С с фактором В также быть не может
взаимодействия всех трех факторов быть также не может

Извиняюсь за пространное изложение.

Спасибо!

nokh
Насколько я понял - это обычный двухфакторный дисперсионный анализ, т.е. выполненный по классической перекрёстной схеме. Есть эффекты (1) дозы облучения, (2) времени после облучения и (3) взаимодействия "доза х время", отражающее различие временной динамики показателя у животных, облучённых в разных дозах. Фактор "животное", отражающий индивидуальные различия животных внутри самой маленькой ячеки комплекса (5 животных) специально вводить совсем не обязательно, т.к. он уже присутствует в этом дисперсионном комплексе - это ошибка. Т.е. все фиксированные главные эффекты оцениваются (делятся) именно на этот случайный фактор внутригрупповой индивидуальной изменчивости при вычислении F-критерия. Т.о. фактор "животное" в таком комплексе выступает в качестве ошибки. Полагаю, что если вы правильно зададите тот ДА, который на скриншоте (можно попотеть), то получите абсолютно те же цифры, что и в обычном двухфакторном ДА, только в таком комплексе ошибкой будет фактор "животное внутри дозы и времени".

Что неполноценного в обычных многофакторных перекрёстных ДА? То, что в ошибку комплекса наряду с индивидуальной изменчивостью входят и неконтролируемые ошибки методики и они неотделимы от неё. Т.е. в вашем случае невозможно обоснованно сказать чего в ошибке больше - собственно индивидуальной изменчивости или погрешностей определения фермента. Можно только предполагать, что инд. изменчивость выше, но насколько сказать нельзя. Для ответа на этот вопрос эксперимент можно немного усложнить - проводить определения фермента от каждого животного дважды. Тогда в самую маленькую ошибку комплекса уйдёт ошибка повторных определений, т.е. ошибка методики и на её фоне можно определить инд. изменчивость животных в рафинированном виде. Анализ при этом сильно усложниться - будет то, что вы и предлагаете. Эта сложность оправдана в случае если далее планируется работать с компонентами дисперсии, т.е. скажем разбираться сколько вариабельности в показатель привносит в %% методика, сколько - инд. изменчивость, сколько - облучение, время и всякие взаимодействия. Это работа скорее методической направленности, чем собственно радиобиологическая.
Blaid
Здравствуйте уважаемый nokh! Благодарю Вас за (как и всегда) подробный и обстоятельный ответ!
Решил, по Вашему совету, сделать дисперсионный анализ по предлагаемой мною схеме (с вложением животных в фактор суток) и обычный двухфакторный дисперсионный анализ (без учета индивидуальности животных). Результаты представлены на скриншотах (расчеты выполнялись в STATISTICA 8.0).
А пример - да, придуман мною. Точнее реальный дизайн исследования (разные дозы и разные сутки после облучения) искусственно усложнен введением 3-го фактора (индивидуальность животных).
nokh
Blaid, выложите сюда файл с данными этого примера: если любопытство победит катастрофическую нехватку времени тоже попробую посчитать.
Blaid
Охотно!

Извниняюсь, что данные в Блокноте (при попытках прикрепить файлы другого формата пишет "Неудачная загрузка. Вам запрещено загружать такой тип файлов").
zira
Здравствуйте, помогите, пожалуйста, разобраться с Noncentrality parameters в ДА. Noncentrality parameters используются при вычислении мощности критерия. Как описывать noncentrality parameters и надо ли это делать, или можно просто указать мощность критерия?
100$
Цитата(zira @ 16.01.2014 - 15:19) *
Здравствуйте, помогите, пожалуйста, разобраться с Noncentrality parameters в ДА. Noncentrality parameters используются при вычислении мощности критерия. Как описывать noncentrality parameters и надо ли это делать, или можно просто указать мощность критерия?


1.Никак не описывать. Независимо от того, что вы понимаете под этим словом.
2. Не надо. Статпакет вычисляет этот параметр без вашего участия и подставляет в нецентральное F-распределение.
zira
100$, большое спасибо.
zira
Здравствуйте, у меня снова вопросы по ДИ.
1. Следует ли поднимать порог значимости со стандартного значения 0,05 до 0,01, если у двух из десяти зависимых переменных дисперсии не равны? При любом варианте ответа, объясните, пожалуйста, почему именно так.
2. Какой критерий post hoc лучше использовать, если выборки не равны? Я выбрала Gabliel.
Спасибо.
100$
Цитата(zira @ 19.01.2014 - 16:40) *
Здравствуйте, у меня снова вопросы по ДИ.
1. Следует ли поднимать порог значимости со стандартного значения 0,05 до 0,01, если у двух из десяти зависимых переменных дисперсии не равны? При любом варианте ответа, объясните, пожалуйста, почему именно так.
2. Какой критерий post hoc лучше использовать, если выборки не равны? Я выбрала Gabliel.
Спасибо.


1. Надеюсь, что вопрос на самом деле не по ДИ (доверительным интервалам), а по ДА (дисперсионному анализу)

2. Хочу внести ясность: если у вас 10 зависимых переменных, которые в англоязычной литературе обозначают как DV (dependent value), то речь сразу идет о многомерном (не путать с многофакторным!) ДА, т. е. о том, что в литературе обозначается как MANOVA.(одно- и многофакторная).

Если у вас одна зависимая переменная изучается на 10 уровнях фактора (-ов) -то речь идет об одномерной АНОВе, которая может быть многофакторной.

3. Как вы локализовали неравенство дисперсий? Обычно используемые в ДА тесты Левене или Брауна-Форсайта фиксируют различия дисперсий в дисперсионном комплексе, но ничего не сообщают о том, какие именно дисперсии не равны.

4. Никогда не читывал про такую рекомендацию.

Дело в том, что если в силу несоблюдения исходных предпосылок ДА отношение дисперсий не подчиняется F-распрелению, то там манипуляции с номинальным уровнем значимости (,05 или ,01) ничего не дают. Вы все равно не сможете ориентироваться на процентные точки F-распределения.

Для МАНОВы многомерных проверок дисперсий не существует. Там анализ ведется не на основе привычного F-теста, а на основе его многомерных аналогов- следа Пиллая, следа Хотеллинга-Лоули, наибольшего корня по методу Роя и лямбды Уилкса.


5. ДА для независимых выборок и не предполагает их одинаковую численность. Поэтому - Габриэль,так Габриэль, Тьюки HSD-значит, Тьюки и т.д.

6. В статистике нет эмоционального понятия "лучше/хуже". Зато есть понятия состоятельности критерия, его мощности по отношению к альтернативам и т.д.
zira
1. Конечно, это ДА, а не ДИ (опечаталась).

2. У меня 3 группы и 10 зависимых переменных. Тест Levene показывает неравенство дисперсий по каждой зависимой переменной в трех группах? (Мне уже кажется, что я совсем перестала что-либо понимать).

3. При анализе мне необходимо ссылаться на след Пиллая и т.п., а не на F-тест ?

4. В зависимости от выбора порога значимости меняется мощность критерия и различия между группами по некоторой переменной значимы при а=0,05 и не значимы при а=0,01. Как тут быть?

Спасибо за подробные разъяснения.
100$
Цитата(zira @ 19.01.2014 - 19:58) *
1. Конечно, это ДА, а не ДИ (опечаталась).

2. У меня 3 группы и 10 зависимых переменных. Тест Levene показывает неравенство дисперсий по каждой зависимой переменной в трех группах? (Мне уже кажется, что я совсем перестала что-либо понимать).

3. При анализе мне необходимо ссылаться на след Пиллая и т.п., а не на F-тест ?

4. В зависимости от выбора порога значимости меняется мощность критерия и различия между группами по некоторой переменной значимы при а=0,05 и не значимы при а=0,01. Как тут быть?

Спасибо за подробные разъяснения.


Смотрите: если вы для каждого наблюдаемого объекта (н-р, пациента) измеряете 10 показателей (н-р, рост, вес, возраст, величину банковского счета и т.д) на трех уровнях воздействия фактора, то тогда у вас многомерный ДА. Тогда на Levene можно вообще не оринтироваться. Но тогда и пост хоков никаких нет.

В этом случае многомерные аналоги F-теста-те самые Пиллай (Pillai's), Рой (Roy's) etc.

На пункт 4. ответ совсем простой: так и должно быть. При расчете мощности критическое значение подставляется в нецентральное F-распределение с данным параметром нецентральности. Естественно, что для а=,05 и а=,01 Fкрит будет разное. Типичная для статистики ситуация: гипотеза отвергается при ,1, при ,05, но не отвергается при ,01.

Напишите, в чем вы работаете, выложите кодировку исх. данных. Посмотрим, что к чему.

zira
Я считаю в SPSS. К сожалению, файл с данными (в Excel) не прикрепляется.
zira
Вот и получилось.
100$
Цитата(zira @ 20.01.2014 - 01:41) *
Вот и получилось.



Тогда уж скриншот экрана на этапе ввода данных. Важно ведь понять, где у вас DV1-DV10, а где группирующий фактор.
А то, боюсь, в том, что вы прикрепили, я вам не помощник
zira
Я, наверное, не поняла в каком виде данные необходимо представить. Такое изображение подходит?
100$
Цитата(zira @ 20.01.2014 - 02:38) *
Я, наверное, не поняла в каком виде данные необходимо представить. Такое изображение подходит?


Да, совсем другое дело. Можете, когда захотите.

Теперь смотрите. У вас, как и предполагалось ,однофакторная МАНОВА: зависимые переменные mmpi1-mmpi10 и группирующий фактор grupp (жаль, что он в скриншот не попал). Кодируйте его уровни 1-2-3 и т.д. и будет вам счастье.
zira
Здравствуйте, спасибо Вам за участие. Группирующий фактор у меня так и закодирован. Если я на правильном пути то:
1. На тест о равенстве дисперсий не ориентироваться
2. Основываться на аналоги F-теста
3. Post hoc не использовать

4. Тогда объясните мне, пожалуйста, произведя эти манипуляции и обнаружив различия, как мне узнать какие именно группы различаются? И еще, где можно более подробно почитать об аналогах F-теста, используемых в MANOVе ? И как их правильно описывать?
100$
Цитата(zira @ 20.01.2014 - 12:23) *
Здравствуйте, спасибо Вам за участие. Группирующий фактор у меня так и закодирован. Если я на правильном пути то:
1. На тест о равенстве дисперсий не ориентироваться
2. Основываться на аналоги F-теста
3. Post hoc не использовать

4. Тогда объясните мне, пожалуйста, произведя эти манипуляции и обнаружив различия, как мне узнать какие именно группы различаются? И еще, где можно более подробно почитать об аналогах F-теста, используемых в MANOVе ? И как их правильно описывать?


1. Не ориентироваться. Поскольку тогда должно быть 10 результатов тестов (одномерных) на равенство дисперсий по каждой переменной.
2. Да.
3. Не могу сходу ответить на этот вопрос. Похоже, надо зайти в раздел "Пост хок" и посмотреть, что они там предлагают для МАНОВы. Возможно, будут осуществляться попарные сравнения для каждой зависимой переменной, как это делается в одномерном случае.
4. Описывать ничего не надо. Надо ориентироваться на достигаемый для каждого теста уровень значимости. Если он <.05, то констатируете различия в дисперсионном комплексе.

Почитать про тесты очень просто. Н-р, вот тут
zira
Спасибо, Вы очень помогли, многое разъяснили.
100$
Цитата(zira @ 20.01.2014 - 16:28) *
Спасибо, Вы очень помогли, многое разъяснили.


Отпишитесь, получилось или нет? А что с пост хоками?
zira
По post hoc нашла следующее: для каждой DV можно провести одномерный ДА, тогда уровень значимости выставлять не 0,05, а 0,01. Но наиболее подходящее:
1. Roy-Bargmann Stepdown Analysis
2. Discriminant analysis

напишу как получилось и получилось ли
zira
Проведя на первом этапе MANOVу и получив в результате значимые различия между группами по 3 DV, стала перед выбором, что далее. Если на втором этапе проводить ANOVу, то теряется идея многомерности. Я выбрала дискриминантный анализ. В итоге, значимыми оказались различия по двум переменным. Верно ли я двигаюсь?

Получается дискриминантный анализ, в данном случае, и есть post hoc?
100$
Цитата(zira @ 21.01.2014 - 11:59) *
Проведя на первом этапе MANOVу и получив в результате значимые различия между группами по 3 DV, стала перед выбором, что далее. Если на втором этапе проводить ANOVу, то теряется идея многомерности. Я выбрала дискриминантный анализ. В итоге, значимыми оказались различия по двум переменным. Верно ли я двигаюсь?

Получается дискриминантный анализ, в данном случае, и есть post hoc?


Не знаю. Всегда считал дискриминантный анализ методом классификации (распознавания) объектов.
zira
В этом-то и вопрос. Я раньше не использовала дискриминантный для такой цели.
nokh
Цитата(zira @ 21.01.2014 - 14:51) *
В этом-то и вопрос. Я раньше не использовала дискриминантный для такой цели.

А вы цель и не формулировали... Вы продолжили тему конкретными вопросами по ДА, а в зависимости от цели и контекста ислледования не факт, что ДА - лучший метод. Ваши данные можно обрабатывать совсем разными техниками и их сочетаниями. Варианты:
1. Для 10 показателей провести 10 отдельных ДА. Так лучше поступать, если вы пытаетесь найти отдельные показатели, по которым группы различаются наиболее сильно. Т.е. если вы планируете обсуждать различия по каждому показателю в отдельности - так и делайте. Для неравных дисперсий существуют модификации однофакторного ДА (например, К. Мардиа, П. Земроч. Таблицы F-распредлений. М.: Наука, 1984), есть и программные реализации: например, в пакете PAST F-критерий и р автоматически считаются как классикой, так и с подходом Вэлча. Т.е. используется тот же принцип, что и для критерия Стьюдента с неравными дисперсиями. Для апостериорных сравнений в случае неравных дисперсий нужно искать метод Games-Howell. У вас какие-то психологические данные, не факт, что они нормально распределены - может потому и дисперсии отличаются, что хвосты длинные. Поэтому вместо однофакторного ДА можно использовать критерий Краскела-Уоллиса с последующими апостериорными сравнениями методами Steel-Dwass или Dann.
2. MANOVA просится, если вас интересуют именно интегральные различия между группами по комплексу возможно связанных между собой показателей. Я этот анализ обычно не использую, т.к. есть более информативные (с моей точки зрения) подходы. Поэтому по манове не подскажу конкретно.
3. Дискриминантый анализ просится если вас интересуют не столько сами различия по комплексу признаков, сколько специфические особенности групп + возможность выработки правила для отнесения объекта к одной из них. Факторная структура в дискриминантном анализе, в отличие от техник типа главных компонент и факторного анализа интерпретируется не по существу стоящих за различиями процессов, а именно с т.з. групповых различий... короче, хуже интерпретируется smile.gif А вообще инструмент - мощный, графики в канонических осях - наглядные. Для этой же цели можно использовать деревья решений - тоже графики наглядней некуда.
4. Можно начать с многомерного анализа, к тому же вам, как психологу, этот инструментарий должен быть знаком куда лучше чем врачам. Можно сделать анализ главных компонент или факторный анализ на всём массиве данных, выделить несколько главных латентных переменных, рассчитать их метки (scores) для всех индивидов и сравнить группы в ходе ДА по этим новым переменным. Помимо различий получится также хорошее обобщение данных, которое представляет самостоятельную ценность. А можно сделать многомерный анализ для каждой группы отдельно (если объёмы выборок позволяют), а далее сравнить факторные структуры в ходе прокрустового анализа: посмотреть что общего, а по матрице остатков - в чём специфика. Может даже оказаться, что в одной из трёх групп присутствует (отсутствует) какой-то фактор, а это уже явная аномалия - так можно из комбинации количественных показателей выйти на качественные различия. К слову, в статьях, а особенно книгах часто пишут про "глубокие качественные различия", а показывают и обсуждают при этом отдельные количественные показатели, противореча самим себе...
Т.к. все блоки дают несколько специфическую информацию - можно сочетать.
zira
Nokh, спасибо за столь развернутое пояснение. Дело в том, что группы у меня изначально различаются. И моя цель скорее показать отсутствие различий по изучаемым переменным.
Факторный анализ я делала ранее на всех данных, и результаты подтвердили мои теоретические предположения.

Ваши идеи обдумываю.
zira
Вот я и домучила свои данные. При проведении ДА были выделены две переменные с наибольшей долей совокупной дисперсии. Далее, при проведении дискриминантного анализа эти же переменные вошли в уравнение. Большое спасибо всем, кто принимал непосредственное участие.
100$
Цитата(zira @ 28.01.2014 - 03:04) *
Вот я и домучила свои данные. При проведении ДА были выделены две переменные с наибольшей долей совокупной дисперсии. Далее, при проведении дискриминантного анализа эти же переменные вошли в уравнение. Большое спасибо всем, кто принимал непосредственное участие.


Я тут по случаю выяснил, что люд честной применяет в качестве пост хоков в МАНОВ'е: тест Хотеллинга с коррекцией Бонферрони.
zira
Спасибо за информацию. И сразу вопрос: Вы имеете в виду Hotelling's Trace, который считается автоматически в MANOVe, как и другие аналоги или тест Хотеллинга с коррекцией Бонферрони что-то отдельное? Закрались сомнения...
100$
Цитата(zira @ 29.01.2014 - 03:29) *
Спасибо за информацию. И сразу вопрос: Вы имеете в виду Hotelling's Trace, который считается автоматически в MANOVe, как и другие аналоги или тест Хотеллинга с коррекцией Бонферрони что-то отдельное? Закрались сомнения...


Нет, не манововский след Хотеллинга-Лоули (Hotelling-Lawley's trace), а вот это
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.