Дисперсионный анализ, учет случайных факторов |
Здравствуйте, гость ( Вход | Регистрация )
Дисперсионный анализ, учет случайных факторов |
29.11.2012 - 14:45
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 36 Регистрация: 27.08.2012 Пользователь №: 24128 |
Здравствуйте!
Помогите, пожалуйста, разобраться в следующем вопросе. Допустим, есть экспериментальная модель следующего дизайна. Группа 1 - животные, облученные в дозе 1 Гр (10 животных) Группа 2 - животные, облученные в дозе 3 Гр (10 животных) Т.о. фактор А (фиксированный) - группы (2 уровня градации). У животных каждой из этих двух групп измерялся некоторый показатель (допустим, активность какого-то фермента или что-то иное). Измерение показателя проводилось на 3-и и 10-е сутки после облучения. При этом на 3-и сутки показатель в каждой из групп облученных в разных дозах животных измерялся у подгруппы из 5-ти животных, а на 10-е сутки - у другой подгруппы из 5 животных (т.е. измерение по фактору сутки проводилось у разных, а не у одних и тех же животных). Т.о. фактор В (фиксированный) - это фактор суток (времени, прошедшего после облучения). В итоге имеется дизайн, соответствующий двухфакторному дисперсионному анализу. Но... меня интересует вот что: нужно ли еще вводить фактор индивидуальности животных (фактор С), который является случайным? По каждому сроку после облучения было по 5 животных и эти 5 животных в каждом сроке (3-и и 10-е сутки при облучении в дозе 1 Гр, 3-и и 10-е сутки при облучении в дозе 3 Гр) являются случайными, попавшими в эксперимент из гипотетического множества других животных. Поэтому фактор индивидуальности животных является случайным, поскольку отбор животных для включения в эксперимент никак не контролировался. Мой собственный ответ на интересующий меня вопрос - да, этот дополнительный фактор (фактор С, фактор индивидуальности животных) нужно вводить, поскольку это снизит влияние неконтролируемых (неучитываемых в дизайне исследования) факторов на вариацию изучаемого признака, сделает анализ точнее. Кроме того, если так, то фактор индивидуальности животных является вложенным в фактор суток, поскольку каждые сутки (в каждой дозе облучения) имели свой набор из 5-ти животных. Сутки, в свою очередь, не вложены в фактор доз облучения (для каждой из доз были обниковые сутки - 3-и и 10-е). В итоге имеется: фактор А (доза облучения) - 2 уровня градации, по 10 животных на каждом уровне фактор В (сутки, время после облучения) - 4 уровня градации, по 5 животных на каждом уровне фактор С (индивидуальность животных), вложенный в фактор В (С внутри В), 4 уровня градации, по 5 животных на каждом уровне взаимодействие А*В - группы и сутки могут взаимодействовать взаимодействия фактора С с фактором А быть не может (животные вложены в фактор суток) взаимодействия фактора С с фактором В также быть не может взаимодействия всех трех факторов быть также не может Извиняюсь за пространное изложение. Спасибо! |
|
30.11.2012 - 19:54
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Насколько я понял - это обычный двухфакторный дисперсионный анализ, т.е. выполненный по классической перекрёстной схеме. Есть эффекты (1) дозы облучения, (2) времени после облучения и (3) взаимодействия "доза х время", отражающее различие временной динамики показателя у животных, облучённых в разных дозах. Фактор "животное", отражающий индивидуальные различия животных внутри самой маленькой ячеки комплекса (5 животных) специально вводить совсем не обязательно, т.к. он уже присутствует в этом дисперсионном комплексе - это ошибка. Т.е. все фиксированные главные эффекты оцениваются (делятся) именно на этот случайный фактор внутригрупповой индивидуальной изменчивости при вычислении F-критерия. Т.о. фактор "животное" в таком комплексе выступает в качестве ошибки. Полагаю, что если вы правильно зададите тот ДА, который на скриншоте (можно попотеть), то получите абсолютно те же цифры, что и в обычном двухфакторном ДА, только в таком комплексе ошибкой будет фактор "животное внутри дозы и времени".
Что неполноценного в обычных многофакторных перекрёстных ДА? То, что в ошибку комплекса наряду с индивидуальной изменчивостью входят и неконтролируемые ошибки методики и они неотделимы от неё. Т.е. в вашем случае невозможно обоснованно сказать чего в ошибке больше - собственно индивидуальной изменчивости или погрешностей определения фермента. Можно только предполагать, что инд. изменчивость выше, но насколько сказать нельзя. Для ответа на этот вопрос эксперимент можно немного усложнить - проводить определения фермента от каждого животного дважды. Тогда в самую маленькую ошибку комплекса уйдёт ошибка повторных определений, т.е. ошибка методики и на её фоне можно определить инд. изменчивость животных в рафинированном виде. Анализ при этом сильно усложниться - будет то, что вы и предлагаете. Эта сложность оправдана в случае если далее планируется работать с компонентами дисперсии, т.е. скажем разбираться сколько вариабельности в показатель привносит в %% методика, сколько - инд. изменчивость, сколько - облучение, время и всякие взаимодействия. Это работа скорее методической направленности, чем собственно радиобиологическая. Сообщение отредактировал nokh - 30.11.2012 - 19:56 |
|
3.12.2012 - 20:56
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 36 Регистрация: 27.08.2012 Пользователь №: 24128 |
Здравствуйте уважаемый nokh! Благодарю Вас за (как и всегда) подробный и обстоятельный ответ!
Решил, по Вашему совету, сделать дисперсионный анализ по предлагаемой мною схеме (с вложением животных в фактор суток) и обычный двухфакторный дисперсионный анализ (без учета индивидуальности животных). Результаты представлены на скриншотах (расчеты выполнялись в STATISTICA 8.0). А пример - да, придуман мною. Точнее реальный дизайн исследования (разные дозы и разные сутки после облучения) искусственно усложнен введением 3-го фактора (индивидуальность животных). |
|
8.12.2012 - 23:34
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Blaid, выложите сюда файл с данными этого примера: если любопытство победит катастрофическую нехватку времени тоже попробую посчитать.
Сообщение отредактировал nokh - 8.12.2012 - 23:35 |
|
9.12.2012 - 13:23
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 36 Регистрация: 27.08.2012 Пользователь №: 24128 |
Охотно!
Извниняюсь, что данные в Блокноте (при попытках прикрепить файлы другого формата пишет "Неудачная загрузка. Вам запрещено загружать такой тип файлов").
Прикрепленные файлы
|
|
16.01.2014 - 14:19
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 30 Регистрация: 7.11.2013 Пользователь №: 25539 |
Здравствуйте, помогите, пожалуйста, разобраться с Noncentrality parameters в ДА. Noncentrality parameters используются при вычислении мощности критерия. Как описывать noncentrality parameters и надо ли это делать, или можно просто указать мощность критерия?
Сообщение отредактировал zira - 16.01.2014 - 14:19 |
|
16.01.2014 - 14:42
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Здравствуйте, помогите, пожалуйста, разобраться с Noncentrality parameters в ДА. Noncentrality parameters используются при вычислении мощности критерия. Как описывать noncentrality parameters и надо ли это делать, или можно просто указать мощность критерия? 1.Никак не описывать. Независимо от того, что вы понимаете под этим словом. 2. Не надо. Статпакет вычисляет этот параметр без вашего участия и подставляет в нецентральное F-распределение. |
|
16.01.2014 - 17:02
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 30 Регистрация: 7.11.2013 Пользователь №: 25539 |
100$, большое спасибо.
|
|
19.01.2014 - 15:40
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 30 Регистрация: 7.11.2013 Пользователь №: 25539 |
Здравствуйте, у меня снова вопросы по ДИ.
1. Следует ли поднимать порог значимости со стандартного значения 0,05 до 0,01, если у двух из десяти зависимых переменных дисперсии не равны? При любом варианте ответа, объясните, пожалуйста, почему именно так. 2. Какой критерий post hoc лучше использовать, если выборки не равны? Я выбрала Gabliel. Спасибо. |
|
19.01.2014 - 16:42
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Здравствуйте, у меня снова вопросы по ДИ. 1. Следует ли поднимать порог значимости со стандартного значения 0,05 до 0,01, если у двух из десяти зависимых переменных дисперсии не равны? При любом варианте ответа, объясните, пожалуйста, почему именно так. 2. Какой критерий post hoc лучше использовать, если выборки не равны? Я выбрала Gabliel. Спасибо. 1. Надеюсь, что вопрос на самом деле не по ДИ (доверительным интервалам), а по ДА (дисперсионному анализу) 2. Хочу внести ясность: если у вас 10 зависимых переменных, которые в англоязычной литературе обозначают как DV (dependent value), то речь сразу идет о многомерном (не путать с многофакторным!) ДА, т. е. о том, что в литературе обозначается как MANOVA.(одно- и многофакторная). Если у вас одна зависимая переменная изучается на 10 уровнях фактора (-ов) -то речь идет об одномерной АНОВе, которая может быть многофакторной. 3. Как вы локализовали неравенство дисперсий? Обычно используемые в ДА тесты Левене или Брауна-Форсайта фиксируют различия дисперсий в дисперсионном комплексе, но ничего не сообщают о том, какие именно дисперсии не равны. 4. Никогда не читывал про такую рекомендацию. Дело в том, что если в силу несоблюдения исходных предпосылок ДА отношение дисперсий не подчиняется F-распрелению, то там манипуляции с номинальным уровнем значимости (,05 или ,01) ничего не дают. Вы все равно не сможете ориентироваться на процентные точки F-распределения. Для МАНОВы многомерных проверок дисперсий не существует. Там анализ ведется не на основе привычного F-теста, а на основе его многомерных аналогов- следа Пиллая, следа Хотеллинга-Лоули, наибольшего корня по методу Роя и лямбды Уилкса. 5. ДА для независимых выборок и не предполагает их одинаковую численность. Поэтому - Габриэль,так Габриэль, Тьюки HSD-значит, Тьюки и т.д. 6. В статистике нет эмоционального понятия "лучше/хуже". Зато есть понятия состоятельности критерия, его мощности по отношению к альтернативам и т.д. Сообщение отредактировал 100$ - 19.01.2014 - 16:44 |
|
19.01.2014 - 18:58
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 30 Регистрация: 7.11.2013 Пользователь №: 25539 |
1. Конечно, это ДА, а не ДИ (опечаталась).
2. У меня 3 группы и 10 зависимых переменных. Тест Levene показывает неравенство дисперсий по каждой зависимой переменной в трех группах? (Мне уже кажется, что я совсем перестала что-либо понимать). 3. При анализе мне необходимо ссылаться на след Пиллая и т.п., а не на F-тест ? 4. В зависимости от выбора порога значимости меняется мощность критерия и различия между группами по некоторой переменной значимы при а=0,05 и не значимы при а=0,01. Как тут быть? Спасибо за подробные разъяснения. |
|
19.01.2014 - 21:52
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
1. Конечно, это ДА, а не ДИ (опечаталась). 2. У меня 3 группы и 10 зависимых переменных. Тест Levene показывает неравенство дисперсий по каждой зависимой переменной в трех группах? (Мне уже кажется, что я совсем перестала что-либо понимать). 3. При анализе мне необходимо ссылаться на след Пиллая и т.п., а не на F-тест ? 4. В зависимости от выбора порога значимости меняется мощность критерия и различия между группами по некоторой переменной значимы при а=0,05 и не значимы при а=0,01. Как тут быть? Спасибо за подробные разъяснения. Смотрите: если вы для каждого наблюдаемого объекта (н-р, пациента) измеряете 10 показателей (н-р, рост, вес, возраст, величину банковского счета и т.д) на трех уровнях воздействия фактора, то тогда у вас многомерный ДА. Тогда на Levene можно вообще не оринтироваться. Но тогда и пост хоков никаких нет. В этом случае многомерные аналоги F-теста-те самые Пиллай (Pillai's), Рой (Roy's) etc. На пункт 4. ответ совсем простой: так и должно быть. При расчете мощности критическое значение подставляется в нецентральное F-распределение с данным параметром нецентральности. Естественно, что для а=,05 и а=,01 Fкрит будет разное. Типичная для статистики ситуация: гипотеза отвергается при ,1, при ,05, но не отвергается при ,01. Напишите, в чем вы работаете, выложите кодировку исх. данных. Посмотрим, что к чему. |
|
20.01.2014 - 00:32
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 30 Регистрация: 7.11.2013 Пользователь №: 25539 |
Я считаю в SPSS. К сожалению, файл с данными (в Excel) не прикрепляется.
|
|
20.01.2014 - 00:41
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 30 Регистрация: 7.11.2013 Пользователь №: 25539 |
|
|
20.01.2014 - 00:53
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
|
|