Проводил исследование влияния хронического введения нескольких различных препаратов на крыс. При оценке результатов возникла весьма интересная ситуация: поначалу я взял однофакторный анализ и с помощью пост-хок теста Тьюки сделал множественные сравнения между группами отдельно по каждому из дней. Затем, решил сделать двухфакторный анализ (тоже Тьюки) и вторым фактором выбрал собственно день тестирования. И, о чудо, статистическая мощность критерия заметно возросла, там где раньше была "небольшая" недостоверность между группами, теперь появились достоверные отличия. Проще говоря, получается, что день тестирования тоже влияет на результат и добавляет больше достоверности итогам анализа.
Вот здесь-то и загвоздка:
1. С одной стороны, понятно, что день влияет на результат, т.к. при хроническом лечении у нас наблюдается накопительный эффект
2. С другой стороны, а как я вообще могу быть уверен, что фактор "день" связан именно с этим накопительным эффектом лечения, а не с какими-то другими неучтёнными воздействиями?
3. Изначально, при планировке эксперимента, я не рассматривал "день" как фактор, скорее просто группирующую величину, рассчитывал найти только межгрупповые различия.
Отсюда вопросы: а какой вариант анализа более корректный? Имею ли я право вообще учитывать "день" как фактор, или нет? Меня смущает его неоднозначность и расплывчатость. В примерах двухфакторного ANOVA всегда такие однозначные факторы, вроде пол, возраст и т.п.
Я так понимаю, что оценивая весь массив данных, а не отдельные его части, само собой разумеется, что статистическая мощность возрастает, увеличивается кол-во степеней свободы. Правильно?
Ну и в довесок не до конца понимаю результаты двухфакторного анализа (см. таблицу). Как правильно интерпретировать графу "Source of Variation"? Как правильно оценить вклад каждого из факторов? Значение слов я понимаю, но математический смысл таблицы до меня не доходит.