Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> И снова дисперсионный анализ (двухфакторный)
nokh
сообщение 3.10.2017 - 23:04
Сообщение #16


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(bubnilkin @ 30.09.2017 - 01:35) *
Добрый день,

подхватываю эту тему, т.к. задача аналогичная.
...
Начал тестировать собственно влияние (А Б А*Б) (приложил итоговую таблицу), но вижу, что тестируемая модель практически не обьясняет вариабельность в данных (дисперсия ошибки в 10 раз превышает дисперсию, которая обьясняется моделью, и R^2 ~ 0.1)

Подскажите, пожалуйста, как с этим бороться?

Быстрый совет - найти факторы, которые объясняют вариабельность лучше smile.gif ну или ставить точку. Ведь никто не отменял отрицательные результаты в науке; могло получиться, что вообще ничего не значимо. У вас же значимы оба главных эффекта, т.е. ваши факторы ВЛИЯЮТ на признак. Если вы даже увеличите объём выборки в эксперименте, то, возможно, докажете ещё и взаимодействие факторов. Однако это никак не повлияет на соотношение дисперсий: слабые эффекты останутся слабыми, детерминация не изменится. Поскольку с технико-статистической точки зрения вы постарались максимально приблизить данные к требованиям модели - к самому анализу претензий быть не может, все претензии - только к самим данным. Если данные говорят, что пол и диета влияют значимо, но слабо, значит так оно и есть. Полагаю, что применительно к данному фрагменту работы можно фиксировать и публиковать результат.
Единственное, что я бы ещё добавил к ДА с Боксом-Коксом, так это вычислил бы в %, сколько всё-таки изменчивости (дисперсии) показателя определяется полом, сколько - диетой и сколько - спецификой сочетания (взаимодействием) этих факторов. Т.е. рассчитал бы типа компоненты дисперсии. "Типа", т.к. оба фактора фиксированные, а не случайные (программы могут отказаться считать компоненты для фиксированных экспериментов). Тем не менее и по фиксированным можно расчитать дисперсии всех эффектов, сложить их вместе (100%) и затем расчитать вклады. Я когда-то делал такое по книге Монтгомери Д. Анализ данных и планирование эксперимента - см. раздел по математическим ожидаемым средних квадратов. Т.е. дисперсии (MS) в таблице результатов ANOVA, это ещё не дисперсии связанных с эффектом воздействий, последние нужно рассчитать и выразить в %.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
bubnilkin
сообщение 29.10.2017 - 01:39
Сообщение #17


Дух форума
*

Группа: Пользователи
Сообщений: 77
Регистрация: 18.01.2010
Пользователь №: 9836



Цитата(nokh @ 4.10.2017 - 00:04) *
...Единственное, что я бы ещё добавил..., так это вычислил бы в %, сколько всё-таки изменчивости (дисперсии) показателя определяется полом, сколько - диетой и сколько - спецификой сочетания (взаимодействием) этих факторов.
Уважаемый nokh, спасибо за наводку с компонентами дисперсии. Bот что всё-таки вышло. Для простоты я использовал пример (dataset.txt) в Монтгомери с батарейками (8th ed., p.192-194, прикрепил).

E(MS(Material)) = E(SS(Material)/(a-1)) = σ2 + SS(Material)/(a-1) = 6017.074074 (20.1%),
E(MS(Temperature)) = E(SS(Temperature)/(b-1)) = σ2 + SS(Temperature)/(b-1) = 20234.57407 (67.4%),
E(MS(Material*Temperature)) = E(SS(Material*Temperature)/((a-1)(b-1))) = σ2 + SS(Material*Temperature)/((a-1)(b-1)) = 3078.657407 (10.3%),
E(MS(Error)) = E(SS(E)/(ab(n-1))) = σ2 = 675.212963 (2.3%),
E(MS(Total)) = 30005.51852 (100.0%).
[a = 3, b = 3, n = 4; SS(Material) = 10683.72, SS(Temperature) = 39118.72, SS(Material*Temperature) = 9613.78, SS(Error) = 18230.75.]

Но вот, что получилось (sas_output.pdf) в SAS (понимаю, что надо в R...), так это скорее всего то, о чём вы упомянули: "программы могут отказаться считать компоненты для фиксированных [факторов]...". В таблице EMS только "Q" (refers to a quadratic form in parameters of the parenthesized effect). Если рассматривать факторы как случайные, то SAS считает (sas_output2.pdf).

Bозникла путаница с тем, что ещё рассчитывают (lecture.pdf) η2 -- силу влияния факторов... Я так их рассчитал:

η2(A) = SS(A)/SS(T) = 13.76%, η2(B) = SS(B)/SS(T) = 50.38%, η2(AB) = SS(AB)/SS(T) = 12.38%, η2(E) = SS(E)/SS(T) = 23.48%.
[SS(T) = 77646.97222.]

С другой стороны, формулы для EMS на стр.191 (Montgomery), если я правильно понимаю, приведены для случая сбалансированных планов. В моём же эксперименте количество значений в ячейках дисперсионного компекса очень сильно разнится. Как быть ?

Сообщение отредактировал bubnilkin - 29.10.2017 - 01:41
Прикрепленные файлы
Прикрепленный файл  dataset.txt ( 1,22 килобайт ) Кол-во скачиваний: 62
Прикрепленный файл  Montgomery.pdf ( 3,47 мегабайт ) Кол-во скачиваний: 67
Прикрепленный файл  sas_code.txt ( 2,25 килобайт ) Кол-во скачиваний: 63
Прикрепленный файл  sas_output.pdf ( 98,48 килобайт ) Кол-во скачиваний: 13
Прикрепленный файл  sas_output2.pdf ( 84,81 килобайт ) Кол-во скачиваний: 9
Прикрепленный файл  lecture7.pdf ( 336,63 килобайт ) Кол-во скачиваний: 53
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 31.10.2017 - 01:50
Сообщение #18


Дух форума
*

Группа: Пользователи
Сообщений: 1037
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(bubnilkin @ 29.10.2017 - 03:39) *
Уважаемый nokh, спасибо за наводку с компонентами дисперсии. Bот что всё-таки вышло. Для простоты я использовал пример (dataset.txt) в Монтгомери с батарейками (8th ed., p.192-194, прикрепил).
...
С другой стороны, формулы для EMS на стр.191 (Montgomery), если я правильно понимаю, приведены для случая сбалансированных планов. В моём же эксперименте количество значений в ячейках дисперсионного компекса очень сильно разнится. Как быть ?

Пока нет возможности вникать sad.gif , может ближе к концу недели... Но вообще с неравномерными комплексами - засада, там нужно типа взвешенное среднее n вычислять. Для однофакторного ДА это- не проблема, описано у Sokal, Rohlf (Biometry, 1995) на стр. 214 (Box 9.2). Но в сложном ДА неравномерность может вылиться в то, что в математических ожидаемых для разных эффектов окажутся по-разному взвешенные n, и как это всё раскручивать вручную я не знаю. Если не получится подобрать софт для этого, то может типа смоделировать? Сделать из своих данных несколько случайных равномерных комплексов, их обсчитать, вычислить без проблем компоненты дисперсии и усреднить по вариантам? В R это можно пробовать автоматизировать...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему