Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Использование дисперсионного анализа для изучения силы влияния факторов
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
alex3020
Здравствуйте.Помогите,пожалуйста решить следующий вопрос.
Нашла публикацию,где изучалась степень влияния медико-биологических факторов на развитие определ.заболевания с помощью однофакторного дисперсионного анализа.
Пользуюсь STATISTICA,но никак не могу понять,правильно ли я считаю в этой программе,тк прочла несколько разных источников,но ксожалению без указания пошаговой инструкции.У меня получились некоторые данные,но я не могу судить об их правильности.
Подскажите,можно ли посчитать степень влияния факторов с помощью программы,или это только вручную(к счастью нашла формулу),но не могу понять какую считать ошибку(сред.кв.ошибки или ср.квад.ошибки-тк совершенно не понимаю,что они значат).
плав
Цитата(alex3020 @ 30.04.2009 - 15:20) *
Здравствуйте.Помогите,пожалуйста решить следующий вопрос.
Нашла публикацию,где изучалась степень влияния медико-биологических факторов на развитие определ.заболевания с помощью однофакторного дисперсионного анализа.
Пользуюсь STATISTICA,но никак не могу понять,правильно ли я считаю в этой программе,тк прочла несколько разных источников,но ксожалению без указания пошаговой инструкции.У меня получились некоторые данные,но я не могу судить об их правильности.
Подскажите,можно ли посчитать степень влияния факторов с помощью программы,или это только вручную(к счастью нашла формулу),но не могу понять какую считать ошибку(сред.кв.ошибки или ср.квад.ошибки-тк совершенно не понимаю,что они значат).


вообще-то дисперсионный анализ для данной задачи не годится, т.к. развитие заболевания не может быть нормально распределенной величиной, которая необходима для ДА (это либо бинарная величина - развилось/нет, тогда речь идет о логистической регрессии, либо время до наступления заболевания, тогда это анализ выживаемости). Так что задачу надо описать точнее, иначе короткий ответ - ДА дает Вам средние значения вашей зависимой величины в группах, оно и есть влияние.
nokh
Я думаю имеется в виду Effect size measure. Самый известный - эта-квадрат: видел формулы в учебниках, но ни применял сам и не видел как он используется в статьях. Еще можно посчитать компоненты дисперсии, в случае однофакторного ДА один из них будет внутриклассовым коэффициентом корреляции. Такое делал вручную, но сегодня нет времени писать и смотреть где это в Statistica. Там в случае неравных объемов выборок важно правильно рассчитать взешенное n для объема выборки в формулу, это не просто среднее. Коротко обо всем есть здесь в разделе Effect size measures: http://faculty.chass.ncsu.edu/garson/PA765/anova.htm#effect . Задачу описать подробнее действительно стоит, т.к. в случае многофакторного ДА (а тем более с повторными измерениями) и в зависимости от выбранной меры все может оказаться не так просто.
alex3020
Моя проблема такова.Есть доноры и я изучаю донорскую активность,которая бывает низкая,средняя и высокая. В литературе нашла оценку степени влияния медико-биологических факторов на развитие АГ с помощью однофакторного дисперсионного анализа.В статье была приведена таблице,где были указаны ранговое место,степень влияния в %и значение р(все меньше0,05).Ояпть же в литературе (Юнкеров) нашла формулу оценки степени влияния факторов на параметр:
Kj = 100*SSj/суммSSj, Kj - степень влияни фактора на параметр,%,
SSj - сумма квадратов отклонений,
суммSSj - общая сумма квадратов отклонений,включающая контролируемые, неконтролируемые,случайные факторы и ошибки измерения.
Как можно это дело посчитать в STATISTICA ИЛИ прийдется в ручную?И подойдет ли мне этот метод?
плав
Цитата(alex3020 @ 5.05.2009 - 13:10) *
Моя проблема такова.Есть доноры и я изучаю донорскую активность,которая бывает низкая,средняя и высокая. В литературе нашла оценку степени влияния медико-биологических факторов на развитие АГ с помощью однофакторного дисперсионного анализа.В статье была приведена таблице,где были указаны ранговое место,степень влияния в %и значение р(все меньше0,05).Ояпть же в литературе (Юнкеров) нашла формулу оценки степени влияния факторов на параметр:
Kj = 100*SSj/суммSSj, Kj - степень влияни фактора на параметр,%,
SSj - сумма квадратов отклонений,
суммSSj - общая сумма квадратов отклонений,включающая контролируемые, неконтролируемые,случайные факторы и ошибки измерения.
Как можно это дело посчитать в STATISTICA ИЛИ прийдется в ручную?И подойдет ли мне этот метод?

Это не совсем степень влияния, это просто процент общей вариабельности, который объясняется этим фактором.
Факторный анализ - это методика сравнения средних значений в группах. Даже упоминавшийся выше nokh размер эффекта есть не что иное, как различие между средними (дистанция), выраженная в единицах дисперсии (стандратного отклонения).
То, что Вы цитируете, что кто-то изучал влияние факторов на развитие АГ с помощью ДА ситуации не меняет, статистические и логические ошибки при обработке данных распространены очень широко.
Кроме того, в Вашем случае зависмая переменная качественная, а дисперсионный анализ требует количественной зависимой переменной (для анализа, похоже, Вы просто "переворачиваете задачу", так делалось 40 лет назад, когда персональных компьютеров не было)
Соответственно, для Вашей задачи (т.е. влияния набора факторов на качественную зависимую переменную) следует использовать логлинейные модели (если независимые переменные качественные тоже), либо варианты логистической регрессии (учитывая три уровня - ординальную логистическую регресиию) и, сразу уж - нет, STATISTICA ординальную логистическую регрессию не поддерживает, необходимы профессиональные программы - от Stata до R. Либо надо объединять группы доноров и использовать обычную бинарную логистическую регрессию, которую Statistica поддерживает.
В этом случае стандартизованное отношение шансов будет являться показателем силы влияния фактора на результат (донорскую активность).
alex3020
[quote name='плав' date='5.05.2009 - 14:38' post='7774']
Это не совсем степень влияния, это просто процент общей вариабельности, который объясняется этим фактором.
Факторный анализ - это методика сравнения средних значений в группах. Даже упоминавшийся выше nokh размер эффекта есть не что иное, как различие между средними (дистанция), выраженная в единицах дисперсии (стандратного отклонения).
То, что Вы цитируете, что кто-то изучал влияние факторов на развитие АГ с помощью ДА ситуации не меняет, статистические и логические ошибки при обработке данных распространены очень широко.
Кроме того, в Вашем случае зависмая переменная качественная, а дисперсионный анализ требует количественной зависимой переменной (для анализа, похоже, Вы просто "переворачиваете задачу", так делалось 40 лет назад, когда персональных компьютеров не было)
Соответственно, для Вашей задачи (т.е. влияния набора факторов на качественную зависимую переменную) следует использовать логлинейные модели (если независимые переменные качественные тоже), либо варианты логистической регрессии (учитывая три уровня - ординальную логистическую регресиию) и, сразу уж - нет, STATISTICA ординальную логистическую регрессию не поддерживает, необходимы профессиональные программы - от Stata до R. Либо надо объединять группы доноров и использовать обычную бинарную логистическую регрессию, которую Statistica поддерживает.
В этом случае стандартизованное отношение шансов будет являться показателем силы влияния фактора на результат (донорскую активность)

Спасибо за ответ.
Хорошо,что Вы мне подсказали,что надо использовать другой метод,иначе были бы неправильные результаты,чего очень не хочется.
Стандартизированное отношение шансов -это Odds ratio (unit ch)?А в каких это получается единицах измерения?В процентах?Если нет,то как их перевести в %,и корректно ли это будет?
С уважением.
плав
Цитата(alex3020 @ 6.05.2009 - 13:26) *
Спасибо за ответ.
Хорошо,что Вы мне подсказали,что надо использовать другой метод,иначе были бы неправильные результаты,чего очень не хочется.
Стандартизированное отношение шансов -это Odds ratio (unit ch)?А в каких это получается единицах измерения?В процентах?Если нет,то как их перевести в %,и корректно ли это будет?
С уважением.

Надо почитать в учебнике про отношения шансов smile.gif
Отношения шансов - это отношения шансов, т.е. шансы того, что человек окажется активным донором по сравнению с неактивным. Чем выше значение, тем величина сильнее. В % перевести можно, но не принятно, т.е. если ОШ=1,1, то можно рассчитать, что шансы того, что человек будет активным донором на 10% выше.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.