Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Выбор типа анализа, количественные и категориальные переменные
Blaid
сообщение 8.09.2021 - 18:18
Сообщение #1





Группа: Пользователи
Сообщений: 36
Регистрация: 27.08.2012
Пользователь №: 24128



Здравствуйте уважаемые участники форума!

Обращаюсь к Вам за помощью в решении следующего вопроса:

1. есть одна переменная отклика (или зависимая переменная) - удельная активность Cs-137 в древесине (Бк/кг); количественная.
2. есть три независимых (или предикторных) переменных - одна количественная (плотность загрязнения территории произрастания по Cs-137, Ки/км2) и две категориальных (одна из них - тип древесной породы (сосна, береза, ольха), а вторая - тип сосняка (мшистый, вересковый, черничный и лишайниковый); основная порода - сосна, а остальные (береза, ольха) идут как примесь в сосняках этих четырех типов).

Задача: установить какие из этих трёх независимых (предикторных) переменных оказывают статистически значимое влияние на вариацию зависимой переменной и дать количественную оценку влиянию каждой независимой переменной (т.е. насколько (в процентах) общая вариация (или дисперсия?) зависимой переменной обусловлена влиянием той или иной независимой переменной). И желательно бы ещё на основе имеющихся данных прогнозировать удельную активность древесины (т.е. при произрастании в сосняке мшистом, имеющим такую-то плотность загрязнения, в березе будет такой-то уровень удельной активности Cs-137).

Вот я затрудняюсь подобрать наиболее подходящий тип анализа для вышеизложенной структуры данных.

Множественная регрессия? Ну так в этом случае используются количественные предикторы.

Логистическая регрессия? Насколько знаю в этом случае переменная отклика является дихотомической (например да/нет) или категориальной.

Хорошо бы ещё (простите мне мою наглость) указать стат. пакеты, где реализованы искомые мною типы анализов (просьба пакет R не предлагать - мне бы что-нибудь с готовыми кнопочными интерфейсами типа SPSS, STATISTICA, поскольку с R я не дружу; шучу, конечно - если будет нужен R, то придётся разбираться).

Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Blaid
сообщение 9.09.2021 - 09:10
Сообщение #2





Группа: Пользователи
Сообщений: 36
Регистрация: 27.08.2012
Пользователь №: 24128



Благодарю участников за информацию!

Да, ещё раз хотел бы акцентировать внимание на том, что две из трёх независимых (предикторных) переменных - категориальные (не знаю одно ли это и то же, что и номинальные). Предикторная переменная "тип древесной породы" имеет три категории (сосна, береза, ольха), а предикторная переменная "тип сосняка" - четыре (по типам сосняков - мшистый, вересковый, черничный и лишайниковый). Третья предикторная переменная (плотность загрязнения территории) - количественная. Ну и сама переменная отклика тоже количественная.

Прогнозирование удельной активности Cs-137 (на основе имеющихся данных) - это, скажем так, опционально. В первую очередь нужно оценить (количественно бы) влияние предикторов на переменную отклика (выяснив, проще говоря, какие из предикторных переменных статистически значимо влияют на вариацию переменной отклика и насколько каждая из них это делает).
Поэтому нейронные сети сходу слишком круто будет (да и у меня пока выборка данных небольшая - 20 значений). Но как знать...

Я тоже подумал сперва о логистической регрессии, но потом пришёл к выводу, что обычная логрегрессия (с дихотомической переменной отклика) не то...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему