Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Выбор типа анализа, количественные и категориальные переменные
Blaid
сообщение 8.09.2021 - 18:18
Сообщение #1





Группа: Пользователи
Сообщений: 36
Регистрация: 27.08.2012
Пользователь №: 24128



Здравствуйте уважаемые участники форума!

Обращаюсь к Вам за помощью в решении следующего вопроса:

1. есть одна переменная отклика (или зависимая переменная) - удельная активность Cs-137 в древесине (Бк/кг); количественная.
2. есть три независимых (или предикторных) переменных - одна количественная (плотность загрязнения территории произрастания по Cs-137, Ки/км2) и две категориальных (одна из них - тип древесной породы (сосна, береза, ольха), а вторая - тип сосняка (мшистый, вересковый, черничный и лишайниковый); основная порода - сосна, а остальные (береза, ольха) идут как примесь в сосняках этих четырех типов).

Задача: установить какие из этих трёх независимых (предикторных) переменных оказывают статистически значимое влияние на вариацию зависимой переменной и дать количественную оценку влиянию каждой независимой переменной (т.е. насколько (в процентах) общая вариация (или дисперсия?) зависимой переменной обусловлена влиянием той или иной независимой переменной). И желательно бы ещё на основе имеющихся данных прогнозировать удельную активность древесины (т.е. при произрастании в сосняке мшистом, имеющим такую-то плотность загрязнения, в березе будет такой-то уровень удельной активности Cs-137).

Вот я затрудняюсь подобрать наиболее подходящий тип анализа для вышеизложенной структуры данных.

Множественная регрессия? Ну так в этом случае используются количественные предикторы.

Логистическая регрессия? Насколько знаю в этом случае переменная отклика является дихотомической (например да/нет) или категориальной.

Хорошо бы ещё (простите мне мою наглость) указать стат. пакеты, где реализованы искомые мною типы анализов (просьба пакет R не предлагать - мне бы что-нибудь с готовыми кнопочными интерфейсами типа SPSS, STATISTICA, поскольку с R я не дружу; шучу, конечно - если будет нужен R, то придётся разбираться).

Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
passant
сообщение 9.09.2021 - 15:57
Сообщение #2





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(comisora @ 9.09.2021 - 10:02) *
2 passant

Простую регрессию (simple regression model) можно сделать три раза для каждой переменной, почитав руководство к JASP с целью тренировки и обучения.


Извините, но не три раза. Регрессионная модель - по определению - требует, что-бы и предикторные и зависимая (зависимые) переменные были количественные. А такую зависимость для данной задачи можно строить для каждой пары ЗНАЧЕНИЙ номинальных (качественных) признаков. Другими словами - отдельная модель для (береза, вересковый), отдельная для (береза, лишайниковый), ..... отдельно для (ольха, вересковый), отдельная для (ольха, лишайниковый) и т.д. А учитывая, что у ТС всего-то 20 примеров в наличии, а пар 3*4=12, то чуть больше одного (!!!) примера на каждую возможную комбинацию. И какую модель вы предлагаете строить?

И еще вопрос. Вот в этом уравнении Y=b1*Plotnost+b2*Poroda+b3*Sosnak+b0+e - какие значения у вас могут принимать коэффициенты b2, b3, Poroda, Sosnak. Так что-бы операция умножения имела смысл? Я понимаю, вы намекаете на введение т.н. Dummy-переменных, но их-то у вас должно быть не две, а как минимум 7. И то, что строиться таким образом хоть и называют "регрессией" (как и логистическую регрессию, кстати), но по сути представляет собой типичную классификационную модель (практически - классификация на основе деревьев).


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему