Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Выбор типа анализа, количественные и категориальные переменные
Blaid
сообщение 8.09.2021 - 18:18
Сообщение #1





Группа: Пользователи
Сообщений: 36
Регистрация: 27.08.2012
Пользователь №: 24128



Здравствуйте уважаемые участники форума!

Обращаюсь к Вам за помощью в решении следующего вопроса:

1. есть одна переменная отклика (или зависимая переменная) - удельная активность Cs-137 в древесине (Бк/кг); количественная.
2. есть три независимых (или предикторных) переменных - одна количественная (плотность загрязнения территории произрастания по Cs-137, Ки/км2) и две категориальных (одна из них - тип древесной породы (сосна, береза, ольха), а вторая - тип сосняка (мшистый, вересковый, черничный и лишайниковый); основная порода - сосна, а остальные (береза, ольха) идут как примесь в сосняках этих четырех типов).

Задача: установить какие из этих трёх независимых (предикторных) переменных оказывают статистически значимое влияние на вариацию зависимой переменной и дать количественную оценку влиянию каждой независимой переменной (т.е. насколько (в процентах) общая вариация (или дисперсия?) зависимой переменной обусловлена влиянием той или иной независимой переменной). И желательно бы ещё на основе имеющихся данных прогнозировать удельную активность древесины (т.е. при произрастании в сосняке мшистом, имеющим такую-то плотность загрязнения, в березе будет такой-то уровень удельной активности Cs-137).

Вот я затрудняюсь подобрать наиболее подходящий тип анализа для вышеизложенной структуры данных.

Множественная регрессия? Ну так в этом случае используются количественные предикторы.

Логистическая регрессия? Насколько знаю в этом случае переменная отклика является дихотомической (например да/нет) или категориальной.

Хорошо бы ещё (простите мне мою наглость) указать стат. пакеты, где реализованы искомые мною типы анализов (просьба пакет R не предлагать - мне бы что-нибудь с готовыми кнопочными интерфейсами типа SPSS, STATISTICA, поскольку с R я не дружу; шучу, конечно - если будет нужен R, то придётся разбираться).

Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Blaid
сообщение 10.09.2021 - 09:22
Сообщение #2





Группа: Пользователи
Сообщений: 36
Регистрация: 27.08.2012
Пользователь №: 24128



100$! Спасибо за участие в обсуждении темы!

Вы, часом, монополией на истину не обладаете? Если да, то поделитесь, будьте добры!

Цитата
А почему вместо заявленных 20-ти значений в базе данных только 19? Тут каждая цифирь на вес золота...


Не точно указал, что их 20 (19 на самом деле). Это тестовая выборка (у меня в наличии гораздо больше подобных данных, да ещё в виде динамики за несколько лет и относящихся к разным лесничествам, т.е. теоретически имеется ещё два предиктора), но пока так для понимания "чего и как".

Цитата
Это чушь.


Кому как. Вам виднее.

Это лишь моё предположение, что эти данные можно обработать каким-нибудь типом регрессионного анализа (допустим multiple regression with categorical predictors, если таковой существует).

Из всего Вами написанного я понял только, что структуру данных нужно упрощать и не пытаться оценить влияния на удельную активность Cs-137 в древесине "всего сразу" (да, мои проблемы что не понял больше; если, конечно, что-то большее в написанном Вами в принципе имеется).

Сообщение отредактировал Blaid - 10.09.2021 - 09:24
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 10.09.2021 - 12:04
Сообщение #3





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Blaid @ 10.09.2021 - 09:22) *
100$! Спасибо за участие в обсуждении темы!

Вы, часом, монополией на истину не обладаете? Если да, то поделитесь, будьте добры!


Уже поделился, как видите.


Цитата
Не точно указал, что их 20 (19 на самом деле). Это тестовая выборка (у меня в наличии гораздо больше подобных данных, да ещё в виде динамики за несколько лет и относящихся к разным лесничествам, т.е. теоретически имеется ещё два предиктора), но пока так для понимания "чего и как".


Очень жаль, что вы нам скармливаете информацию по частям.


Цитата
Кому как. Вам виднее.


Даже не сомневайтесь. Слово "чушь" относилось к вашему пониманию соотношения между корреляцией и к-том детерминации.


Цитата
Это лишь моё предположение, что эти данные можно обработать каким-нибудь типом регрессионного анализа (допустим multiple regression with categorical predictors, если таковой существует).


Что касается собственно регрессии/анализа - то базовая модель для вашего случая - обычная ANCOVA. Я так же, как и comisora, не поленился прологарифмировать переменную-отклик.

Цитата
Из всего Вами написанного я понял только, что структуру данных нужно упрощать и не пытаться оценить влияния на удельную активность Cs-137 в древесине "всего сразу" (да, мои проблемы что не понял больше; если, конечно, что-то большее в написанном Вами в принципе имеется).


Имеется. Это объяснение того, почему то, что вы сотворили, недопустимо со статистической точки зрения.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему