Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Смешанная регрессия?
зоо
сообщение 6.12.2017 - 17:20
Сообщение #1





Группа: Пользователи
Сообщений: 24
Регистрация: 6.12.2017
Пользователь №: 30681



Подскажите, пожалуйста, вопрос из зоологии. Мне нужно посмотреть регрессионную модель вида:
y = YG + MG + YG×MG + L + МС
где y это масса коровы (метрич.пер)
YG ? эффект года рождения кат.пер.;
MG ? эффект месяца рождения кат.пер;
YG×MG ? совместное влияние факторов ?месяц × год рождения?;
L ? эффект линейной принадлежности кат.пер;
MC ? эффект месяца отела; кат. пер
для каждого из этих предикторов мне нужно построить табличку вида, как на картинке, где в ячейках должен быть скорректированный R^2.


Конечно, я бы мог сделать нечто
mymodel<-lm(y~YG,data=data)
Но это нужно делать для каждой из указанных независимой переменной, при том что у меня зависимых переменных много. Такая табличка будет для ряда зависимых переменных
Можно ли сделать в R, чтобы ввести это уравнение и он для каждой независимой переменной рассчитал регрессионные данные(коэф-ты, R^2) по отдельности?

Данные зазиппировал. т.к. на форуме я обратил внимание , что тут нельзя эксель кидать.
Эскизы прикрепленных изображений
Прикрепленное изображение
 

Прикрепленные файлы
Прикрепленный файл  data.zip ( 2,53 килобайт ) Кол-во скачиваний: 232
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 7.12.2017 - 09:42
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(зоо @ 6.12.2017 - 17:20) *
Подскажите, пожалуйста, вопрос из зоологии. Мне нужно посмотреть регрессионную модель вида:
y = YG + MG + YG×MG + L + МС
где y это масса коровы (метрич.пер)
YG ? эффект года рождения кат.пер.;
MG ? эффект месяца рождения кат.пер;
YG×MG ? совместное влияние факторов ?месяц × год рождения?;
L ? эффект линейной принадлежности кат.пер;
MC ? эффект месяца отела; кат. пер
для каждого из этих предикторов мне нужно построить табличку вида, как на картинке, где в ячейках должен быть скорректированный R^2.


Конечно, я бы мог сделать нечто
mymodel<-lm(y~YG,data=data)
Но это нужно делать для каждой из указанных независимой переменной, при том что у меня зависимых переменных много. Такая табличка будет для ряда зависимых переменных
Можно ли сделать в R, чтобы ввести это уравнение и он для каждой независимой переменной рассчитал регрессионные данные(коэф-ты, R^2) по отдельности?

Данные зазиппировал. т.к. на форуме я обратил внимание , что тут нельзя эксель кидать.



Стандартные репорты о моделях печатает apsrtable, stargazer.

Вот так лепить детерминацию исключая все остальные переменные модели я бы не стал, есть масса методов отбора переменных в модель более вменяемых.



Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 7.12.2017 - 11:51
Сообщение #3





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



А почему в регрессии напрочь отсутствует константа? Это что - новая мода на переднем крае науки?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
зоо
сообщение 7.12.2017 - 21:01
Сообщение #4





Группа: Пользователи
Сообщений: 24
Регистрация: 6.12.2017
Пользователь №: 30681



Не совсем мода, просто второпях писал.
Ну ладно, если нельзя так, нельзя

Подскажите, тогда, пожалуйста, теоретический вопрос
Код
Влияние включѐнных в модель факторов на фенотипиче-
скую изменчивость признака рассчитывается путѐм деления ча-
стных (факториальных) сумм квадратов дисперсионного анализа
на общую сумму квадратов.


Где в ANOVA частные суммы квадратов?
Как они обозначаются? Ну или как их найти.
там же есть средний квадрат (ms)
Сумма квадратов(SS)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 7.12.2017 - 22:29
Сообщение #5





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(зоо @ 7.12.2017 - 21:01) *
Где в ANOVA частные суммы квадратов?
Как они обозначаются? Ну или как их найти.
там же есть средний квадрат (ms)
Сумма квадратов(SS)


В протоколах статпакетов они чаще всего фигурируют как Type III SS. Для каждого фактора и ошибок.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 7.12.2017 - 23:02
Сообщение #6





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



А какова всё-таки цель работы? От этого зависят ответы.
1) Если цель - прогноз, то регрессия типа вашей уместна. Другое дело, что данных для неё маловато (есть редкие сочетания предикторов). И не совсем ясна практическая польза: её можно использовать только для тех лет, которые есть в наборе, т.к. фактор "Год" - случайный, т.е. его нельзя воспроизвести в других исследованиях (в отличие от месяца или породы).
2) Если цель - разобраться с влиянием на признак всяких факторов и их взаимодействий, то просится ANOVA. Но процитированный вами отрывок - грубый подход. По хорошему здесь нужно раскладывать изменчивость (дисперсию) на компоненты. Это делается исходя из формул математических ожидаемых средних квадратов: оттуда берутся дисперсии (для случайных эффектов) или квадратичные формы (для фиксированных эффектов), всё суммируется и пересчитывается в %. По-русски можно прочитать в Дуглас Монтгомери "Планирование эксперимента и анализ данных" (есть в сети). Пакеты могут с этим справляться плохо, т.к. работают с моделями случайных эффектов, а не смешанных. Но может какие-то и справятся. Найдёте - поделитесь, надоело вручную считать...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 7.12.2017 - 23:55
Сообщение #7





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nokh @ 7.12.2017 - 23:02) *
Но может какие-то и справятся. Найдёте - поделитесь, надоело вручную считать...


А вот это - не оно? Сам, правда, не пробовал. Так, на периферии сознания завалялось...
Ссылка
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
зоо
сообщение 8.12.2017 - 14:32
Сообщение #8





Группа: Пользователи
Сообщений: 24
Регистрация: 6.12.2017
Пользователь №: 30681



Спасибо, я нашел простое решение для расчета TYPE III SS,
library("car")
Anova(lm1 <- lm(DV ~ IV, data=sample.data,
contrasts=list(IV=contr.poly)), type="III")
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 18.12.2017 - 21:45
Сообщение #9





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(100$ @ 8.12.2017 - 01:55) *
А вот это - не оно? Сам, правда, не пробовал. Так, на периферии сознания завалялось...
Ссылка

Благодарю, по описанию должно подойти, хотя тоже пока не пробовал). Ещё ракет VCA (https://cran.r-project.org/web/packages/VCA/VCA.pdf) должен считать. Потихоньку в R двигаюсь, в следующий раз как данные будут - поробую. Только автор топика меня не услышал - ищет там где светлее... Не иначе по книгам Плохинского дисперсионный анализ осваивает. Зоологи и ветеринары - они такие! smile.gif

Байка. Лет 10 назад у меня директор в наш головной ветеринарный НИИ приехал с годовым отчётом. А там средние с 95% ДИ в таблицах были бутстрепом (ВСа) посчитаны: специально boot под R ставил и робко её пользовал. Короче, в целом, похвалили уральцев, только говорят нужно было данные статистически обработать и +/- стандартную ошибку привести.

Сообщение отредактировал nokh - 18.12.2017 - 22:46
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 19.12.2017 - 20:59
Сообщение #10





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nokh @ 18.12.2017 - 21:45) *
Благодарю, по описанию должно подойти, хотя тоже пока не пробовал). Ещё ракет VCA (https://cran.r-project.org/web/packages/VCA/VCA.pdf) должен считать. Потихоньку в R двигаюсь, в следующий раз как данные будут - поробую.


Чесслово, не стоит благодарности.

Цитата
Байка. Лет 10 назад у меня директор в наш головной ветеринарный НИИ приехал с годовым отчётом. А там средние с 95% ДИ в таблицах были бутстрепом (ВСа) посчитаны: специально boot под R ставил и робко её пользовал. Короче, в целом, похвалили уральцев, только говорят нужно было данные статистически обработать и +/- стандартную ошибку привести.


Оно и неудивительно. Для большинства исследователей стат. обработка - это набор шаманских ритуалов, которые невозможно понять, надо просто запомнить. Вот они и запомнили. По принципу "В русском языке слова "сол" и "фасол" пишутся с мягким знаком, слова "вильк" и "тарельк" - без мягкого знака".
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему