Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Помогите с дискриминантным анализом в R

Автор: alina.K 12.04.2019 - 16:25

Подскажите, как мне сосчитать лямбду Уилкса, функцию групповых центройдов, и также канонические коэффициенты дискриминантной функции.
Возьмём простой Пример
library(MASS)
mydat=iris

#split sample

index <- sample(1:nrow(mydat),round(0.70*nrow(mydat)))
train <- mydat[index,]
test <- mydat[-index,]
str(train)
z <- lda(Species ~ .,data = train)

как мне высчитать эти показатели, как в экселе в R?

 Book1.xlsx ( 9,47 килобайт ) : 232
 

Автор: 100$ 12.04.2019 - 23:27

1. Лямбда Уилкса:
> library(rrcov)
> Wilks.test(Species~.,train)

Для всего остального достаточно просто подать команду:
> z

А познавательная команда str(z) покажет структуру этого объекта: сразу становится видно, до каких полей необходимо "достучаться" с помощью "$".

Автор: alina.K 13.04.2019 - 13:08

100$, благодарствую)
но что - то в
>z не вижу, где тест М-Бокса?
Как мне его высчитать? Если он стат.значим, все не очень хорошо. Если я правильно поняла.

Автор: 100$ 13.04.2019 - 14:44

Цитата(alina.K @ 13.04.2019 - 13:08) *
100$, благодарствую)
но что - то в
>z не вижу, где тест М-Бокса?
Как мне его высчитать? Если он стат.значим, все не очень хорошо. Если я правильно поняла.


М-тест Бокса:

>library(biotools)
>boxM(data, grouping)

По поводу равенства/неравенства ковариашек могу сообщить, что, н-р, квадратичный ДА его и не предполагает.

Автор: alina.K 17.04.2019 - 14:33

100$, а можете подсказать как интерпретировать эту строчку априорных вероятностей.
Prior probabilities of groups:
setosa versicolor virginica
0.3619048 0.3333333 0.3047619
что значит setosa 0,36


А также как мне интерпретировать постериорные вероятности?
p=predict(z,test)
posterior
setosa versicolor virginica
22 1.000000e+00 5.966703e-20 5.555393e-41
23 1.000000e+00 1.638449e-24 5.197733e-48
25 1.000000e+00 4.449308e-16 1.260953e-36

Автор: 100$ 17.04.2019 - 20:50

Цитата(alina.K @ 17.04.2019 - 14:33) *
100$, а можете подсказать как интерпретировать эту строчку априорных вероятностей.
Prior probabilities of groups:
setosa versicolor virginica
0.3619048 0.3333333 0.3047619
что значит setosa 0,36


Да, это доля каждого конкретного сорта в обучающей выборке. Иначе говоря, в вашей обучающей выборке из 105 цветков было 38 сетоз. Откуда a priori p(Setosa)=38/105=.3619048...


Цитата
А также как мне интерпретировать постериорные вероятности?
p=predict(z,test)
posterior
setosa versicolor virginica
22 1.000000e+00 5.966703e-20 5.555393e-41
23 1.000000e+00 1.638449e-24 5.197733e-48
25 1.000000e+00 4.449308e-16 1.260953e-36


Да так и интерпретировать, что построенное по обучающей выборке классифицирующее правило объекты тестовой выборки с номерами 22, 23 и 25 считает принадлежащими классу Setosa с единичной вероятностью.

Автор: alina.K 18.04.2019 - 12:23

Всё, вы очень помогли. А почему МАНОВА требует чтобы M-BOX не был стат значим, что говорит о том, что многомерные методы уместно использовать. а линейный ДА не требует.

Автор: 100$ 18.04.2019 - 20:47

Цитата(alina.K @ 18.04.2019 - 12:23) *
Всё, вы очень помогли. А почему МАНОВА требует чтобы M-BOX не был стат значим, что говорит о том, что многомерные методы уместно использовать. а линейный ДА не требует.


Линейная модель требует гомогенности ковариашек, квадратичная (то бишь нелинейная) - нет.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)