Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Помогите с дискриминантным анализом в R
alina.K
сообщение 12.04.2019 - 16:25
Сообщение #1





Группа: Пользователи
Сообщений: 12
Регистрация: 3.02.2018
Пользователь №: 30923



Подскажите, как мне сосчитать лямбду Уилкса, функцию групповых центройдов, и также канонические коэффициенты дискриминантной функции.
Возьмём простой Пример
library(MASS)
mydat=iris

#split sample

index <- sample(1:nrow(mydat),round(0.70*nrow(mydat)))
train <- mydat[index,]
test <- mydat[-index,]
str(train)
z <- lda(Species ~ .,data = train)

как мне высчитать эти показатели, как в экселе в R?
Прикрепленные файлы
Прикрепленный файл  Book1.xlsx ( 9,47 килобайт ) Кол-во скачиваний: 227
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 12.04.2019 - 23:27
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



1. Лямбда Уилкса:
> library(rrcov)
> Wilks.test(Species~.,train)

Для всего остального достаточно просто подать команду:
> z

А познавательная команда str(z) покажет структуру этого объекта: сразу становится видно, до каких полей необходимо "достучаться" с помощью "$".

Сообщение отредактировал 100$ - 12.04.2019 - 23:27
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
alina.K
сообщение 13.04.2019 - 13:08
Сообщение #3





Группа: Пользователи
Сообщений: 12
Регистрация: 3.02.2018
Пользователь №: 30923



100$, благодарствую)
но что - то в
>z не вижу, где тест М-Бокса?
Как мне его высчитать? Если он стат.значим, все не очень хорошо. Если я правильно поняла.

Сообщение отредактировал alina.K - 13.04.2019 - 13:09
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 13.04.2019 - 14:44
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(alina.K @ 13.04.2019 - 13:08) *
100$, благодарствую)
но что - то в
>z не вижу, где тест М-Бокса?
Как мне его высчитать? Если он стат.значим, все не очень хорошо. Если я правильно поняла.


М-тест Бокса:

>library(biotools)
>boxM(data, grouping)

По поводу равенства/неравенства ковариашек могу сообщить, что, н-р, квадратичный ДА его и не предполагает.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
alina.K
сообщение 17.04.2019 - 14:33
Сообщение #5





Группа: Пользователи
Сообщений: 12
Регистрация: 3.02.2018
Пользователь №: 30923



100$, а можете подсказать как интерпретировать эту строчку априорных вероятностей.
Prior probabilities of groups:
setosa versicolor virginica
0.3619048 0.3333333 0.3047619
что значит setosa 0,36


А также как мне интерпретировать постериорные вероятности?
p=predict(z,test)
posterior
setosa versicolor virginica
22 1.000000e+00 5.966703e-20 5.555393e-41
23 1.000000e+00 1.638449e-24 5.197733e-48
25 1.000000e+00 4.449308e-16 1.260953e-36

Сообщение отредактировал alina.K - 17.04.2019 - 14:42
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 17.04.2019 - 20:50
Сообщение #6





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(alina.K @ 17.04.2019 - 14:33) *
100$, а можете подсказать как интерпретировать эту строчку априорных вероятностей.
Prior probabilities of groups:
setosa versicolor virginica
0.3619048 0.3333333 0.3047619
что значит setosa 0,36


Да, это доля каждого конкретного сорта в обучающей выборке. Иначе говоря, в вашей обучающей выборке из 105 цветков было 38 сетоз. Откуда a priori p(Setosa)=38/105=.3619048...


Цитата
А также как мне интерпретировать постериорные вероятности?
p=predict(z,test)
posterior
setosa versicolor virginica
22 1.000000e+00 5.966703e-20 5.555393e-41
23 1.000000e+00 1.638449e-24 5.197733e-48
25 1.000000e+00 4.449308e-16 1.260953e-36


Да так и интерпретировать, что построенное по обучающей выборке классифицирующее правило объекты тестовой выборки с номерами 22, 23 и 25 считает принадлежащими классу Setosa с единичной вероятностью.

Сообщение отредактировал 100$ - 17.04.2019 - 20:53
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
alina.K
сообщение 18.04.2019 - 12:23
Сообщение #7





Группа: Пользователи
Сообщений: 12
Регистрация: 3.02.2018
Пользователь №: 30923



Всё, вы очень помогли. А почему МАНОВА требует чтобы M-BOX не был стат значим, что говорит о том, что многомерные методы уместно использовать. а линейный ДА не требует.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 18.04.2019 - 20:47
Сообщение #8





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(alina.K @ 18.04.2019 - 12:23) *
Всё, вы очень помогли. А почему МАНОВА требует чтобы M-BOX не был стат значим, что говорит о том, что многомерные методы уместно использовать. а линейный ДА не требует.


Линейная модель требует гомогенности ковариашек, квадратичная (то бишь нелинейная) - нет.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему