Цитата(Света K @ 23.11.2017 - 16:13)

Имеются данные (процентное содержание фракций A, B и C (столбцы 2-4) и общее количество (столбец 1) определенных липидов в плазме), взятые у одного контрольного индивида (1) и полсотни испытуемых (2-48) после воздействия неким агентом. Как правильно статистически обработать эти данные, и какие и чем обоснованные выводы в результате можно сделать?
"Обработать" это жаргон ничего увы конкретного не означающий.
1.
Очень странный набор данных.
Если у нас есть точка и выборка, то все что мы можем сделать это построить процентили распределения и посмотреть на какой из них попала именно эта точка.
mvtnorm: Multivariate Normal and t Distributions
https://cran.r-project.org/web/packages/mvt...s/MVT_Rnews.pdf2. Можно просто посмотреть что там в датасете "глазами"
Вот например читаем данные и смотрим на большую часть дисперсии в них. Номера точки соответствуют нумерации в файле
Код
> df.lipid <-read.csv2("Фракционный состав.csv", header=F)
> plot(prcomp(df.lipid[,2:4]/df.lipid[,1], center=T, scale.=T))
> biplot(prcomp(df.lipid[,2:4]/df.lipid[,1], center=T, scale.=T))
Ну и например можно оценить где здесь среднее арифметическое многомерного распределения, и его квантили визуально оценить бутсрепом.
Код
> butstrep <- do.call(rbind,
replicate(10000,
predict(df.lipid.pca,
data.frame(t(colMeans((df.lipid[-1,2:4]/df.lipid[-1,1])[sample(1:(48-1), replace=T),])))),
simplify=F) )
> plot(df.lipid.pca$x[,1:2])
> points(butstrep[,1:2], pch=".")