Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Процентное содержание фракций, правильно обработать данные
Света K
сообщение 23.11.2017 - 16:13
Сообщение #1





Группа: Пользователи
Сообщений: 19
Регистрация: 15.12.2011
Пользователь №: 23369



Имеются данные (процентное содержание фракций A, B и C (столбцы 2-4) и общее количество (столбец 1) определенных липидов в плазме), взятые у одного контрольного индивида (1) и полсотни испытуемых (2-48) после воздействия неким агентом. Как правильно статистически обработать эти данные, и какие и чем обоснованные выводы в результате можно сделать?
Прикрепленные файлы
Прикрепленный файл  Фракционный_состав.zip ( 646 байт ) Кол-во скачиваний: 256
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
p2004r
сообщение 23.11.2017 - 19:49
Сообщение #2





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Света K @ 23.11.2017 - 16:13) *
Имеются данные (процентное содержание фракций A, B и C (столбцы 2-4) и общее количество (столбец 1) определенных липидов в плазме), взятые у одного контрольного индивида (1) и полсотни испытуемых (2-48) после воздействия неким агентом. Как правильно статистически обработать эти данные, и какие и чем обоснованные выводы в результате можно сделать?


"Обработать" это жаргон ничего увы конкретного не означающий.

1.

Очень странный набор данных.

Если у нас есть точка и выборка, то все что мы можем сделать это построить процентили распределения и посмотреть на какой из них попала именно эта точка.

mvtnorm: Multivariate Normal and t Distributions https://cran.r-project.org/web/packages/mvt...s/MVT_Rnews.pdf

2. Можно просто посмотреть что там в датасете "глазами"

Вот например читаем данные и смотрим на большую часть дисперсии в них. Номера точки соответствуют нумерации в файле
Код
> df.lipid <-read.csv2("Фракционный состав.csv", header=F)
> plot(prcomp(df.lipid[,2:4]/df.lipid[,1], center=T, scale.=T))
> biplot(prcomp(df.lipid[,2:4]/df.lipid[,1], center=T, scale.=T))


Ну и например можно оценить где здесь среднее арифметическое многомерного распределения, и его квантили визуально оценить бутсрепом.

Код
> butstrep <- do.call(rbind,
                                  replicate(10000,
                                                  predict(df.lipid.pca,
                                                               data.frame(t(colMeans((df.lipid[-1,2:4]/df.lipid[-1,1])[sample(1:(48-1), replace=T),])))),
                                                  simplify=F) )

> plot(df.lipid.pca$x[,1:2])
> points(butstrep[,1:2], pch=".")


Сообщение отредактировал p2004r - 23.11.2017 - 19:50
Эскизы прикрепленных изображений
Прикрепленное изображение
Прикрепленное изображение
Прикрепленное изображение
 


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Света K
сообщение 29.11.2017 - 01:09
Сообщение #3





Группа: Пользователи
Сообщений: 19
Регистрация: 15.12.2011
Пользователь №: 23369



Цитата(p2004r @ 23.11.2017 - 20:49) *
читаем данные и смотрим на большую часть дисперсии в них. Номера точки соответствуют нумерации в файле

Это я так понимаю второй рисунок? А на первом что за 3 разных столбца с дисперсией? Фракция А варьирует значительно сильнее чем В, а В сильнее чем С? Можете объяснить?

Цитата(p2004r)
Прочитайте что такое тернарный график https://en.wikipedia.org/wiki/Ternary_plot

Читаю данное пояснение и вижу, что это все-таки не то, даже совсем не то. Тут написано, что тернарные графики используются для показа состава смесей, состоящих из 3-х компонентов или показа условий когда три отдельные фазы существуют в равновесии. У меня ничего такого нет, да я и так знаю, что эти фракции у каждого индивида существуют в равновесии, у меня есть действующий агент, и надо бы статистически доказать повлиял/не повлиял ли он (и как именно) на общий/фракционный состав смеси. Т.е. есть ли какой-либо эффект он него? Да и не 3 компонента может быть, а до 10 (хотя какая разница), сейчас например я делаю опыт где определяю уже 5 фракций.

Цитата(passant)
Существуют десятки пакетов для R с реализацией различных алгоритмов кластерного анализа...Выбирайте любой.

Что-то не получается. Беру первый попавшийся пакет cluster с настройками по умолчанию - строит дендрограмму, но разделения на отдельные группы там нет. Есть в пакете еще куча всяких опций, но разобраться в них самостоятельно я не смогу.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 29.11.2017 - 12:25
Сообщение #4





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Света K @ 29.11.2017 - 01:09) *
Это я так понимаю второй рисунок? А на первом что за 3 разных столбца с дисперсией? Фракция А варьирует значительно сильнее чем В, а В сильнее чем С? Можете объяснить?


Читаю данное пояснение и вижу, что это все-таки не то, даже совсем не то. Тут написано, что тернарные графики используются для показа состава смесей, состоящих из 3-х компонентов или показа условий когда три отдельные фазы существуют в равновесии. У меня ничего такого нет, да я и так знаю, что эти фракции у каждого индивида существуют в равновесии, у меня есть действующий агент, и надо бы статистически доказать повлиял/не повлиял ли он (и как именно) на общий/фракционный состав смеси. Т.е. есть ли какой-либо эффект он него? Да и не 3 компонента может быть, а до 10 (хотя какая разница), сейчас например я делаю опыт где определяю уже 5 фракций.


1) Прочитайте сначала https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%...%B5%D0%BD%D1%82 потом будет уместно задавать вопросы.


2) я поделил на количество, это видите? (хотя, какая разница)


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Света K
сообщение 1.12.2017 - 15:47
Сообщение #5





Группа: Пользователи
Сообщений: 19
Регистрация: 15.12.2011
Пользователь №: 23369



Ответить раньше не было возможности, - другие идеи, другой эксперимент, другие анализы...

Цитата(p2004r @ 29.11.2017 - 13:25) *
1) Прочитайте сначала ...

Спасибо, но пока не понятно. По вашей ссылке написано, что на рис.2 проведен тест на уменьшение размерности данных трех моих фракций (хотя какая разница сколько фракций), а красные линии - это линии вдоль которых дисперсия по каждой фракции максимальна. Т.е. Вы вроде бы свели всю матрицу моих данных по 3 фракциям подопытных к трем векторам и возможно варьирование фракции А - это линия V2, а фракции С - это V4. Если это так - то тут понятно. Ну а дальше что? Что обозначают оси, причем разные, с разными обозначениями, и с отрицательными значениями, куда направлены вектора, и, самое главное, как это описывать и подавать; что важно, что - нет. Мне кажется, что Вы просто "забываете", что я не знаю этого вопроса, поэтому нуждаюсь в конкретных ответах, а не в пересылках на другие ресурсы (хотя, наверняка полезных).

Цитата(p2004r)
я поделил на количество, это видите?

Нет, из такого объяснения не видно что на что Вы делили. Может Вы конечно объясняете не мне, а самому себе (хотя, возможно, какая вам разница), тогда, наверное, и видно. Но если вы все-таки хотите помочь разобраться именно мне, тогда что показывает и как интерпретировать каждый из 3-х столбцов с дисперсией на рис.1 - пока не видно.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Света K   Процентное содержание фракций   23.11.2017 - 16:13
- - p2004r   Цитата(Света K @ 23.11.2017 - 16:13)...   23.11.2017 - 19:49
|- - Света K   Цитата(p2004r @ 23.11.2017 - 20:49) ...   29.11.2017 - 01:09
|- - p2004r   Цитата(Света K @ 29.11.2017 - 01:09)...   29.11.2017 - 12:25
|- - Света K   Ответить раньше не было возможности, - другие идеи...   1.12.2017 - 15:47
- - passant   Ну у вас и примерчики. То выборки из четырех элмен...   23.11.2017 - 22:43
- - nokh   >p2004r С обычным PCA здесь засада в виде компо...   23.11.2017 - 22:46
|- - p2004r   Цитата(nokh @ 23.11.2017 - 22:46) ...   24.11.2017 - 01:35
||- - nokh   Цитата(p2004r @ 24.11.2017 - 03:35) ...   27.11.2017 - 06:51
|- - p2004r   Цитата(nokh @ 23.11.2017 - 22:46) ...   24.11.2017 - 08:56
- - Света K   Цитата(p2004r @ 23.11.2017 - 20:49) ...   24.11.2017 - 10:30
|- - p2004r   Цитата(Света K @ 24.11.2017 - 10:30)...   24.11.2017 - 11:06
|- - p2004r   Цитата(Света K @ 24.11.2017 - 10:30)...   24.11.2017 - 11:13
|- - passant   Цитата(Света K @ 24.11.2017 - 10:30)...   24.11.2017 - 14:38
- - Света K   Цитата(p2004r @ 23.11.2017 - 20:49) ...   24.11.2017 - 18:45
|- - p2004r   Цитата(Света K @ 24.11.2017 - 18:45)...   24.11.2017 - 21:55
||- - Света K   Цитата(p2004r @ 24.11.2017 - 22:55) ...   27.11.2017 - 14:51
||- - 100$   Цитата(Света K @ 27.11.2017 - 14:51)...   27.11.2017 - 17:59
|- - p2004r   Цитата(Света K @ 24.11.2017 - 18:45)...   25.11.2017 - 20:14
- - comisora   2 p2004r Добрый вечер. У Вас df.rand1 <- t(app...   25.11.2017 - 22:48
|- - p2004r   Цитата(comisora @ 25.11.2017 - 22:48...   26.11.2017 - 20:02
- - comisora   2 p2004r, nokh Спасибо за информацию. Оставлю то,...   28.11.2017 - 20:27
- - nokh   Я тут подумал и решил усомниться в исходно компози...   29.11.2017 - 00:25


Добавить ответ в эту темуОткрыть тему