Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> Процентное содержание фракций, правильно обработать данные
nokh
сообщение 27.11.2017 - 06:51
Сообщение #16





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(p2004r @ 24.11.2017 - 03:35) *
PCA прекрасно расправляет "смеси" в тернарные трафики, отжимая лишнюю размерность. Здесь просто крайне мал размах варьирования состава, вот и не видно результирующего "треугольника(пирамиды)".

Прикольно! У меня никогда не было столько данных, чтобы увидеть треугольник, а с симуляциями не играл.
Цитата(comisora @ 26.11.2017 - 00:48) *
... Можете показать пример, как "сравнить/обработать" p1 и p2 и заполучить "заветное p<0.05"?

Сравнить два набора PC можно прокрустовым анализом с расчётом р рандомизационным критерием.
library(vegan)
protest(p1, p2, scores = "sites", permutations = how(nperm = 999))
#можно посмотреть статистику и разности матриц после прокрустова преобразования для определения наиболее сильных невязок:
difpc12<-procrustes(p1,p2)
summary(difpc12)
plot(difpc12)
plot(difpc12, kind=2)

Сообщение отредактировал nokh - 27.11.2017 - 07:13
Эскизы прикрепленных изображений
Прикрепленное изображение
 
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Света K
сообщение 27.11.2017 - 14:51
Сообщение #17





Группа: Пользователи
Сообщений: 19
Регистрация: 15.12.2011
Пользователь №: 23369



Цитата(p2004r @ 24.11.2017 - 22:55) *
пропущена строчка сохранения результатов PCA

df.lipid.pca <- prcomp(df.lipid[,2:4]/df.lipid[,1], center=T, scale.=T)

Вот сейчас все работает, рисунки строятся, спасибо. Теперь осталось самое главное и непонятное - интерпретировать полученные картинки...

Цитата(passant @ 23.11.2017 - 23:43) *
больше ничего в голову и не приходит

А если добавить контрольных индивидов, чтобы их было не 1, а хотя бы 2? В принципе ведь контрольных никто никаким агентом не колет, так что можно сделать анализ фракций у любого. Это как-то может помочь? Типа статист. доказать, что различия по общему и фракционному составу до и после воздействия агентом имеются (или не имеются)? Или максимум моих данных - визуально на них посмотреть?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 27.11.2017 - 17:59
Сообщение #18





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(Света K @ 27.11.2017 - 14:51) *
А если добавить контрольных индивидов, чтобы их было не 1, а хотя бы 2?


"Это ж совсем другое дело"(с). А что, много у вас еще таких идей?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
comisora
сообщение 28.11.2017 - 20:27
Сообщение #19





Группа: Пользователи
Сообщений: 95
Регистрация: 27.12.2015
Пользователь №: 27815



2 p2004r, nokh
Спасибо за информацию.
Оставлю то, что нагуглил:
http://www.compositionaldata.com/material.php -можно скачать скрипты, слайды, другую информацию касательно составных данных.
Analyzing Compositional Data with R (Use R!) 2,013th Edition (K. Gerald van den Boogaart,‎ Raimon Tolosana-Delgado) - книжка афтаров представенноговыше пакета, доступна на Амазоне.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 29.11.2017 - 00:25
Сообщение #20





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Я тут подумал и решил усомниться в исходно композиционном характере данных. Очень часто люди загоняют в композиции полноценные (ну или почти полноценные данные), т.к. смешивают статистический анализ с удобством интерпретации. Интерпретировать иногда, действительно, удобнее в %, но если человек пару-тройку раз прошёл через ад всяких лог-преобразований Эйчисона со структурными нулями и с потолка взятыми значениями для неструктурных нулей, то остатвит всё это на тогда, когда без этого вообще никак не обойтись.
Например, аммоний, нитриты и нитраты в воде являются последовательными стадиями окисления азота органического происхождения. Они выражаются в мг/л, т.е. строго говоря это тоже композиция, но речь идёт о миллионных долях (ppm), когда композиция никак не влияет на связь между показателями. Если для интерпретации возникает желание оперировать %-ным соотношением азота в разных формах, то пересчёт на % даст полноценную композицию со всеми вытекающими проблемами. В то же время хлориды, сульфаты и гидрокарбонаты в воде представляют собой классическую композицию: они выражаются в % от общего состава и если чего-то станет меньше, то остального станет больше автоматически - здесь придётся повозиться. Кстати, если геологи почти сразу пришли к грамотному анализу таких данных, то гидрохимики уже 25 лет в пути, медики (в массе) - в начале пути (формула крови - композиция), а биологи (в массе) даже не слышали про такое. Оно и понятно, проблемы появляются только при многомерном анализе, а до него многие просто не дорастают.

>Света К
Если ваши фракции исходно выражаются, скажем, в миллимолях на литр, то нужно пересчитать % в эти исходные величины и забыть про % как страшный сон. Вне жёсткой композиции можно прекрасно проверить 1 наблюдение на многомерный выброс по расстоянию Махаланобиса (с расчётом р-значения), а для 2х наблюдений - провести дискриминантный анализ (т.к. это - "совсем другое дело":)). Но опять-таки, это - чисто технические вещи, ими научную методологию не заменить.

Сообщение отредактировал nokh - 29.11.2017 - 00:33
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Света K
сообщение 29.11.2017 - 01:09
Сообщение #21





Группа: Пользователи
Сообщений: 19
Регистрация: 15.12.2011
Пользователь №: 23369



Цитата(p2004r @ 23.11.2017 - 20:49) *
читаем данные и смотрим на большую часть дисперсии в них. Номера точки соответствуют нумерации в файле

Это я так понимаю второй рисунок? А на первом что за 3 разных столбца с дисперсией? Фракция А варьирует значительно сильнее чем В, а В сильнее чем С? Можете объяснить?

Цитата(p2004r)
Прочитайте что такое тернарный график https://en.wikipedia.org/wiki/Ternary_plot

Читаю данное пояснение и вижу, что это все-таки не то, даже совсем не то. Тут написано, что тернарные графики используются для показа состава смесей, состоящих из 3-х компонентов или показа условий когда три отдельные фазы существуют в равновесии. У меня ничего такого нет, да я и так знаю, что эти фракции у каждого индивида существуют в равновесии, у меня есть действующий агент, и надо бы статистически доказать повлиял/не повлиял ли он (и как именно) на общий/фракционный состав смеси. Т.е. есть ли какой-либо эффект он него? Да и не 3 компонента может быть, а до 10 (хотя какая разница), сейчас например я делаю опыт где определяю уже 5 фракций.

Цитата(passant)
Существуют десятки пакетов для R с реализацией различных алгоритмов кластерного анализа...Выбирайте любой.

Что-то не получается. Беру первый попавшийся пакет cluster с настройками по умолчанию - строит дендрограмму, но разделения на отдельные группы там нет. Есть в пакете еще куча всяких опций, но разобраться в них самостоятельно я не смогу.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 29.11.2017 - 12:25
Сообщение #22





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(Света K @ 29.11.2017 - 01:09) *
Это я так понимаю второй рисунок? А на первом что за 3 разных столбца с дисперсией? Фракция А варьирует значительно сильнее чем В, а В сильнее чем С? Можете объяснить?


Читаю данное пояснение и вижу, что это все-таки не то, даже совсем не то. Тут написано, что тернарные графики используются для показа состава смесей, состоящих из 3-х компонентов или показа условий когда три отдельные фазы существуют в равновесии. У меня ничего такого нет, да я и так знаю, что эти фракции у каждого индивида существуют в равновесии, у меня есть действующий агент, и надо бы статистически доказать повлиял/не повлиял ли он (и как именно) на общий/фракционный состав смеси. Т.е. есть ли какой-либо эффект он него? Да и не 3 компонента может быть, а до 10 (хотя какая разница), сейчас например я делаю опыт где определяю уже 5 фракций.


1) Прочитайте сначала https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%...%B5%D0%BD%D1%82 потом будет уместно задавать вопросы.


2) я поделил на количество, это видите? (хотя, какая разница)


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Света K
сообщение 1.12.2017 - 15:47
Сообщение #23





Группа: Пользователи
Сообщений: 19
Регистрация: 15.12.2011
Пользователь №: 23369



Ответить раньше не было возможности, - другие идеи, другой эксперимент, другие анализы...

Цитата(p2004r @ 29.11.2017 - 13:25) *
1) Прочитайте сначала ...

Спасибо, но пока не понятно. По вашей ссылке написано, что на рис.2 проведен тест на уменьшение размерности данных трех моих фракций (хотя какая разница сколько фракций), а красные линии - это линии вдоль которых дисперсия по каждой фракции максимальна. Т.е. Вы вроде бы свели всю матрицу моих данных по 3 фракциям подопытных к трем векторам и возможно варьирование фракции А - это линия V2, а фракции С - это V4. Если это так - то тут понятно. Ну а дальше что? Что обозначают оси, причем разные, с разными обозначениями, и с отрицательными значениями, куда направлены вектора, и, самое главное, как это описывать и подавать; что важно, что - нет. Мне кажется, что Вы просто "забываете", что я не знаю этого вопроса, поэтому нуждаюсь в конкретных ответах, а не в пересылках на другие ресурсы (хотя, наверняка полезных).

Цитата(p2004r)
я поделил на количество, это видите?

Нет, из такого объяснения не видно что на что Вы делили. Может Вы конечно объясняете не мне, а самому себе (хотя, возможно, какая вам разница), тогда, наверное, и видно. Но если вы все-таки хотите помочь разобраться именно мне, тогда что показывает и как интерпретировать каждый из 3-х столбцов с дисперсией на рис.1 - пока не видно.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему