Процентное содержание фракций - Форум врачей-аспирантов

Процентное содержание фракций, правильно обработать данные

Опции

nokh

27.11.2017 - 06:51

Сообщение #16

Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704

Цитата(p2004r @ 24.11.2017 - 03:35)

PCA прекрасно расправляет "смеси" в тернарные трафики, отжимая лишнюю размерность. Здесь просто крайне мал размах варьирования состава, вот и не видно результирующего "треугольника(пирамиды)".

Прикольно! У меня никогда не было столько данных, чтобы увидеть треугольник, а с симуляциями не играл.

Цитата(comisora @ 26.11.2017 - 00:48)

... Можете показать пример, как "сравнить/обработать" p1 и p2 и заполучить "заветное p<0.05"?

Сравнить два набора PC можно прокрустовым анализом с расчётом р рандомизационным критерием.
library(vegan)
protest(p1, p2, scores = "sites", permutations = how(nperm = 999))
#можно посмотреть статистику и разности матриц после прокрустова преобразования для определения наиболее сильных невязок:
difpc12<-procrustes(p1,p2)
summary(difpc12)
plot(difpc12)
plot(difpc12, kind=2)

Сообщение отредактировал nokh - 27.11.2017 - 07:13

Эскизы прикрепленных изображений

Ответить с цитированием данного сообщения

Света K Просмотр профиля	27.11.2017 - 14:51 Сообщение #17
Группа: Пользователи Сообщений: 19 Регистрация: 15.12.2011 Пользователь №: 23369	Цитата(p2004r @ 24.11.2017 - 22:55) пропущена строчка сохранения результатов PCA df.lipid.pca <- prcomp(df.lipid[,2:4]/df.lipid[,1], center=T, scale.=T) Вот сейчас все работает, рисунки строятся, спасибо. Теперь осталось самое главное и непонятное - интерпретировать полученные картинки... Цитата(passant @ 23.11.2017 - 23:43) больше ничего в голову и не приходит А если добавить контрольных индивидов, чтобы их было не 1, а хотя бы 2? В принципе ведь контрольных никто никаким агентом не колет, так что можно сделать анализ фракций у любого. Это как-то может помочь? Типа статист. доказать, что различия по общему и фракционному составу до и после воздействия агентом имеются (или не имеются)? Или максимум моих данных - визуально на них посмотреть?

100$ Просмотр профиля	27.11.2017 - 17:59 Сообщение #18
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694	Цитата(Света K @ 27.11.2017 - 14:51) А если добавить контрольных индивидов, чтобы их было не 1, а хотя бы 2? "Это ж совсем другое дело"(с). А что, много у вас еще таких идей?

comisora Просмотр профиля	28.11.2017 - 20:27 Сообщение #19
Группа: Пользователи Сообщений: 95 Регистрация: 27.12.2015 Пользователь №: 27815	2 p2004r, nokh Спасибо за информацию. Оставлю то, что нагуглил: http://www.compositionaldata.com/material.php -можно скачать скрипты, слайды, другую информацию касательно составных данных. Analyzing Compositional Data with R (Use R!) 2,013th Edition (K. Gerald van den Boogaart,‎ Raimon Tolosana-Delgado) - книжка афтаров представенноговыше пакета, доступна на Амазоне.

nokh Просмотр профиля	29.11.2017 - 00:25 Сообщение #20
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Я тут подумал и решил усомниться в исходно композиционном характере данных. Очень часто люди загоняют в композиции полноценные (ну или почти полноценные данные), т.к. смешивают статистический анализ с удобством интерпретации. Интерпретировать иногда, действительно, удобнее в %, но если человек пару-тройку раз прошёл через ад всяких лог-преобразований Эйчисона со структурными нулями и с потолка взятыми значениями для неструктурных нулей, то остатвит всё это на тогда, когда без этого вообще никак не обойтись. Например, аммоний, нитриты и нитраты в воде являются последовательными стадиями окисления азота органического происхождения. Они выражаются в мг/л, т.е. строго говоря это тоже композиция, но речь идёт о миллионных долях (ppm), когда композиция никак не влияет на связь между показателями. Если для интерпретации возникает желание оперировать %-ным соотношением азота в разных формах, то пересчёт на % даст полноценную композицию со всеми вытекающими проблемами. В то же время хлориды, сульфаты и гидрокарбонаты в воде представляют собой классическую композицию: они выражаются в % от общего состава и если чего-то станет меньше, то остального станет больше автоматически - здесь придётся повозиться. Кстати, если геологи почти сразу пришли к грамотному анализу таких данных, то гидрохимики уже 25 лет в пути, медики (в массе) - в начале пути (формула крови - композиция), а биологи (в массе) даже не слышали про такое. Оно и понятно, проблемы появляются только при многомерном анализе, а до него многие просто не дорастают. >Света К Если ваши фракции исходно выражаются, скажем, в миллимолях на литр, то нужно пересчитать % в эти исходные величины и забыть про % как страшный сон. Вне жёсткой композиции можно прекрасно проверить 1 наблюдение на многомерный выброс по расстоянию Махаланобиса (с расчётом р-значения), а для 2х наблюдений - провести дискриминантный анализ (т.к. это - "совсем другое дело":)). Но опять-таки, это - чисто технические вещи, ими научную методологию не заменить. Сообщение отредактировал nokh - 29.11.2017 - 00:33

Света K Просмотр профиля	29.11.2017 - 01:09 Сообщение #21
Группа: Пользователи Сообщений: 19 Регистрация: 15.12.2011 Пользователь №: 23369	Цитата(p2004r @ 23.11.2017 - 20:49) читаем данные и смотрим на большую часть дисперсии в них. Номера точки соответствуют нумерации в файле Это я так понимаю второй рисунок? А на первом что за 3 разных столбца с дисперсией? Фракция А варьирует значительно сильнее чем В, а В сильнее чем С? Можете объяснить? Цитата(p2004r) Прочитайте что такое тернарный график https://en.wikipedia.org/wiki/Ternary_plot Читаю данное пояснение и вижу, что это все-таки не то, даже совсем не то. Тут написано, что тернарные графики используются для показа состава смесей, состоящих из 3-х компонентов или показа условий когда три отдельные фазы существуют в равновесии. У меня ничего такого нет, да я и так знаю, что эти фракции у каждого индивида существуют в равновесии, у меня есть действующий агент, и надо бы статистически доказать повлиял/не повлиял ли он (и как именно) на общий/фракционный состав смеси. Т.е. есть ли какой-либо эффект он него? Да и не 3 компонента может быть, а до 10 (хотя какая разница), сейчас например я делаю опыт где определяю уже 5 фракций. Цитата(passant) Существуют десятки пакетов для R с реализацией различных алгоритмов кластерного анализа...Выбирайте любой. Что-то не получается. Беру первый попавшийся пакет cluster с настройками по умолчанию - строит дендрограмму, но разделения на отдельные группы там нет. Есть в пакете еще куча всяких опций, но разобраться в них самостоятельно я не смогу.

p2004r Просмотр профиля	29.11.2017 - 12:25 Сообщение #22
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699	Цитата(Света K @ 29.11.2017 - 01:09) Это я так понимаю второй рисунок? А на первом что за 3 разных столбца с дисперсией? Фракция А варьирует значительно сильнее чем В, а В сильнее чем С? Можете объяснить? Читаю данное пояснение и вижу, что это все-таки не то, даже совсем не то. Тут написано, что тернарные графики используются для показа состава смесей, состоящих из 3-х компонентов или показа условий когда три отдельные фазы существуют в равновесии. У меня ничего такого нет, да я и так знаю, что эти фракции у каждого индивида существуют в равновесии, у меня есть действующий агент, и надо бы статистически доказать повлиял/не повлиял ли он (и как именно) на общий/фракционный состав смеси. Т.е. есть ли какой-либо эффект он него? Да и не 3 компонента может быть, а до 10 (хотя какая разница), сейчас например я делаю опыт где определяю уже 5 фракций. 1) Прочитайте сначала https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%...%B5%D0%BD%D1%82 потом будет уместно задавать вопросы. 2) я поделил на количество, это видите? (хотя, какая разница) http://r-statistics.livejournal.com/

Света K Просмотр профиля	1.12.2017 - 15:47 Сообщение #23
Группа: Пользователи Сообщений: 19 Регистрация: 15.12.2011 Пользователь №: 23369	Ответить раньше не было возможности, - другие идеи, другой эксперимент, другие анализы... Цитата(p2004r @ 29.11.2017 - 13:25) 1) Прочитайте сначала ... Спасибо, но пока не понятно. По вашей ссылке написано, что на рис.2 проведен тест на уменьшение размерности данных трех моих фракций (хотя какая разница сколько фракций), а красные линии - это линии вдоль которых дисперсия по каждой фракции максимальна. Т.е. Вы вроде бы свели всю матрицу моих данных по 3 фракциям подопытных к трем векторам и возможно варьирование фракции А - это линия V2, а фракции С - это V4. Если это так - то тут понятно. Ну а дальше что? Что обозначают оси, причем разные, с разными обозначениями, и с отрицательными значениями, куда направлены вектора, и, самое главное, как это описывать и подавать; что важно, что - нет. Мне кажется, что Вы просто "забываете", что я не знаю этого вопроса, поэтому нуждаюсь в конкретных ответах, а не в пересылках на другие ресурсы (хотя, наверняка полезных). Цитата(p2004r) я поделил на количество, это видите? Нет, из такого объяснения не видно что на что Вы делили. Может Вы конечно объясняете не мне, а самому себе (хотя, возможно, какая вам разница), тогда, наверное, и видно. Но если вы все-таки хотите помочь разобраться именно мне, тогда что показывает и как интерпретировать каждый из 3-х столбцов с дисперсией на рис.1 - пока не видно.

« Предыдущая тема · Медицинская статистика · Следующая тема »