Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Построение корреляционного графа и его анализ
nokh
сообщение 8.03.2012 - 16:34
Сообщение #1





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Пробую разобраться в элементах анализа социальных сетей (Social Network Analysis - SNA). Материал: в группах больных и здоровых измерена концентрация 30 биохимических показателей. Хочу сделать следующее:
1) На основании предварительно расчитанных ранговых корреляций построить для обеих групп корреляционные графы, в которых бы рёбра положительных и отрицательных корреляций изображались линиями разного типа, например: сплошной и пунктирной.
2) Используя в качестве порогового значения заданный мной показатель коэффициента корреляции (например +/- 0,3 или +/- 0,5) создать бинарную матрицу смежности. Т.е например, все корреляции менее 0,3 по абсолютной величине станут 0, а |0,3| и более - |1|.
3) Покрутить полученное решение разными алгоритмами и выбрать наиболее наглядное решение. Линии тоже - сплошные и пунктирные.
4) Желательно встроенными в пакет средствами определить кластеры показателей в полученном решении.
5) Сравнить 2 сети и построить некий обобщённый граф, в котором бы различия между ними были хорошо видны.

Много чего скачал и урывками просмотрел хелпы (Pajek, yEd Graph Editor, KrackPlot, Cytoscape, Meerkat, ORA и ещё несколько, включая 2 пакета для R). Основная проблема: разные пакеты не хотят работать с корреляциями или с отрицательными корреляциями. Если работают, то нет возможности автоматически генерировать из них матрицы смежности с разными пороговыми значениями r. Сложилось впечатление, что эволюция пакетов идёт исключительно в сторону возможностей обработки всё больших массивов данных и преимущественно из интернета, а у меня микросеть и несколько другая задача.
Хотелось бы сделать работу в таком ключе: http://www.barabasilab.com/pubs/CCNR-ALB_P...NetMedicine.pdf

Кто работал с сетевым анализом? Подскажите, пожалуйста, какой пакет подойдёт для моих целей? Может посоветуете разные программы для отдельных этапов? Не понятно пока как сравнить сети и визуализировать различия.

PS Всех женщин-участников и читателей форума - с Праздником! Успехов в научных и житейских делах!

Сообщение отредактировал nokh - 8.03.2012 - 17:02
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
100$
сообщение 19.01.2017 - 17:48
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Вынужден сдуть пыль с этой темы.

Nokh, у меня возникла необходимость "сделать красиво" хорошему человеку: в исследовании 100 объектов, каждый объект охарактеризован вектором из 196 координат.

У меня в связи с этим вопрос: корреляционный граф над матрицей размерности 196х196 вряд ли будет информативным, поэтому как происходит "прунинг" ("прореживание") такого графа: выбором порога отсечения? Скажем, все, что по абсолютной величине >=,8 видно, а остальное - нет?

Есть какой-то "самый-самый" пакет с этой точки зрения?

И еще: приходилось ли вам иметь дело с "температурной картой" корреляционной матрицы? Знаю точно, что эта возможность реализована в R, но я в нем ни в зуб ногой.

Как всегда заранее благодарен за любую наводку, подсказку и обмен впечатлениями.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 20.01.2017 - 22:01
Сообщение #3





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(100$ @ 19.01.2017 - 19:48) *
Вынужден сдуть пыль с этой темы.
Nokh, у меня возникла необходимость "сделать красиво" хорошему человеку: в исследовании 100 объектов, каждый объект охарактеризован вектором из 196 координат.
У меня в связи с этим вопрос: корреляционный граф над матрицей размерности 196х196 вряд ли будет информативным, поэтому как происходит "прунинг" ("прореживание") такого графа: выбором порога отсечения? Скажем, все, что по абсолютной величине >=,8 видно, а остальное - нет?
Есть какой-то "самый-самый" пакет с этой точки зрения?
И еще: приходилось ли вам иметь дело с "температурной картой" корреляционной матрицы? Знаю точно, что эта возможность реализована в R, но я в нем ни в зуб ногой.
Как всегда заранее благодарен за любую наводку, подсказку и обмен впечатлениями.

К сожалению, сетевой анализ - один из тех редких случаев, когда я потратил кучу времени впустую. Сейчас уже мало что помню, даже термины из своих постов выше забыл smile.gif Но у меня в компе остались установочные файлы десятка пакетов, а значит я их опробовал и либо не разобрался, либо результат не устроил. Короче, с сетями - завал.

С другой стороны, помочь "хорошему человеку" можно. Ведь не обязательно строить корреляционный граф. Как раз с точки зрения интерпретации связей лучше многомерные проекционные техники типа главных компонент и факторного анализа. Тот подход, который я описал в сообщении #5 - готовая рабочая технология. За прошедшие 5 лет она не претерпела принципиальных изменений, всё что я освоил ещё: 1) проводить анализ на ограниченном числе показателей, но отслеживать в полученном многомерном пространстве и другие интересующие - скажем, индикаторные; 2) сравнивать матрицы факторных нагрузок прокрустовым методом с получением р не только для всей матрицы целиком, но и для строк, столбцов и для каждой отдельной ячейки матрицы (макрос для SPSS Кирилла Орлова http://spsstools.net/ru/KO-spssmacros ) Технология работает, всё всегда хорошо интерпретируется, все довольны. Показателей, конечно, многовато; я бы с хорошим человеком-специалистом в предметной области выбрал из 196 меньший, но более осмысленный набор.

По "температурным" графикам кроме R - вероятно мало что есть. Я когда-то баловался такой штукой: http://www.cs.umd.edu/hcil/hce/ Проект мёртвый, но поскольку делался на академические деньги - доступен бесплатно. Кстати, two-way кластерный анализ здесь тоже очень неплох в качестве эксплораторного метода. Но, насколько помню, в HCE мер расстояния катастрофически мало.

Если не "моя" технология, то найдите картинку в сети, типа чего хотите получить. Можно попробовать и в R это сделать - мне тоже полезно будет освоить + в этом семестре время пока б/м есть.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 21.01.2017 - 12:50
Сообщение #4





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(nokh @ 20.01.2017 - 22:01) *
Ведь не обязательно строить корреляционный граф. Как раз с точки зрения интерпретации связей лучше многомерные проекционные техники типа главных компонент и факторного анализа. Тот подход, который я описал в сообщении #5 - готовая рабочая технология. За прошедшие 5 лет она не претерпела принципиальных изменений, всё что я освоил ещё: 1) проводить анализ на ограниченном числе показателей, но отслеживать в полученном многомерном пространстве и другие интересующие - скажем, индикаторные; 2) сравнивать матрицы факторных нагрузок прокрустовым методом с получением р не только для всей матрицы целиком, но и для строк, столбцов и для каждой отдельной ячейки матрицы (макрос для SPSS Кирилла Орлова http://spsstools.net/ru/KO-spssmacros ) Технология работает, всё всегда хорошо интерпретируется, все довольны. Показателей, конечно, многовато; я бы с хорошим человеком-специалистом в предметной области выбрал из 196 меньший, но более осмысленный набор.

По "температурным" графикам кроме R - вероятно мало что есть. Я когда-то баловался такой штукой: http://www.cs.umd.edu/hcil/hce/ Проект мёртвый, но поскольку делался на академические деньги - доступен бесплатно. Кстати, two-way кластерный анализ здесь тоже очень неплох в качестве эксплораторного метода. Но, насколько помню, в HCE мер расстояния катастрофически мало.

Если не "моя" технология, то найдите картинку в сети, типа чего хотите получить. Можно попробовать и в R это сделать - мне тоже полезно будет освоить + в этом семестре время пока б/м есть.


Nokh, спасибо,
у меня на периферии сознания факторный анализ маячит постоянно, но уж больно у меня нетривиальная задача: этот вектор о 196 координатах - адская смесь дихотомических, порядковых и количественных показателей. Думал состряпать матрицу коэффициентов Гауэра (корреляции разнотипных признаков), а над ней повесить упомянутый граф - больно уж заказчик впечатлился, увидев его в одной опубликованной статье. Вот тут и возникает вопрос: в том же R, например, над готовой матрицей можно построить граф, или нужны "сырые" данные.

Буквально вчера убедился, что температурная карта матрицы корреляций уже реализована в Statistica, начиная с 13 версии. Однако, похоже, это возможно только при формировании корр. матрицы из "сырых" данных и раскрасить таким образом готовую матрицу не получится. Чует мое сердце, что придется писать макрос к Экселю...

Сообщение отредактировал 100$ - 21.01.2017 - 12:51
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- nokh   Построение корреляционного графа и его анализ   8.03.2012 - 16:34
- - p2004r   Все манипуляции с графами может делать igraph в R....   8.03.2012 - 20:57
|- - nokh   Цитата(p2004r @ 8.03.2012 - 22:57) Ч...   11.03.2012 - 08:51
- - DoctorStat   Цитата(nokh @ 8.03.2012 - 17:34) Хот...   8.03.2012 - 21:59
|- - p2004r   Цитата(DoctorStat @ 8.03.2012 - 21:5...   8.03.2012 - 23:03
- - arbaiten   вот отличная статья на тему SNA http://webscience....   2.04.2013 - 19:06
|- - nokh   Цитата(arbaiten @ 2.04.2013 - 22:06)...   5.05.2013 - 19:28
|- - p2004r   Цитата(nokh @ 5.05.2013 - 19:28) не ...   6.05.2013 - 21:30
- - 100$   Вынужден сдуть пыль с этой темы. Nokh, у меня воз...   19.01.2017 - 17:48
|- - nokh   Цитата(100$ @ 19.01.2017 - 19:4...   20.01.2017 - 22:01
|- - 100$   Цитата(nokh @ 20.01.2017 - 22:01) Ве...   21.01.2017 - 12:50
|- - passant   Цитата(100$ @ 21.01.2017 - 11:5...   21.01.2017 - 13:55
|- - nokh   Цитата(100$ @ 21.01.2017 - 14:5...   23.01.2017 - 09:11
|- - p2004r   Цитата(nokh @ 23.01.2017 - 09:11) ре...   23.01.2017 - 11:18
|- - 100$   Цитата(nokh @ 23.01.2017 - 09:11) Га...   23.01.2017 - 11:28
|- - 100$   Цитата(nokh @ 23.01.2017 - 09:11) Га...   26.01.2017 - 18:32
|- - passant   Цитата(100$ @ 26.01.2017 - 17:3...   27.01.2017 - 18:40
|- - 100$   Цитата(passant @ 27.01.2017 - 18:40)...   27.01.2017 - 20:35
- - 100$   Джентльмены, спасибо. Ажно глаза разбегаются.   21.01.2017 - 15:18


Добавить ответ в эту темуОткрыть тему