Здравствуйте, гость ( Вход | Регистрация )
8.03.2012 - 16:34
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Пробую разобраться в элементах анализа социальных сетей (Social Network Analysis - SNA). Материал: в группах больных и здоровых измерена концентрация 30 биохимических показателей. Хочу сделать следующее:
1) На основании предварительно расчитанных ранговых корреляций построить для обеих групп корреляционные графы, в которых бы рёбра положительных и отрицательных корреляций изображались линиями разного типа, например: сплошной и пунктирной. 2) Используя в качестве порогового значения заданный мной показатель коэффициента корреляции (например +/- 0,3 или +/- 0,5) создать бинарную матрицу смежности. Т.е например, все корреляции менее 0,3 по абсолютной величине станут 0, а |0,3| и более - |1|. 3) Покрутить полученное решение разными алгоритмами и выбрать наиболее наглядное решение. Линии тоже - сплошные и пунктирные. 4) Желательно встроенными в пакет средствами определить кластеры показателей в полученном решении. 5) Сравнить 2 сети и построить некий обобщённый граф, в котором бы различия между ними были хорошо видны. Много чего скачал и урывками просмотрел хелпы (Pajek, yEd Graph Editor, KrackPlot, Cytoscape, Meerkat, ORA и ещё несколько, включая 2 пакета для R). Основная проблема: разные пакеты не хотят работать с корреляциями или с отрицательными корреляциями. Если работают, то нет возможности автоматически генерировать из них матрицы смежности с разными пороговыми значениями r. Сложилось впечатление, что эволюция пакетов идёт исключительно в сторону возможностей обработки всё больших массивов данных и преимущественно из интернета, а у меня микросеть и несколько другая задача. Хотелось бы сделать работу в таком ключе: http://www.barabasilab.com/pubs/CCNR-ALB_P...NetMedicine.pdf Кто работал с сетевым анализом? Подскажите, пожалуйста, какой пакет подойдёт для моих целей? Может посоветуете разные программы для отдельных этапов? Не понятно пока как сравнить сети и визуализировать различия. PS Всех женщин-участников и читателей форума - с Праздником! Успехов в научных и житейских делах! Сообщение отредактировал nokh - 8.03.2012 - 17:02 |
|
|
![]() |
![]() |
![]() |
19.01.2017 - 17:48
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Вынужден сдуть пыль с этой темы.
Nokh, у меня возникла необходимость "сделать красиво" хорошему человеку: в исследовании 100 объектов, каждый объект охарактеризован вектором из 196 координат. У меня в связи с этим вопрос: корреляционный граф над матрицей размерности 196х196 вряд ли будет информативным, поэтому как происходит "прунинг" ("прореживание") такого графа: выбором порога отсечения? Скажем, все, что по абсолютной величине >=,8 видно, а остальное - нет? Есть какой-то "самый-самый" пакет с этой точки зрения? И еще: приходилось ли вам иметь дело с "температурной картой" корреляционной матрицы? Знаю точно, что эта возможность реализована в R, но я в нем ни в зуб ногой. Как всегда заранее благодарен за любую наводку, подсказку и обмен впечатлениями. |
|
|
![]() |
![]() |
20.01.2017 - 22:01
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Вынужден сдуть пыль с этой темы. Nokh, у меня возникла необходимость "сделать красиво" хорошему человеку: в исследовании 100 объектов, каждый объект охарактеризован вектором из 196 координат. У меня в связи с этим вопрос: корреляционный граф над матрицей размерности 196х196 вряд ли будет информативным, поэтому как происходит "прунинг" ("прореживание") такого графа: выбором порога отсечения? Скажем, все, что по абсолютной величине >=,8 видно, а остальное - нет? Есть какой-то "самый-самый" пакет с этой точки зрения? И еще: приходилось ли вам иметь дело с "температурной картой" корреляционной матрицы? Знаю точно, что эта возможность реализована в R, но я в нем ни в зуб ногой. Как всегда заранее благодарен за любую наводку, подсказку и обмен впечатлениями. К сожалению, сетевой анализ - один из тех редких случаев, когда я потратил кучу времени впустую. Сейчас уже мало что помню, даже термины из своих постов выше забыл С другой стороны, помочь "хорошему человеку" можно. Ведь не обязательно строить корреляционный граф. Как раз с точки зрения интерпретации связей лучше многомерные проекционные техники типа главных компонент и факторного анализа. Тот подход, который я описал в сообщении #5 - готовая рабочая технология. За прошедшие 5 лет она не претерпела принципиальных изменений, всё что я освоил ещё: 1) проводить анализ на ограниченном числе показателей, но отслеживать в полученном многомерном пространстве и другие интересующие - скажем, индикаторные; 2) сравнивать матрицы факторных нагрузок прокрустовым методом с получением р не только для всей матрицы целиком, но и для строк, столбцов и для каждой отдельной ячейки матрицы (макрос для SPSS Кирилла Орлова http://spsstools.net/ru/KO-spssmacros ) Технология работает, всё всегда хорошо интерпретируется, все довольны. Показателей, конечно, многовато; я бы с хорошим человеком-специалистом в предметной области выбрал из 196 меньший, но более осмысленный набор. По "температурным" графикам кроме R - вероятно мало что есть. Я когда-то баловался такой штукой: http://www.cs.umd.edu/hcil/hce/ Проект мёртвый, но поскольку делался на академические деньги - доступен бесплатно. Кстати, two-way кластерный анализ здесь тоже очень неплох в качестве эксплораторного метода. Но, насколько помню, в HCE мер расстояния катастрофически мало. Если не "моя" технология, то найдите картинку в сети, типа чего хотите получить. Можно попробовать и в R это сделать - мне тоже полезно будет освоить + в этом семестре время пока б/м есть. |
|
|
![]() |
![]() |
21.01.2017 - 12:50
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Ведь не обязательно строить корреляционный граф. Как раз с точки зрения интерпретации связей лучше многомерные проекционные техники типа главных компонент и факторного анализа. Тот подход, который я описал в сообщении #5 - готовая рабочая технология. За прошедшие 5 лет она не претерпела принципиальных изменений, всё что я освоил ещё: 1) проводить анализ на ограниченном числе показателей, но отслеживать в полученном многомерном пространстве и другие интересующие - скажем, индикаторные; 2) сравнивать матрицы факторных нагрузок прокрустовым методом с получением р не только для всей матрицы целиком, но и для строк, столбцов и для каждой отдельной ячейки матрицы (макрос для SPSS Кирилла Орлова http://spsstools.net/ru/KO-spssmacros ) Технология работает, всё всегда хорошо интерпретируется, все довольны. Показателей, конечно, многовато; я бы с хорошим человеком-специалистом в предметной области выбрал из 196 меньший, но более осмысленный набор. По "температурным" графикам кроме R - вероятно мало что есть. Я когда-то баловался такой штукой: http://www.cs.umd.edu/hcil/hce/ Проект мёртвый, но поскольку делался на академические деньги - доступен бесплатно. Кстати, two-way кластерный анализ здесь тоже очень неплох в качестве эксплораторного метода. Но, насколько помню, в HCE мер расстояния катастрофически мало. Если не "моя" технология, то найдите картинку в сети, типа чего хотите получить. Можно попробовать и в R это сделать - мне тоже полезно будет освоить + в этом семестре время пока б/м есть. Nokh, спасибо, у меня на периферии сознания факторный анализ маячит постоянно, но уж больно у меня нетривиальная задача: этот вектор о 196 координатах - адская смесь дихотомических, порядковых и количественных показателей. Думал состряпать матрицу коэффициентов Гауэра (корреляции разнотипных признаков), а над ней повесить упомянутый граф - больно уж заказчик впечатлился, увидев его в одной опубликованной статье. Вот тут и возникает вопрос: в том же R, например, над готовой матрицей можно построить граф, или нужны "сырые" данные. Буквально вчера убедился, что температурная карта матрицы корреляций уже реализована в Statistica, начиная с 13 версии. Однако, похоже, это возможно только при формировании корр. матрицы из "сырых" данных и раскрасить таким образом готовую матрицу не получится. Чует мое сердце, что придется писать макрос к Экселю... Сообщение отредактировал 100$ - 21.01.2017 - 12:51 |
|
|
![]() |
![]() |
nokh Построение корреляционного графа и его анализ 8.03.2012 - 16:34
p2004r Все манипуляции с графами может делать igraph в R.... 8.03.2012 - 20:57
nokh Цитата(p2004r @ 8.03.2012 - 22:57) Ч... 11.03.2012 - 08:51
DoctorStat Цитата(nokh @ 8.03.2012 - 17:34) Хот... 8.03.2012 - 21:59
p2004r Цитата(DoctorStat @ 8.03.2012 - 21:5... 8.03.2012 - 23:03
arbaiten вот отличная статья на тему SNA http://webscience.... 2.04.2013 - 19:06
nokh Цитата(arbaiten @ 2.04.2013 - 22:06)... 5.05.2013 - 19:28
p2004r Цитата(nokh @ 5.05.2013 - 19:28) не ... 6.05.2013 - 21:30
passant Цитата(100$ @ 21.01.2017 - 11:5... 21.01.2017 - 13:55
nokh Цитата(100$ @ 21.01.2017 - 14:5... 23.01.2017 - 09:11
p2004r Цитата(nokh @ 23.01.2017 - 09:11) ре... 23.01.2017 - 11:18
100$ Цитата(nokh @ 23.01.2017 - 09:11) Га... 23.01.2017 - 11:28
100$ Цитата(nokh @ 23.01.2017 - 09:11) Га... 26.01.2017 - 18:32
passant Цитата(100$ @ 26.01.2017 - 17:3... 27.01.2017 - 18:40
100$ Цитата(passant @ 27.01.2017 - 18:40)... 27.01.2017 - 20:35
100$ Джентльмены, спасибо. Ажно глаза разбегаются. 21.01.2017 - 15:18![]() ![]() |