Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Корреляция частот
Camel1000
сообщение 6.09.2013 - 14:51
Сообщение #1





Группа: Пользователи
Сообщений: 17
Регистрация: 3.02.2013
Пользователь №: 24599



Всем добрый день!
Что-то никак не могу сообразить, как лучше подойти к вроде простой задаче. Грубо говоря, есть некоторые сайты в геноме человека, характеризующиеся определенной частотой встречаемости. Скажем, сайт А встречается в 20% геномов, сайт Б - в 50%, сайт С - в 10% и так далее. Внутри каждого из сайтов (состоящего из последовательности нескольких нуклеотидов) могут происходить замены, причем для каждого сайта есть определенная вероятность, что в нем эти замены (любые, неважно какие) случатся - для сайта А вероятность Р1, для Б - Р2 и т.д.

Как можно оценить, есть ли корреляция между частотой встречаемости сайта в геноме и вероятностью замены в нем?

Заранее спасибо!

Сообщение отредактировал Camel1000 - 6.09.2013 - 14:52
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 13.09.2013 - 19:28
Сообщение #2





Группа: Пользователи
Сообщений: 1219
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Camel1000 @ 6.09.2013 - 17:51) *
Всем добрый день!
Что-то никак не могу сообразить, как лучше подойти к вроде простой задаче. Грубо говоря, есть некоторые сайты в геноме человека, характеризующиеся определенной частотой встречаемости. Скажем, сайт А встречается в 20% геномов, сайт Б - в 50%, сайт С - в 10% и так далее. Внутри каждого из сайтов (состоящего из последовательности нескольких нуклеотидов) могут происходить замены, причем для каждого сайта есть определенная вероятность, что в нем эти замены (любые, неважно какие) случатся - для сайта А вероятность Р1, для Б - Р2 и т.д.

Как можно оценить, есть ли корреляция между частотой встречаемости сайта в геноме и вероятностью замены в нем?

Заранее спасибо!

Для статистической оценки связи думаю лучше подойдёт корреляция Спирмена, как вам уже и посоветовали. Она лучше Пирсона в том плане, что (1) нелинейность (если она есть) не уйдёт в ошибку анализа, (2) проценты распределены ненормально, для Пирсона их нужно предварительно преобразовывать угловыми преобразованиями. А вот что коррелировать - ? Если длина сайтов разная, то и вероятность замены внутри сайта должна отличатся. Поэтому думаю, что лучше коррелировать: Х1 - частота сайта в геноме, Х2 - Вероятность Р замены в сайте делённая на количество нуклеотидов в сайте (т.е. вероятность замены на нуклеотид сайта).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему