Корреляция частот |
Здравствуйте, гость ( Вход | Регистрация )
Корреляция частот |
6.09.2013 - 14:51
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 17 Регистрация: 3.02.2013 Пользователь №: 24599 |
Всем добрый день!
Что-то никак не могу сообразить, как лучше подойти к вроде простой задаче. Грубо говоря, есть некоторые сайты в геноме человека, характеризующиеся определенной частотой встречаемости. Скажем, сайт А встречается в 20% геномов, сайт Б - в 50%, сайт С - в 10% и так далее. Внутри каждого из сайтов (состоящего из последовательности нескольких нуклеотидов) могут происходить замены, причем для каждого сайта есть определенная вероятность, что в нем эти замены (любые, неважно какие) случатся - для сайта А вероятность Р1, для Б - Р2 и т.д. Как можно оценить, есть ли корреляция между частотой встречаемости сайта в геноме и вероятностью замены в нем? Заранее спасибо! Сообщение отредактировал Camel1000 - 6.09.2013 - 14:52 |
|
6.09.2013 - 16:07
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
Да, можно оба показателя перевести в числовой формат и найти коэффициент корреляции Спирмена или Пирсона/ если типов сайтов достаточно много. Не очень хорошо понимаю , а зачем это нужно делать? Вопрос: а как нашли частоты и вероятности? Если экспериментальным путем , то лучше взять первоначальные данные и представить их в виде таблицы сопряженности тип сайта произошло изменение или нет и проверить сопряженность признаков по критерию хи-квадрат или Фишера. При этом выводы, полагаю, будут гораздо содержательнее , нежели вы хотите. Я не очень хорошо понимаю суть и тонкости вашего исследования , но такое впечатление , что ваши методы анализа слишком грубы для такой задачи. Есть специальные методы корреляции , на форуме есть специалист. |
|
6.09.2013 - 16:22
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 17 Регистрация: 3.02.2013 Пользователь №: 24599 |
Я, наверное, плохо объяснил. Про таблицы сопряженности и Фишера понятно, это уже делали, и там есть закономерность. Теперь хочется установить вид этой закономерности, то есть по какому типу (прямо пропорционально, обратно пропорционально) как связано изменение частоты встречаемости сайтов и частота мутаций (изменений) в сайтах. То есть, грубо говоря, если сайты встречаются реже в геноме, то есть ли положительная корреляция между этим и повышеннием частоты мутаций в самих сайтах?
Сообщение отредактировал Camel1000 - 6.09.2013 - 16:23 |
|
6.09.2013 - 16:36
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 219 Регистрация: 4.06.2013 Из: Тверь Пользователь №: 24927 |
В SPSS при генерации таблиц сопряженности выводятся и кластеризованные столбиковые диаграммы, которые позволяют установить вид зависимости.
Также в меню Ячейки следует установить флажки Сравнить пропорции столбцов. Вычислить ожидаемые частоты. Возможно, вам могут потребоваться и специальные случаи анализа последовательности на случайность./Критерий серий Сообщение отредактировал anserovtv - 6.09.2013 - 20:56 |
|
13.09.2013 - 19:28
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Всем добрый день! Что-то никак не могу сообразить, как лучше подойти к вроде простой задаче. Грубо говоря, есть некоторые сайты в геноме человека, характеризующиеся определенной частотой встречаемости. Скажем, сайт А встречается в 20% геномов, сайт Б - в 50%, сайт С - в 10% и так далее. Внутри каждого из сайтов (состоящего из последовательности нескольких нуклеотидов) могут происходить замены, причем для каждого сайта есть определенная вероятность, что в нем эти замены (любые, неважно какие) случатся - для сайта А вероятность Р1, для Б - Р2 и т.д. Как можно оценить, есть ли корреляция между частотой встречаемости сайта в геноме и вероятностью замены в нем? Заранее спасибо! Для статистической оценки связи думаю лучше подойдёт корреляция Спирмена, как вам уже и посоветовали. Она лучше Пирсона в том плане, что (1) нелинейность (если она есть) не уйдёт в ошибку анализа, (2) проценты распределены ненормально, для Пирсона их нужно предварительно преобразовывать угловыми преобразованиями. А вот что коррелировать - ? Если длина сайтов разная, то и вероятность замены внутри сайта должна отличатся. Поэтому думаю, что лучше коррелировать: Х1 - частота сайта в геноме, Х2 - Вероятность Р замены в сайте делённая на количество нуклеотидов в сайте (т.е. вероятность замены на нуклеотид сайта). |
|