Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Корреляция частот
Camel1000
сообщение 6.09.2013 - 14:51
Сообщение #1





Группа: Пользователи
Сообщений: 17
Регистрация: 3.02.2013
Пользователь №: 24599



Всем добрый день!
Что-то никак не могу сообразить, как лучше подойти к вроде простой задаче. Грубо говоря, есть некоторые сайты в геноме человека, характеризующиеся определенной частотой встречаемости. Скажем, сайт А встречается в 20% геномов, сайт Б - в 50%, сайт С - в 10% и так далее. Внутри каждого из сайтов (состоящего из последовательности нескольких нуклеотидов) могут происходить замены, причем для каждого сайта есть определенная вероятность, что в нем эти замены (любые, неважно какие) случатся - для сайта А вероятность Р1, для Б - Р2 и т.д.

Как можно оценить, есть ли корреляция между частотой встречаемости сайта в геноме и вероятностью замены в нем?

Заранее спасибо!

Сообщение отредактировал Camel1000 - 6.09.2013 - 14:52
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 6.09.2013 - 16:07
Сообщение #2





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927




Да, можно оба показателя перевести в числовой формат и найти коэффициент корреляции Спирмена или Пирсона/ если типов сайтов достаточно много.
Не очень хорошо понимаю , а зачем это нужно делать?
Вопрос: а как нашли частоты и вероятности?
Если экспериментальным путем , то лучше взять первоначальные данные и представить их в виде таблицы сопряженности тип сайта произошло изменение или нет и
проверить сопряженность признаков по критерию хи-квадрат или Фишера. При этом выводы, полагаю, будут гораздо содержательнее , нежели вы хотите.
Я не очень хорошо понимаю суть и тонкости вашего исследования , но такое впечатление , что ваши методы анализа слишком грубы для такой задачи.
Есть специальные методы корреляции , на форуме есть специалист.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Camel1000
сообщение 6.09.2013 - 16:22
Сообщение #3





Группа: Пользователи
Сообщений: 17
Регистрация: 3.02.2013
Пользователь №: 24599



Я, наверное, плохо объяснил. Про таблицы сопряженности и Фишера понятно, это уже делали, и там есть закономерность. Теперь хочется установить вид этой закономерности, то есть по какому типу (прямо пропорционально, обратно пропорционально) как связано изменение частоты встречаемости сайтов и частота мутаций (изменений) в сайтах. То есть, грубо говоря, если сайты встречаются реже в геноме, то есть ли положительная корреляция между этим и повышеннием частоты мутаций в самих сайтах?

Сообщение отредактировал Camel1000 - 6.09.2013 - 16:23
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 6.09.2013 - 16:36
Сообщение #4





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



В SPSS при генерации таблиц сопряженности выводятся и кластеризованные столбиковые диаграммы, которые позволяют установить вид зависимости.
Также в меню Ячейки следует установить флажки
Сравнить пропорции столбцов.
Вычислить ожидаемые частоты.

Возможно, вам могут потребоваться и специальные случаи анализа последовательности на случайность./Критерий серий

Сообщение отредактировал anserovtv - 6.09.2013 - 20:56
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 13.09.2013 - 19:28
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Camel1000 @ 6.09.2013 - 17:51) *
Всем добрый день!
Что-то никак не могу сообразить, как лучше подойти к вроде простой задаче. Грубо говоря, есть некоторые сайты в геноме человека, характеризующиеся определенной частотой встречаемости. Скажем, сайт А встречается в 20% геномов, сайт Б - в 50%, сайт С - в 10% и так далее. Внутри каждого из сайтов (состоящего из последовательности нескольких нуклеотидов) могут происходить замены, причем для каждого сайта есть определенная вероятность, что в нем эти замены (любые, неважно какие) случатся - для сайта А вероятность Р1, для Б - Р2 и т.д.

Как можно оценить, есть ли корреляция между частотой встречаемости сайта в геноме и вероятностью замены в нем?

Заранее спасибо!

Для статистической оценки связи думаю лучше подойдёт корреляция Спирмена, как вам уже и посоветовали. Она лучше Пирсона в том плане, что (1) нелинейность (если она есть) не уйдёт в ошибку анализа, (2) проценты распределены ненормально, для Пирсона их нужно предварительно преобразовывать угловыми преобразованиями. А вот что коррелировать - ? Если длина сайтов разная, то и вероятность замены внутри сайта должна отличатся. Поэтому думаю, что лучше коррелировать: Х1 - частота сайта в геноме, Х2 - Вероятность Р замены в сайте делённая на количество нуклеотидов в сайте (т.е. вероятность замены на нуклеотид сайта).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему