Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Корреляция частот
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
Camel1000
Всем добрый день!
Что-то никак не могу сообразить, как лучше подойти к вроде простой задаче. Грубо говоря, есть некоторые сайты в геноме человека, характеризующиеся определенной частотой встречаемости. Скажем, сайт А встречается в 20% геномов, сайт Б - в 50%, сайт С - в 10% и так далее. Внутри каждого из сайтов (состоящего из последовательности нескольких нуклеотидов) могут происходить замены, причем для каждого сайта есть определенная вероятность, что в нем эти замены (любые, неважно какие) случатся - для сайта А вероятность Р1, для Б - Р2 и т.д.

Как можно оценить, есть ли корреляция между частотой встречаемости сайта в геноме и вероятностью замены в нем?

Заранее спасибо!
anserovtv

Да, можно оба показателя перевести в числовой формат и найти коэффициент корреляции Спирмена или Пирсона/ если типов сайтов достаточно много.
Не очень хорошо понимаю , а зачем это нужно делать?
Вопрос: а как нашли частоты и вероятности?
Если экспериментальным путем , то лучше взять первоначальные данные и представить их в виде таблицы сопряженности тип сайта произошло изменение или нет и
проверить сопряженность признаков по критерию хи-квадрат или Фишера. При этом выводы, полагаю, будут гораздо содержательнее , нежели вы хотите.
Я не очень хорошо понимаю суть и тонкости вашего исследования , но такое впечатление , что ваши методы анализа слишком грубы для такой задачи.
Есть специальные методы корреляции , на форуме есть специалист.
Camel1000
Я, наверное, плохо объяснил. Про таблицы сопряженности и Фишера понятно, это уже делали, и там есть закономерность. Теперь хочется установить вид этой закономерности, то есть по какому типу (прямо пропорционально, обратно пропорционально) как связано изменение частоты встречаемости сайтов и частота мутаций (изменений) в сайтах. То есть, грубо говоря, если сайты встречаются реже в геноме, то есть ли положительная корреляция между этим и повышеннием частоты мутаций в самих сайтах?
anserovtv
В SPSS при генерации таблиц сопряженности выводятся и кластеризованные столбиковые диаграммы, которые позволяют установить вид зависимости.
Также в меню Ячейки следует установить флажки
Сравнить пропорции столбцов.
Вычислить ожидаемые частоты.

Возможно, вам могут потребоваться и специальные случаи анализа последовательности на случайность./Критерий серий
nokh
Цитата(Camel1000 @ 6.09.2013 - 17:51) *
Всем добрый день!
Что-то никак не могу сообразить, как лучше подойти к вроде простой задаче. Грубо говоря, есть некоторые сайты в геноме человека, характеризующиеся определенной частотой встречаемости. Скажем, сайт А встречается в 20% геномов, сайт Б - в 50%, сайт С - в 10% и так далее. Внутри каждого из сайтов (состоящего из последовательности нескольких нуклеотидов) могут происходить замены, причем для каждого сайта есть определенная вероятность, что в нем эти замены (любые, неважно какие) случатся - для сайта А вероятность Р1, для Б - Р2 и т.д.

Как можно оценить, есть ли корреляция между частотой встречаемости сайта в геноме и вероятностью замены в нем?

Заранее спасибо!

Для статистической оценки связи думаю лучше подойдёт корреляция Спирмена, как вам уже и посоветовали. Она лучше Пирсона в том плане, что (1) нелинейность (если она есть) не уйдёт в ошибку анализа, (2) проценты распределены ненормально, для Пирсона их нужно предварительно преобразовывать угловыми преобразованиями. А вот что коррелировать - ? Если длина сайтов разная, то и вероятность замены внутри сайта должна отличатся. Поэтому думаю, что лучше коррелировать: Х1 - частота сайта в геноме, Х2 - Вероятность Р замены в сайте делённая на количество нуклеотидов в сайте (т.е. вероятность замены на нуклеотид сайта).
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.