Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Генотип, ко-факторы, исход, как анализировать?
don
сообщение 15.06.2014 - 14:09
Сообщение #1





Группа: Пользователи
Сообщений: 24
Регистрация: 11.06.2014
Пользователь №: 26460



Здравствуйте, коллеги! Прошу помощи в анализе данных.
Задача исследования - оценить связь между генотипом (15 SNP), "промежуточным фенотипом" (параметры биохимии, иммунологии и др.), исходом (ЗНО есть/нет).
Существующий сервис "SNPstats" (http://bioinfo.iconcologia.net/SNPstats_web) выдает отношения шансов, "adjustet by фактор1+фактор2+...", используется при этом "logistic regression models" (то есть, логит-регрессию?). Хотелось бы поточнее узнать, что значит "adjusted by".
Кроме того, в данной програме остается "за кадром", какой из факторов является ведущим.
Возможно, есть какие то альтернативные методы анализа, позволяющие оценить вклад конкретных факторов?
Посоветуйте, пожалуйста. Заранее благодарен.

И есть ещё один вопрос:
По разным SNP имеется разное количество генотипированных, как и разное количество известных значений по каждому из "промежуточных фенотипов" и исходов.
То есть, грубо говоря, выборки по каждому из SNP перекрываются только отчасти. Нужно ли в этом случае рассматривать проблему множественных сравнений?
Спасибо!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
TheThing
сообщение 15.06.2014 - 15:15
Сообщение #2





Группа: Пользователи
Сообщений: 116
Регистрация: 20.02.2011
Пользователь №: 23251



1) Что означает adjusted..Вы включаете в модель один фактор_1, рассчитываете отношения шансов для этого одного "снипа"..затем создаете новую модель, в которую включаете фактор_2, получаете отношения шансов для фактора_2. Теперь, если Вы включите фактор_1 и фактор_2 в одну модель, то получите скорректированные (adjusted) отношения шансов для фактора_1 и фактора_2, поскольку в модель включаются оба фактора, поэтому OR фактора_1 корректируются относительно присутствия фактора_2 и наоборот. То есть adjusted в данном случае - это просто расчет OR относительно количества предикторов, включенных в модель..

2) Как Вы знаете, снипы (SNPs) сами по себе обладают очень маленькими величинами эффектов, то есть сам по себе 1 полиморфизм не может определить предрасположенность к заболеванию (если Вы только не исследуете моногенные заболевания, в чем я сомневаюсь). Следовательно, риск развития наиболее распространенных полигенных заболеваний, таких как артериальная гипертензия, инфаркт миокарда, сахарный диабет и др., определяется совокупностью влияний снипов, а также факторами внешней среды. Поэтому, изучая вклад каждого снипа без учета взаимодействия (строя аддитивные модели) Вы никогда не докопаетесь до истины. Для этого необходимо изучать межгенные взаимодействия с целью определить, например, усиливает ли Снип1 влияние Снипа 2, какая связь между Снипом1 и Снипом2? Для решения подобных задач был разработан целый спектр подходов и алгоритмов, основные из них приведены на рисунке ниже.
Прикрепленное изображение


Из этого списка очень хорошие результаты показывают Multifactorial Dimensionality reduction и Random Forest с модификацией Catherine Strobl. Про первых подход можно ознакомиться на сайте MDR:
http://www.multifactordimensionalityreduction.org/
Статьи про MDR, например:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1226028/
Вторую прикрепил здесь.
Прикрепленный файл  multifactor1.pdf ( 648,61 килобайт ) Кол-во скачиваний: 1017


Метод хороший и работает как для подхода ген-кандидат (как в Вашем случае), так и для полногеномных исследований, когда количество снипов будет от 100 тысяч (здесь логистическая регрессия загнется в результате "curse of dimensionality").
3) Какой из снипов делает наибольший вклад в риск развития заболевания позволит Вам определить, например, Random Forest с модификацией Catherine Strobl ("тетя" из Германии, которая всю жизнь занимается лишь случайными лесами, ей можно доверять smile.gif ). Погуглите Strobl C. An Introduction to Recursive Partitioning: Rationale, Application and Characteristics of Classification and Regression Trees, Bagging and Random Forests. Должны быть статьи в свободном доступе, если не найдете, вышлю Вам. Также этот метод реализовал в скрипте R, если работаете в R (или пока не работаете) - тоже могу выслать.

Для статьи в хорошем журнале или для кандидатской (докторской) хорошего уровня, расчет лишь OR c р-values - явно недостаточно. Любая хорошая конференция, посвященная проблемам биоинформатики и определения SNP's, включает вышеприведенные методы.

Сообщение отредактировал TheThing - 15.06.2014 - 15:26
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- don   Генотип, ко-факторы, исход   15.06.2014 - 14:09
- - TheThing   1) Что означает adjusted..Вы включаете в модель од...   15.06.2014 - 15:15
- - p2004r   Если данных достаточное количество, то стоило бы п...   16.06.2014 - 00:05
- - don   Благодарю, коллеги, за ответы. Буду разбираться...   17.06.2014 - 09:09
- - don   Добрый день, коллеги! Изучение вопроса привело...   25.09.2014 - 09:47
|- - p2004r   Цитата(don @ 25.09.2014 - 09:47) Про...   23.10.2014 - 22:36
|- - don   Цитата(p2004r @ 24.10.2014 - 01:36) ...   28.10.2014 - 10:06
|- - p2004r   Цитата(don @ 28.10.2014 - 10:06) Бла...   28.10.2014 - 18:13
- - anserovtv   Попробуйте прочитать о важности переменных здесь ...   28.09.2014 - 19:41
- - anserovtv   Коды, генерируемые программой, можно преобразовать...   28.09.2014 - 19:44
|- - don   anserovtv Большое Вам спасибо за первую ссылочку (...   29.09.2014 - 14:00
|- - TheThing   Цитата(don @ 29.09.2014 - 14:00) ans...   29.09.2014 - 15:07
|- - don   Цитата(TheThing @ 29.09.2014 - 18:07...   29.09.2014 - 21:09
||- - TheThing   Цитата(don @ 29.09.2014 - 21:09) Про...   29.09.2014 - 21:41
||- - don   Цитата(TheThing @ 30.09.2014 - 00:41...   30.09.2014 - 06:55
||- - TheThing   Цитата(don @ 30.09.2014 - 06:55) Пре...   30.09.2014 - 08:54
||- - don   Цитата(TheThing @ 30.09.2014 - 11:54...   30.09.2014 - 10:34
||- - TheThing   Цитата(don @ 30.09.2014 - 10:34) А е...   30.09.2014 - 14:07
||- - don   Цитата(TheThing @ 30.09.2014 - 17:07...   28.10.2014 - 12:33
|- - don   Доброго времени суток! Возникло ещё несколько ...   28.10.2014 - 09:54
- - p2004r   Вот тут приатачен файл с примером анализа пакетом ...   28.10.2014 - 18:20


Добавить ответ в эту темуОткрыть тему