Прошу помощи, анализ носительства полиморфизмов |
Здравствуйте, гость ( Вход | Регистрация )
Прошу помощи, анализ носительства полиморфизмов |
29.02.2012 - 06:14
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 29.02.2012 Пользователь №: 23524 |
Доброго времени суток!
К сожалению, моя аспирантура не подразумевает обучения статистике поэтому заранее прошу прощения за непрофессионализм... Постараюсь описать работу: Цель оценить распространенность протромботических полиморфизмов у детей развивших тромботический эпизод и их роль в развитии тромбозов у детей. Однако набор был приостановлен вследствие отсутствия финансирования. Пациенты дети с тромбозом различной локализации (128 чел). Обследованы на 10 полиморфизмов, множественные лабораторные, клинические, анамнестические данные, однако много пропусков. Контроль - здоровые лица в возрасте 16-30 лет (54 чел). Обследованы на 8 SNP + анамнестические данные (полный охват) других данных нет Распространенность гомо-/гетерозиготных и wild type аллелей, носительства мутантного аллеля в целом, а также генетического груза (суммарного количества мутантных аллелей в группе) оценены в группе пациентов и контроля. 128 Пациентов были разделены на группы и подгруппы 1. ВСЕ тромбозы 1.1. Вне зависимости от факторов риска (т.е. 128 человек) 1.2 Пациенты без дефицита естественных антикоагулянтов (доказанный фактор риска) (97 человек). Данная группа выделена тк контроль не обследован на данные факторы, а значит сравнить я их не смогу. Т.о. я подозреваю что у контроля нет дефицита (близко к правде по данным литературы) 1.3 Пациенты без других доказанных факторов риска - выделены для того чтобы показать независимое влияние SNP В каждой подгруппе выделено: 1.1.1 Пол (м/ж) 1.1.2. Возраст (до года/после года) 1.1.3. Возраст-пол (м до года/ м старше года и д до года/д старше года 2. Ишемический инсульт (та же иерархия) 3. Тромбоз глубоких вен (та же иерархия) Сравнение распространенности проводилось с данными полученными у контроля (в случае разделения по полу мальчики сравнивались с лицами мужского пола, девочки - женского) и между группами Расчет СШ для носительства гомо/гетерозигот и wild type проведен по аддитивной модели 95%ДИ. Расчет СШ для носительства мутантного аллеля проведен по мультипликативной модели в случае подчинения закону Харди-Вайнберга Использовал Точный критерий Фишера (при ожидаемом числе менее 5), таблицы 2х2 с поправкой Йетса где необходимо. Два хвоста распределения (пакет Doctorstat + Statistica 8.0 Eng) Результаты неутешительны(( Влияния мало. Мой вопрос: идти ли мне дальше тем же путем или можно сделать все по-другому? Как показать влияние аллельных комбинаций (неужели придется все делать вручную)? Буду признателен если Ваш ответ будет на доступном обывателю языке Заранее благодарен |
|
29.02.2012 - 10:24
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1091 Регистрация: 26.08.2010 Пользователь №: 22699 |
Доброго времени суток! К сожалению, моя аспирантура не подразумевает обучения статистике поэтому заранее прошу прощения за непрофессионализм... Постараюсь описать работу: Цель оценить распространенность протромботических полиморфизмов у детей развивших тромботический эпизод и их роль в развитии тромбозов у детей. Однако набор был приостановлен вследствие отсутствия финансирования. тут есть чуть ниже тред про МDR , это вид анализа специально разработанного для SNP например пакет для R http://cran.r-project.org/web/packages/MDR/index.html |
|
29.02.2012 - 20:03
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 43 Регистрация: 4.01.2012 Пользователь №: 23400 |
Мой вопрос: идти ли мне дальше тем же путем или можно сделать все по-другому? Как показать влияние аллельных комбинаций (неужели придется все делать вручную)? Буду признателен если Ваш ответ будет на доступном обывателю языке Заранее благодарен Ничего "вручную" делать не нужно. Относительно простая статистическая программа для анализа генетических данных с хорошими и понятным руководством к использованию - это ПЛИНК http://pngu.mgh.harvard.edu/~purcell/plink/tutorial.shtml Программа бесплатная. Очень полезные протоколы, хотя и для genome-wide association study но есть информация candidate-gene study http://www.nature.com/nprot/journal/v6/n2/...t.2010.182.html http://www.nature.com/nprot/journal/v5/n9/...t.2010.116.html В данный момент у меня 2 candidate-gene studies. Для анализа будет использоваться ПЛИНК и СТАТА. Если надумаете работать в ПЛИНК, то могу помочь. ПиСи Что такое СШ? |
|
29.02.2012 - 20:59
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 29.02.2012 Пользователь №: 23524 |
p2004r, Спасибо!
буду анализировать литературу по MDR. что смущает так это интерфейс R (сложно для обывателя), кроме того, мануал написан не очень подробно. Сообщение отредактировал Ras - 29.02.2012 - 21:07 |
|
29.02.2012 - 21:06
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 29.02.2012 Пользователь №: 23524 |
Ничего "вручную" делать не нужно. Относительно простая статистическая программа для анализа генетических данных с хорошими и понятным руководством к использованию - это ПЛИНК http://pngu.mgh.harvard.edu/~purcell/plink/tutorial.shtml Программа бесплатная. Очень полезные протоколы, хотя и для genome-wide association study но есть информация candidate-gene study http://www.nature.com/nprot/journal/v6/n2/...t.2010.182.html http://www.nature.com/nprot/journal/v5/n9/...t.2010.116.html В данный момент у меня 2 candidate-gene studies. Для анализа будет использоваться ПЛИНК и СТАТА. Если надумаете работать в ПЛИНК, то могу помочь. ПиСи Что такое СШ? Спасибо! СШ (соотношение шансов)= ОШ (отношение шансов) = OR (odds ratio) Скажите пожалуйста, правильно ли я разделил группы? |
|
29.02.2012 - 21:26
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 43 Регистрация: 4.01.2012 Пользователь №: 23400 |
Пациенты дети с тромбозом различной локализации (128 чел). Обследованы на 10 полиморфизмов, множественные лабораторные, клинические, анамнестические данные, однако много пропусков. Контроль - здоровые лица в возрасте 16-30 лет (54 чел). Обследованы на 8 SNP + анамнестические данные (полный охват) других данных нет 128 Пациентов были разделены на группы и подгруппы 1. ВСЕ тромбозы 1.1. Вне зависимости от факторов риска (т.е. 128 человек) 1.2 Пациенты без дефицита естественных антикоагулянтов (доказанный фактор риска) (97 человек). Данная группа выделена тк контроль не обследован на данные факторы, а значит сравнить я их не смогу. Т.о. я подозреваю что у контроля нет дефицита (близко к правде по данным литературы) 1.3 Пациенты без других доказанных факторов риска - выделены для того чтобы показать независимое влияние SNP В каждой подгруппе выделено: 1.1.1 Пол (м/ж) 1.1.2. Возраст (до года/после года) 1.1.3. Возраст-пол (м до года/ м старше года и д до года/д старше года 2. Ишемический инсульт (та же иерархия) 3. Тромбоз глубоких вен (та же иерархия) Во первых, не понимаю сколько у вас подгрупп в группе пациентов с тромбозами, 2 или 3. Меня смутил пункт 1.1. Во вторых, если контрольная группа не обследована на антикоагулянты, то зачем создавать такую подгруппу в группе с тромбозами? Сравнивать от будет не с чем... Просто напишите об ограничениях исследования в диссертации. |
|
29.02.2012 - 22:59
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 29.02.2012 Пользователь №: 23524 |
Во первых, не понимаю сколько у вас подгрупп в группе пациентов с тромбозами, 2 или 3. Меня смутил пункт 1.1. Во вторых, если контрольная группа не обследована на антикоагулянты, то зачем создавать такую подгруппу в группе с тромбозами? Сравнивать от будет не с чем... Просто напишите об ограничениях исследования в диссертации. Спасибо, На самом деле группа одна - 128 человек, в ней все дети развившие тромбоз той или иной локализации в возрасте 0-18 лет из нее выделены лица без дефицита естественных антикоагулянтов из нее выделены лица без других факторов риска Наверное я неправильно излагаю: Получается что я сравниваю генетику -у пациентов вне зависимости от локализации тромбоза и вне зависимости от факторов риска (в т.ч. естественных антикоагулянтов) по равнению с контролем, -у пациентов вне зависимости от локализации тромбоза без дефицита естественных антикоагулянтов с контролем -у пациентов вне зависимости от локализации тромбоза и без доказанных факторов риска с контролем. - у пациентов развивших венозных эпизод вне зависимости от факторов риска (в т.ч. естественных антикоагулянтов) по равнению с контролем, - у пациентов развивших венозных эпизод без дефицита естественных антикоагулянтов с контролем -у пациентов развивших венозных эпизод и без доказанных факторов риска с контролем. тоже проделывается с ишемическими инсультами. Т.о, как я считаю, в каждой группе я могу показать есть ли различия в генетике по сравнению со здоровыми лицами и посчитать OR Я создал эти группы потому что у группы контроля нет данных обследования. Выглядит натянуто, но как мне кажется, это единственный способ более-менее подойти к независимому риску.... Как пример: Частота мутантного аллеля Х в группе пациентов мужского пола, развивших венозный тромботический эпизод в возрасте до 1 года ниже чем в контрольной группе здоровых лиц мужского пола (0.12 против 0.29, р=0,0013;СШ(95%ДИ)=....итд...т.о. нельзя исключить защитное влияние данной мутации на риск тромбозов венозного русла у детей, что согласуется с данными полученными у взрослых... Другой вопрос, что в некоторых конечных подгруппах подобных тем что приведена выше количество пациентов менее 5... |
|
1.03.2012 - 21:13
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 43 Регистрация: 4.01.2012 Пользователь №: 23400 |
На самом деле группа одна - 128 человек, в ней все дети развившие тромбоз той или иной локализации в возрасте 0-18 лет из нее выделены лица без дефицита естественных антикоагулянтов из нее выделены лица без других факторов риска В первом посту вы написали, что контрольная группа- здоровые лица в возрасте 16-30 лет (54 чел). Наверное я неправильно излагаю: Получается что я сравниваю генетику -у пациентов вне зависимости от локализации тромбоза и вне зависимости от факторов риска (в т.ч. естественных антикоагулянтов) по равнению с контролем, -у пациентов вне зависимости от локализации тромбоза без дефицита естественных антикоагулянтов с контролем -у пациентов вне зависимости от локализации тромбоза и без доказанных факторов риска с контролем. - у пациентов развивших венозных эпизод вне зависимости от факторов риска (в т.ч. естественных антикоагулянтов) по равнению с контролем, - у пациентов развивших венозных эпизод без дефицита естественных антикоагулянтов с контролем -у пациентов развивших венозных эпизод и без доказанных факторов риска с контролем. тоже проделывается с ишемическими инсультами. Т.о, как я считаю, в каждой группе я могу показать есть ли различия в генетике по сравнению со здоровыми лицами и посчитать OR Здесь вы пишите, что будете сравнивать с контрольной группой. А ниже пишите, что у группы контроля нет данных обследования. Нелогично получается. Я создал эти группы потому что у группы контроля нет данных обследования. Выглядит натянуто, но как мне кажется, это единственный способ более-менее подойти к независимому риску.... Другой вопрос, что в некоторых конечных подгруппах подобных тем что приведена выше количество пациентов менее 5... Если хотя бы одна ожидаемая величина меньше 5, то используется тест Фишера. |
|
1.03.2012 - 21:25
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 29.02.2012 Пользователь №: 23524 |
В первом посту вы написали, что контрольная группа- здоровые лица в возрасте 16-30 лет (54 чел). группа случаев (128 чел с тромбозом), обследованы на генетику и множество других лабораторных показателей + анамнез. Именно в ней я выделяю подгруппы описанные выше группа контроля (54 здоровых) обследованы на генетику + анамнез Спасибо |
|
1.03.2012 - 21:31
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 29.02.2012 Пользователь №: 23524 |
Здесь вы пишите, что будете сравнивать с контрольной группой. А ниже пишите, что у группы контроля нет данных обследования. Нелогично получается. Поэтому я и выделяю эти группы... На самом деле такой алгоритм был подсмотрен в зарубежных источниках - они обследуют к примеру 100 здоровых лиц только на генетику а в группе случаев (тромбозы) удаляют пациентов с доказанными (помимо генетики конечно) факторами риска. |
|
1.03.2012 - 21:37
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 43 Регистрация: 4.01.2012 Пользователь №: 23400 |
Поэтому я и выделяю эти группы... На самом деле такой алгоритм был подсмотрен в зарубежных источниках - они обследуют к примеру 100 здоровых лиц только на генетику а в группе случаев (тромбозы) удаляют пациентов с доказанными (помимо генетики конечно) факторами риска. Дайте ссылку на статью |
|
1.03.2012 - 23:26
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 29.02.2012 Пользователь №: 23524 |
Дайте ссылку на статью К сожалению, Вы абсолютно правы, внимательно перечитав статью нашел "previosly diagnosed" (т.е группа контроля была все-таки обследована). Как я понимаю, сравнивать таким образом группы нельзя. Т.о. я смогу сравнить только всех пациентов и в зависимости от локализации... А в группах с дополнительными обследованиями которые не были проведены в контрольной группе я смогу показать частоту того или иного фактора риска, но не смогу посчитать риск (могу только сравнить с литературными данными). Это означает, что я даже косвенно не могу подобраться к более-менее независимому риску? В плане комбинаций полиморфизмов попробовал MDR с более дружелюбным интерфейсом чем R и доступным tutorial http://www.multifactordimensionalityreduction.org/ Однако, даже почитав несколько статей по методу никак не могу понять вот что... требует ли этот метод одинаковых по численности групп case и control. Есть подозрение, что все же требует... Спасибо Сообщение отредактировал Ras - 1.03.2012 - 23:28 |
|
1.03.2012 - 23:41
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 43 Регистрация: 4.01.2012 Пользователь №: 23400 |
Как я понимаю, сравнивать таким образом группы нельзя. Т.о. я смогу сравнить только всех пациентов и в зависимости от локализации... А в группах с дополнительными обследованиями которые не были проведены в контрольной группе я смогу показать частоту того или иного фактора риска, но не смогу посчитать риск (могу только сравнить с литературными данными). Да. Это означает, что я даже косвенно не могу подобраться к более-менее независимому риску? Что подрузамеваете под независимым риском? В плане комбинаций полиморфизмов попробовал MDR с более дружелюбным интерфейсом чем R и доступным tutorial http://www.multifactordimensionalityreduction.org/ Однако, даже почитав несколько статей по методу никак не могу понять вот что... требует ли этот метод одинаковых по численности групп case и control. Есть подозрение, что все же требует... Спасибо Ничего не могу посоетовать относительно MDR, я работаю в PLINK (см. пост3). |
|
2.03.2012 - 01:04
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 8 Регистрация: 29.02.2012 Пользователь №: 23524 |
Спасибо за потраченное на меня время! Сообщение отредактировал Ras - 2.03.2012 - 01:05 |
|