Помогите со статистикой |
Здравствуйте, гость ( Вход | Регистрация )
Помогите со статистикой |
17.02.2021 - 16:54
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 8.02.2021 Пользователь №: 39567 |
Здравствуйте! помогите, пожалуйста, разобраться с анализом:
Есть данные, уровень полиморфизма 5 мутаций (%), в двух выборках (разные типы тканей от одного человека). Хотел сравнить выборки по Стьюденту, но из 5 только 2 мутации имеют нормальное распределение, можно ли провести нормализацию выборок, и как это сделать, ведь данные в процентах. Ещё есть такой момент: например, у одного человека уровень полиморфизма в одной ткани 2%, а в другой 4%. С точки зрения математики разница в два раза, с биологической - её нет. Можно ли это как-то учесть при анализе. Сообщение отредактировал Centaurea - 17.02.2021 - 16:57 |
|
17.02.2021 - 17:07
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 95 Регистрация: 27.12.2015 Пользователь №: 27815 |
2Centaurea
Добрый день. Пока сравнивать ничего не надо. Опишите подробней: 1. Что за данные; 2. В чём измеряются; 3. Как они получены; 4. Для чего они получены; 5. Как собрана таблица с ними. |
|
18.02.2021 - 16:17
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 8.02.2021 Пользователь №: 39567 |
Есть выборка - примерно 30 человек.
От каждого было получено 2 типа ткани: кровь и буккальный эпителий. Был определён уровень мутантного аллеля (гетероплазмии митохондриального генома) по 5 мутациям в каждом типе ткани. Данный уровень выражен в процентах. Необходимо сравнить является ли уровень гетероплазмии в крови таким же как и в буккальном эпителии. Пример: Уровень гетероплазмии мутации (%) в разных типах тканей человека __________Кровь_____Буккальный эпителий Пациент 1____20______________20 Пациент 2_____3_______________6 Сообщение отредактировал Centaurea - 18.02.2021 - 16:20 |
|
19.02.2021 - 01:38
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 143 Регистрация: 4.09.2012 Пользователь №: 24146 |
|
|
19.02.2021 - 09:39
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 95 Регистрация: 27.12.2015 Пользователь №: 27815 |
2Centaurea
Поддерживая предыдущего оратора, опишу возможную альтернативу по анализу данных. Так как Ваши данные процентные, их можно описать бета-распределением. В связи с этим Вам может подойти бета-регрессия со смешанными эффектами GLMMadaptive. Также посмотрите описание библиотеки по ссылке countdata. Судя по тексту, пакет позволяет считать парный тест для процентных данных. |
|
19.02.2021 - 12:37
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 8.02.2021 Пользователь №: 39567 |
|
|
19.02.2021 - 12:57
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 143 Регистрация: 4.09.2012 Пользователь №: 24146 |
|
|
19.02.2021 - 20:35
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Есть выборка - примерно 30 человек. От каждого было получено 2 типа ткани: кровь и буккальный эпителий. Был определён уровень мутантного аллеля (гетероплазмии митохондриального генома) по 5 мутациям в каждом типе ткани. Данный уровень выражен в процентах.Необходимо сравнить является ли уровень гетероплазмии в крови таким же как и в буккальном эпителии. А нужно при учитывать аллели (5 шт) или всё в кучу: просто в одной ткани столько-то всего мутантных, в другой - столько-то? Ведь возможна ситуация, когда общий уровень будет одинаковым, но с крови за счёт одних аллелей, а в б. эпителии - за счёт других. Если всё в кучу, то это просто сравнение двух зависимых выборок непараметрикой, скажем парным критерием Уилкоксона (Wilcoxon signed-rank test), т.к. проценты распределены ненормально. Описано на стр. 112 практикума: https://yadi.sk/d/g50i73pt3J6pAa Если нужно учитывать аллели - сложнее. Можно вариантом дисперсионного анализа с преобразованными частотами (фи-преобразование = преобразование арксинуса или аналогичные угловые преобразования, переводящие ненормально распределённые проценты от 0 до 100% в приблизительно нормально распределённые углы от 0 до пи). Учесть зависимый характер выборок можно введением случайного фактора Пациент. Получится обычная перекрёстная схема трёхфакторного ANOVA с факторами: 1) Пациент, случайный, число градаций = числу пациентов 2) Ткань, фиксированный, 2 градации 3) Аллель, фиксированный, 5 градаций. В этой схеме возможны все взаимодействия, но нужно правильно задать в пакетах случайный характер фактора Пациент. Сообщение отредактировал nokh - 19.02.2021 - 20:55 |
|