Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Помогите со статистикой

Автор: Centaurea 17.02.2021 - 16:54

Здравствуйте! помогите, пожалуйста, разобраться с анализом:
Есть данные, уровень полиморфизма 5 мутаций (%), в двух выборках (разные типы тканей от одного человека).
Хотел сравнить выборки по Стьюденту, но из 5 только 2 мутации имеют нормальное распределение, можно ли провести нормализацию выборок, и как это сделать, ведь данные в процентах.
Ещё есть такой момент: например, у одного человека уровень полиморфизма в одной ткани 2%, а в другой 4%. С точки зрения математики разница в два раза, с биологической - её нет. Можно ли это как-то учесть при анализе.

Автор: comisora 17.02.2021 - 17:07

2Centaurea

Добрый день.

Пока сравнивать ничего не надо.

Опишите подробней:
1. Что за данные;
2. В чём измеряются;
3. Как они получены;
4. Для чего они получены;
5. Как собрана таблица с ними.

Автор: Centaurea 18.02.2021 - 16:17

Есть выборка - примерно 30 человек.
От каждого было получено 2 типа ткани: кровь и буккальный эпителий. Был определён уровень мутантного аллеля (гетероплазмии митохондриального генома) по 5 мутациям в каждом типе ткани. Данный уровень выражен в процентах.
Необходимо сравнить является ли уровень гетероплазмии в крови таким же как и в буккальном эпителии.
Пример:
Уровень гетероплазмии мутации (%) в разных типах тканей человека
__________Кровь_____Буккальный эпителий
Пациент 1____20______________20
Пациент 2_____3_______________6

Автор: Диагностик 19.02.2021 - 01:38

Цитата(Centaurea @ 18.02.2021 - 21:17) *
Необходимо сравнить является ли уровень гетероплазмии в крови таким же как и в буккальном эпителии.

Проверка однородности двух связанных выборок непараметрическим методом.

Автор: comisora 19.02.2021 - 09:39

2Centaurea

Поддерживая предыдущего оратора, опишу возможную альтернативу по анализу данных. Так как Ваши данные процентные, их можно описать бета-распределением. В связи с этим Вам может подойти бета-регрессия со смешанными эффектами https://drizopoulos.github.io/GLMMadaptive/articles/Custom_Models.html. Также посмотрите описание библиотеки по ссылке https://cran.r-project.org/web/packages/countdata/vignettes/countdata.html. Судя по тексту, пакет позволяет считать парный тест для процентных данных.

Автор: Centaurea 19.02.2021 - 12:37

Цитата(Диагностик @ 19.02.2021 - 01:38) *
Проверка однородности двух связанных выборок непараметрическим методом.


А почему эти две выборки являются связанными? Я думал, что они независимые.

Автор: Диагностик 19.02.2021 - 12:57

Цитата(Centaurea @ 19.02.2021 - 17:37) *
А почему эти две выборки являются связанными?

Через пациента.
Цитата(Centaurea @ 19.02.2021 - 17:37) *
Я думал, что они независимые.

Корреляция между ними есть?

Автор: nokh 19.02.2021 - 20:35

Цитата(Centaurea @ 18.02.2021 - 18:17) *
Есть выборка - примерно 30 человек.
От каждого было получено 2 типа ткани: кровь и буккальный эпителий. Был определён уровень мутантного аллеля (гетероплазмии митохондриального генома) по 5 мутациям в каждом типе ткани. Данный уровень выражен в процентах.Необходимо сравнить является ли уровень гетероплазмии в крови таким же как и в буккальном эпителии.

А нужно при учитывать аллели (5 шт) или всё в кучу: просто в одной ткани столько-то всего мутантных, в другой - столько-то? Ведь возможна ситуация, когда общий уровень будет одинаковым, но с крови за счёт одних аллелей, а в б. эпителии - за счёт других.
Если всё в кучу, то это просто сравнение двух зависимых выборок непараметрикой, скажем парным критерием Уилкоксона (Wilcoxon signed-rank test), т.к. проценты распределены ненормально. Описано на стр. 112 практикума: https://yadi.sk/d/g50i73pt3J6pAa
Если нужно учитывать аллели - сложнее. Можно вариантом дисперсионного анализа с преобразованными частотами (фи-преобразование = преобразование арксинуса или аналогичные угловые преобразования, переводящие ненормально распределённые проценты от 0 до 100% в приблизительно нормально распределённые углы от 0 до пи). Учесть зависимый характер выборок можно введением случайного фактора Пациент. Получится обычная перекрёстная схема трёхфакторного ANOVA с факторами:
1) Пациент, случайный, число градаций = числу пациентов
2) Ткань, фиксированный, 2 градации
3) Аллель, фиксированный, 5 градаций.
В этой схеме возможны все взаимодействия, но нужно правильно задать в пакетах случайный характер фактора Пациент.

Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)