Дисперсионный анализ (ANOVA) при одном наблюдении на ячейку

Дисперсионный анализ (ANOVA) при одном наблюдении на ячейку

Blaid Просмотр профиля	17.05.2021 - 23:51 Сообщение #1
Группа: Пользователи Сообщений: 36 Регистрация: 27.08.2012 Пользователь №: 24128	Здравствуйте уважаемые участники форума! Обращаюсь за помощью в решении следующего вопроса: - вроде бы как есть обычный двухфакторный дисперсионный анализ в виде оценки влияния таких факторов как вид растения (фактор А) и тип растворителя-экстрагента (фактор Б) на цитотоксичность растительных экстрактов, протестированных на линии раковых клеток. Зависимая переменная (переменная отклика) - количественная непрерывная (выраженная в мкг/мл). Фактор А - это вид растения (всего 5 видов). Фактор Б - тип растворителя-экстрагента (хлороформ, этилацетат, метанол, этанол и др.). Всего 7 типов экстрагентов для каждого вида и для каждого вида набор экстрагентов одинаков. Т.е. фактор Б не является вложенным в фактор А (поскольку для каждого вида набор из 7-ми экстрагентов одинаков, один и тот же). НО ЕСТЬ ОСОБЕННОСТЬ: в ячейке данного дисперсионного комплекса только по одному наблюдению... Т.е. допустим: есть вид растения полынь, для которого протестировано 7 типов экстрактов (метанольный, хлороформный, этилацетатный и т.д.). Далее - есть вид растения эхинацея, для которого протестировано 7 типов таких же экстрактов. Далее - есть вид растения чабрец, для которого протестировано 7 типов экстрактов (таких же, как для полыни и эхинацеи). И т.д. И для каждого типа экстракта того или иного вида есть ТОЛЬКО одно значение цитотоксичности (мкг/мл). Т.о. фактор А (на 5-ти уровнях градации) содержит по 7 значений (на каждом из 5-ти уровней, отвечающих 5-ти видам растений). А фактор Б (на 7-ми уровнях градации, одинаковых для каждой из 5-ти градаций фактора А) содержит только по одному значению. Будет ли правильным - при такой схеме градации независимых переменных и одной переменной отклика - использовать дисперсионный анализ в целом? Интересует ответ на вопрос какие факторы (вид растения и тип растворителя-экстрагента) влияют на вариацию цитотоксичности растительных экстрактов? Т.е. (проще говоря) от чего зависит цитоксичность: от вида растения или от типа растворителя-экстрагента (или же от их сочетания)? Причина того, что для каждого типа экстракта (допустим метанольный из полыни или метанольный из эхинацеи) есть только одно значение цитотоксичности заключается в том, что данный показатель оценивался на основе построения кривых доза-эффект (с определением для каждой кривой показателя IC50 - полуэффективной подавляющей рост концентрации). И для каждого типа экстракта строилась (в силу ограниченности ресурсов) только одна кривая (а не, допустим, 3). Поэтому и наблюдение т.о. только одно... Спасибо!

Ответов

nokh Просмотр профиля	20.05.2021 - 21:58 Сообщение #2
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(Blaid @ 18.05.2021 - 01:51) ...НО ЕСТЬ ОСОБЕННОСТЬ: в ячейке данного дисперсионного комплекса только по одному наблюдению... Это действительно особенность, но не проблема. Просто дисперсионный комплекс с одним наблюдением на ячейку. Описан в Монтгомери (в переводном издании на стр. 150): https://yadi.sk/d/iWeppTdonLaAog Также описано у Сокала и Рольфа, у Мардиа и Земроч, и в др. книжках. Поскольку наблюдение одно, ошибку нельзя отделить от взаимодействия, т.е. ошибкой выступает сумма (взаимодействие если оно есть + ошибка). Хотя судить о взаимодействии помогает тест Тьюки на неаддитивность. Получается как дисперсионный анализ главных эффектов (main effects anova). Более проблематичной видится нормальность распределения ошибки, тест на которую пакеты скорее всего не выдадут. А асимметричное распределение ошибки увеличит дисперсию и снизит разрешающую способность анализа. Поэтому я бы провёл такую проверку вручную, удобно даже в Экселе: 0) Сначала рассчитать среднее для всей таблицы и вычесть его из каждого значения таблицы, т.е. убрать из модели мю (математическое ожидание). В принципе, этот шаг можно пропустить, т.к. вычитание константы не повлияет на распределение ошибки кроме как сдвигом. 1) Для оставшейся матрицы рассчитать средние значения по строкам и вычесть его из значений соответствующей строки, т.е. убрать из модели фактор строки (например, Вид) 2) Для оставшейся матрицы рассчитать средние значения по столбцам и вычесть его из значений соответствующего столбца, т.е. убрать из модели фактор столбца (например, Растворитель) 3) То, что останется и будет ошибкой модели. 5 х 7 = 35 значений. Этого уже хватит и для проверки на нормальность и для построения грубой гистограммы. Если распределение будет скошенным, исходные данные можно преобразовать, например попробовать логарифмирование. т.к. малые концентрации распределены близко к логнормальному. Как вариант можно применить также непараметрику. Можно провести анализ Фридмана (для рандомизированных блоков) и оценить значимость эффекта строки. Затем транспонировать матрицу данных и повторить анализ, так получим оценку эффекта столбца. Поскольку метод ранговый, получится довольно грубо, но как вариант... Дисперсионный анализ мне нравится больше.

Сообщений в этой теме

Blaid Дисперсионный анализ (ANOVA) при одном наблюдении на ячейку 17.05.2021 - 23:51

nokh Цитата(Blaid @ 18.05.2021 - 01:51) .... 20.05.2021 - 21:58

comisora 2 Blaid, По Вашему описанию выполнил генерацию дан... 21.05.2021 - 09:48

« Предыдущая тема · Медицинская статистика · Следующая тема »