Цитата(ivan12 @ 1.04.2014 - 15:42)

Уважаемые коллеги!
Помогите, пожалуйста, выбрать правильный метод статистического анализа данных.
Исследовалось время до начала лизиса сгустка крови. Наблюдение продолжалось в течение 1 часа. Всего было три независимых группы образцов (в группах от 10 до 16 образцов). В группе 1 лизис начинался в среднем через 35 мин, в группе 2 - через 45 мин, а в группе 3 - либо еще позже, либо лизис вообще не начинался за время наблюдения (т. е. в течение часа). Подскажите, как правильно сравнить эти группы. Насколько я понимаю, нельзя же просто проигнорировать часть наблюдений, для которых время начала лизиса не было установлено, и применить ANOVA?
С признательностью,
Иван
Наблюдения, в которых лизис не начался за всё время эксперимента называются цензурированными наблюдениями (ЦН) типа "более чем". Анализ таких данных разработан, даже возможны варианты.
(1) При анализе таких данных удобно использовать порядковые статистики. И при описании (медиана, квартили) и при сравнении. В случае 3 групп можно использовать не дисперсионный анализ (anova), а его прямой ранговый аналог - критерий Краскела-Уоллиса. Поскольку обрабатываться будут не сами числа, а только их ранги - ЦН для анализа нужно просто заменить большим числом, например, 60 мин или 120 мин - не принципиально.
(2) Можно использовать методы, специально разработанные для анализа данных с ЦН - как вам советует р2004r. Читайте про
анализ выживаемости, метод Каплана - Мейера и т.д. У вас данных мало, ступеньки будут некрасиво большими, но это классика - полезно освоить.
(3) Существуют также всякие экстраполяционные процедуры, типа ROS-метода (Regression on Order Statistics) и ещё много чего. Но, полагаю, для начала это - уже перебор.