На мой взгляд задача не самая простая - информация разнородная, с какого конца подступится? Будем рассуждать. Сначала введу обозначения, чтобы как-то организовать данные. Обозначим малые дозы 0-15 сГр как d1, d2, ...d7, самую большую (1 Гр) - D, схемы облучения в эксперименте «малая - через 5 ч - большая» как d1D, d2D, ...d7D. Для каждого из 3-х доноров имеем частоту клеток с ХА для 15 доз и их комбинаций: d1-d7, d1D- d7D, D (всего 15 препаратов).
Подойти к решению задачи можно по-разному в зависимости от того, что считать единицей анализа: (1) долю клеток с ХА в экспериментальной точке или (2) клетку.
(1). Путь с долями проще с том плане, что преобразовав («нормализовав») частоты, далее с данными можно работать относительно простыми параметрическими методами. В кое-каких областях (например, работа с микробами, микроэлементным составом и др.) действительно более распространено логарифмическое преобразование. Но обычно для частот используют угловые преобразования. Традиционно используется фи-преобразование, которое позволяет «развязать» среднее значение и дисперсию, «сцепленные» в случае долей: у=2arcsin(SQRT(p)), где р - доля клеток с нарушениями (в долях единицы). Раньше таблицы с ними даже в книжках печатали (см. Урбах. Биометрические методы). Еще лучше воспользоваться преобразованием Фримана-Тьюки для биномиального распределения:
http://www.jstor.org/pss/2332765 . По нему была статья и в отечественном журнале (Бобринев, Ревазова, «Генетика», 80-е годы), если нужно - поищу ссылку. То, что количество клеток на большой дозе меньше - не страшно, там ведь нарушений больше - точность не страдает. После преобразования имеем 45 значений: по 15 для каждого донора. Отказываться от усреднения по донорам неправильно: вы ведь хотите найти некую общую закономерность, а не разобраться с конкретным человеком! Другое дело как это усреднение грамотно провести. Для анализа нужно свести все данные в дисперсионный комплекс с двумя факторами: 1 - облучение (фиксированный, 15 градаций), 2 - донор (случайный, 3 градации). Ошибкой в этом комплексе будет взаимодействие факторов «Облучение*Донор», отражающее индивидуальную реакцию на облучение - на это взаимодействие будут тестироваться факторы. Если в анализе по фактору «Облучение» различия будут статистически значимыми - можно будет разбираться с дозами. Так как вас интересуют не все сравнения, то нужно использовать не post-hoc, а запланированные ортогональные сравнения и сравнивать d1D- d7D против D и d#D против соответствующих (d#+D). Может также варианты d1D-d7D или некоторые из них между собой, чтобы нащупать различия в АО но тогда нужно смотреть получится ли ортогональность. Минусы всего этого подхода - (1) не используется информация о количестве проанализированных клеток и (2) маловато человек на такой анализ, но нужно считать.
(2). Если брать в качестве единицы анализа клетку, то будет сложнее потом проводить сравнения, но информация будет использована по-максимуму. Это будет типа аналога описанного подхода, но на входе будут не доли, а клетки. Это - логлинейный анализ таблицы частот с тремя входами: 1 - ХА (2 варианта: есть - нет), 2 - облучение (15 вариантов), 3 - донор (3 варианта). Нужно подогнать (fit) к данным модель и далее работать с отношениями шансов для интересующих ячеек по этой модели. Для малого числа входов обычно используют иерархический поиск модели.
Если вам понятно что я написал - могу дальше подсказать как это делать в пакете Statistica. Если нет - почитайте литературу по дисперсионному и логлинейному анализу. Кое-что есть и на этом форуме.