Цитата(okolomedik @ 29.01.2015 - 20:19)

Уважаемые обитатели форума, подскажите, пожалуйста, неразумному бактериологу!
Вот у нас есть данные про наличие или отсутствие определенных бактерий у людей разного возраста. То есть выглядят они следующим образом:
1 - возраст 10 лет - нету
2 - возраст 12 лет - нету
3 - возраст 15 лет - есть
4 - возраст 25 лет - нету
5 - возраст 30 лет - есть
и. .т. д.
Вопрос - каким образом можно определить, зависит ли встречаемость данных бактерий от возраста?
У меня возникла мысль, что так как эти данные можно представить в виде ...00101..., проранжировав пациентов по возрасту, то к данной последовательности можно применить критерий Манна-Уитни. Обычно для его применения априорно известный параметр дискретен (группа), а измеряемый непрерывен, а здесь получается наоборот. Прав ли я, что так можно? Если нет, то какой критерий лучше использовать? И что советуете почитать про это дело?
Заранее большое спасибо!
Т.к. может быть нелинейная связь лучше строить таблицу частот. Постройте таблицу: в строках - возраст, в 2 колонках - количества людей с "есть", и с "нету". Возраста можно группировать в более крупные категории, например, 10-12, 13-14, 15-16... или 10-15, 16-20, 21-25... Пока это не строго, в принципе для анализа даже необязательно, чтобы ряд возрастов был нарезан на одинаковые отрезки категорий, т.е. можно, например, 10-12, 13-18, 19-25, 26-50 и более 50. Выбор должен делаться исходя из знаний о сути процесса и объёма материала, главное увидеть закономерность или её отсутствие. Статистически проверить такую таблицу сопряжённости можно критериями типа хи-квадрат, читайте про этот метод. Чтобы изобразить наглядно - рассчитайте по такой таблице % встречаемости бактерии для каждого возраста и отложите на графике. Если будет тренд увеличения или снижения частоты с возрастом, то таблицу сопряжённости лучше проверять не простым хи-квадратом, а критериями проверки на тренд (они есть в пакетах и онлайновых калькуляторах вроде тоже) - будет выигрыш в мощности. В принципе, если есть теоретические соображения о характере нелинейного тренда, можно проверить и на соответствие ему: описано в Закс Л. Статистическое оценивание и вроде бы программа StatXact такое позволяла задать.