Цитата(vi-tjushka @ 9.02.2015 - 12:07)

Уважаемые форумчане, помогите разобраться с казалось бы простой задачей - необходимо доказать, что число пациентов в группе А больше (или нет) чем в группе Б, В в каждой возрастной категории. Пробовал таблицей 2Х2. Правильно ли это?
(1) Так у вас же таблица 6 х 3, почему же вы и как (?) проверяли таблицей 2 х 2? Обсчитайте тем же хи-квадратом но таблицу 6 х 3. Если значимо - цепляемся за это и ищем далее ячейки, давшие максимальный и неслучайный вклад в критерий. Для этого нужно рассчитать скорректированные стандартизованные остатки (chi-square adjusted stardardized residuals) = остатки Хабермана. Можно вместо них считать отклонения Фримана - Тьюки (Freeman-Tukey deviation). Хороших калькуляторов в сети быстро не нашёл, а в пакетах такое - редкость. Я считаю такое в Excel, куда вбил формулы. Отклонения Фримана - Тьюки есть в пакете Statistica в модуле логлинейного анализа, который позволяет анализировать и двумерные (ваша) и многомерные таблицы сопряжённости. Но значимость этих отклонений придётся считать вручную по формуле.
Если кто знает пакеты / калькуляторы, где реализованы эти 2 метода (Сhi-square adjusted stardardized residuals и Freeman-Tukey deviation), буду очень признателен если сообщите в этой теме.(2) Ваши данные можно обсчитать и другими методами, поскольку ваши категории (возраст) - упорядоченные. Просятся 2 метода.
а). Критерий Краскела - Уоллиса. Нужно использовать либо пакет StatXact, либо Ridit для среды R, либо сильно повозиться. Повозиться: присвоить возрастным категориям ранги от 1 до 6. Далее для группа А набить 3 единицы, 36 двоек, 30 троек и т. д. Для остальных групп аналогично. Обсчитать в любом статпакете, т.к. Краскел - Уоллис есть везде.
б). Использовать ридит-анализ - хороший метод для анализа именно таблиц сопряжённости с упорядоченным входом. Разбирался на этом форуме. Расчёт можно провести по аналогии с примером, детально и с формулами разобранным в этой статье:
https://yadi.sk/i/LnDJRT6Se88rB