Цитата(Сталкер @ 26.08.2009 - 17:34)

Игорь и nokh я, ксожалению, пока в таких сложных моментах не могу польностью разобраться

Если Вас не затруднит - можно те же мои цифры обсчитать правильно, но поэтапно и с какими-нибудь таблицами? Мне так будет проще понять что к чему.
Есть методы ручной расчет по которым крайне утомителен и содержит большую вероятность ошибок. Поэтому знать детально работу критериев с которыми Вы работаете желательно, но не обязательно, намного важнее ориентироваться в выборе соответствующих задаче методов, знать их сильные и слабые стороны, условия применимости. Из обсуждаемых здесь специальных методов я вручную считал только Краскела-Уоллиса, но применительно к таблицам сопряженности до вчерашнего дня не знал как он работает - думал есть особая его модификация. Благодаря Игорю теперь все понятно - таблица сопряженности разворачивается в 2 или несколько выборок. Для вашей первой задачи (16, 9, 1 и 18, 13, 4) группа легких больных представлена 16-ю единицами, 9-ю двойками и одной тройкой, а группа тяжелых - 18-ю единицами, 13-ю двойками и четырьмя тройками. 1, 2 и 3 - коды, которые получают упорядоченные категории: 1 - улучшение, 2 - стабилизация, 3 - ухудшение. Далее проводится сравнение этих групп. Аналогично и для критерия Джонкхира-Терпстры.
В ваших задачах в качестве главной нулевой гипотезы (Но) выступает отсутствие сдвига в двух или нескольких рядах (в задаче 1 Но: улучшение состояния не зависит от тяжести заболевания). Поэтому таблица сопряженности анализируется по особому - с учетом упорядоченности категорий. Преимущество такого подхода - единицей анализа выступает вся выборка, в то время как в случае критерия хи-квадрат - только одна ячейка таблицы. Поэтому в этой задаче учёт упорядоченности категорий обладает большей мощностью - способностью обнаружить различия там где они есть. Т.е. хи-квадрат может показать отсутствие каких-либо различий, но когда мы развернём таблицу в две выборки - сдвиг обнаружится.
В случае если сдвиг не обнаружен (а интересовало в первую очередь именно это) - можно выдвигать другие гипотезы относительно тех же данных. Например, гипотезу независимости входов таблицы (в задаче 1 Но: исход лечения не зависит от тяжести заболевания). В этом случае мы откажемся от упорядоченности категорий и будем анализировать их как номинальные с использованием критериев типа хи-квадрат. Возможна ситуация, когда первый подход ничего не обнаружит, а второй - обнаружит. Это значит сдвига нет, но есть какая-то специфика. Например, может оказаться, что по доле пациентов с улучшением и ухудшением существенных различий нет, но они есть по доле пациентов со стабилизацией. Для выявления такой специфики находятся стандартизированные остатки и смотрится какие ячейки таблицы выделяются, т.е. за счет каких ячеек значимым оказался весь тест.
Решение вашей второй задачи DrgLena дала. Далее можно разбираться с процентами, построить графики (обычно здесь используют столбчатые диаграммы), если нужно - перейти к отношениям шансов. Так, по процентам видно, что связь положительная (чем больше длительность, тем больше процент ухудшений и наоборот, чем меньше длительность, тем больше процент улучшений). Можно посворачивать таблицу объединяя разным способом ряды и колонки. Так можно разобраться в деталях: например, обнаружить, что группа "5 лет и менее" сильнее отличается от группы "более 5 лет" чем группа "10 лет и менее" от группы "более 10 лет".
Я бы вывод такой написал:
Обнаружена статистически значимая положительная связь между длительностью заболевания и исходом лечения: критерий Джонкхира-Терпстры = 2,756; р=0,006. Анализ показал, что она была обусловлена, в первую очередь, высокой долей пациентов с положительным течением заболевания в группе с длительностью заболевания 5 и менее лет. Шансы улучшения состояния пациентов в этой группе были в 4,59 раз выше (95%-ный доверительный интервал 1,52-13,87) по сравнению с пациентами с более длительным течением заболевания.
Но я не знаю специфики исследования - возможно для вас важнее обсудить момент ухудшения состояния, тогда об этом и нужно писать.
Последуйте совету DrgLena - скачайте программу StatXact, там просто разобраться. Почитайте литературу, начать можно с Ребровой (Статистический анализ медицинских данных). Я сегодня-завтра отсканирую раздел Закса по анализу упорядоченных таблиц сопряженности и отпишусь в этой теме. К сожалению, сложность данных не зависит от опыта исследователя: у студентов уже на 3-4 курсе встречаются такие данные, что приходится серьёзно думать над ними и разбираться в несколько заходов. И как правило именно у начинающих исследователей выборки небольшие, а это сильно осложняет дело.