Цитата(nokh @ 14.02.2010 - 23:11)

1. По расчёту ожидаемых. Действительно, оба критерия нуждаются в предварительном расчёте ожидаемых - для дальнейших расчётов самих критериев. Но любое действие должно иметь цель. Какую цель Вы преследуете рассчитывая ожидаемые, причём даже более сложным путём, чем это можно сделать с калькулятором и листочком бумаги? Зачем вам эти цифры в Excel? Как используете затем эти данные? Если никак - то и не нужно их считать, доверьтесь программе. К слову, если таблица частот не двумерная как у Вас, а трёх- или более мерная (например, одновременно: время начала бужирования, пол пациента и оценка успешности исхода лечения), то расчёт ожидаемых частот по итерационному алгоритму Деминга-Стефана займёт у вас несколько часов (баловался как-то), а с проверкой - все несколько дней.
. Я тоже, если честно побаловался- имею ввиду расчеты в Эксель (собственно я писал, что именно в Эксель начинал считать результаты), так получилось что первыми книгами по статистике были именно Реброва и уже упоминавшийся мною Зайцев, которые я приобрел еще в институте. В данном случае интерес к Excel был продиктован еще и разными ( по крайней мере так мне показалось) алгоритмами расчета в этом пакете которые изложены у Зайцева и в книге С.Н. Лапача "Статистические методы в медико-биологических исследованиях с использованием Excel" Киев, "Морион"- 2001г. Правда некоторые формулы, приведенные в последней книге и результаты указанные на рисунках разнятся с теми данными, которые приводят сами авторы и которые получаются если считать по Зайцеву. Поэтому и любопытство тоже. Кстати в отличие от Зайцева в Лапаче при расчете табличного значения хи-квадрат в формулу вводится значение р=0,05. Поэтому у меня и возник этот вопрос насчет Аттестата и др. программ.
Цитата
2. По ограничениям методов. Никаких ошибок Вы ещё не сделали. Меньше 4, меньше 5, 20% и т.д. - это всё вата. Это - простые решения для тех, кому нужно неглубоко и быстро. Я знаю ещё 2-3 рекомендации и что со всем этим делать? Диагностики, присутствующие в AtteStat позволяют обоснованно принять решение о (не)допустимости аппроксимации решения статистикой хи-квадрат. Если допустима - считаем, не обращая внимания на меньше 4, на ноли и т.д. в любом пакете или вручную. Если недопустима - считаем точными перестановочными (permutation) методами в пакете StatXact (или в SAS, считающем это по лицензии Cytel StatXact. Другие пакеты мне неизвестны, в R это кажется можно посчитать только для таблиц 2х2). Значение критерия получится одинаковым в любом случае, а вот значение Р будет разным: с использованием аппроксимации - менее точным. Точный расчёт P - наиболее правильное и точное решение для любой таблицы сопряжённости и здесь нет проблемы минимального ожидаемого, т.к. не используется аппроксимация. Укажете в материалах и методах (статьи, диссертации) что использовали в расчётах StatXact и этого достаточно, кто в теме - поймут. С диссертационным советом сложнее - все могут быть не в теме и начать придираться к нулям - вы должны быть готовы аргументированно ответить. Объединение ячеек - выход, для тех, у кого нет StatXact, но во-первых такой подход предполагает огрубление исходных данных, что не есть хорошо, а во-вторых, StatXact у вас ведь уже есть.
Вы правы насчет диссертационного совета и людей, которые не в теме к сожалению много. С этим я столкнулся, когда сдавал аннотацию и проходил этический комитет. К сожалению количество специалистов в такого рода комитетах много меньше, чем должностных лиц и представителей духовенства, которые в силу специфики своей повседневной деятельности не могут оценить перспективности проводимого исследования для дальнейшего развития медицины. Что касается вымарывания нулей, которое я не раз встречал, анализируя диссертационные работы как кандидатов, так и докторов наук. Тут, наверное, как правильно заметил Игорь, проблема в том, что не каждый готов разбираться со статистическими методами и зачастую предпочитают воспользоваться услугами специалиста и получить уже готовые результаты, отсюда и желание идти по пути наименьшего сопротивления, не оспаривая точку зрения дисс. советов, потому что нет возможности аргументированно доказать правильность полученных результатов. Кроме того, тут еще и какие-то требования ВАКа, наверняка, к представлению результатов исследования.
Огрубление данных,- здесь я тоже с Вами согласен, нивелирует многие факторы, которые влияют на результаты лечения.
Цитата
3. По оценке P. Поскольку в литературе есть неразбериха (смешиваются и переплетаются P-value в понимании Фишера и уровень значимости "альфа" в понимании Пирсона и Неймана) то придётся ответить, но почитайте и Закса и Реброву (стр. 64) по принципам проверки гипотез. P - непрямая мера оценки вероятности нулевой гипотезы и представляет собой вероятность наблюдать имеющиеся или ещё более экстремальные данные при условии справедливости нулевой гипотезы. Т.к. в статистическом оценивании всегда проверяется нулевая гипотеза (нет различий, нет связей, нет зависимостей), то часто наша гипотеза доказывается методом от противного. Скажем мы хотим доказать, что существует связь между временем начала бужирования и оценкой результата. Мы выдвигаем нулевую гипотезу - такой связи нет - и проверяем её с помощью к/л статистического критерия с получением оценки Р. Если Р будет мало, скажем меньше 5% (P<0,05) мы говорим: "вероятность нулевой гипотезы ("связи нет") мала, поэтому мы её отклоним и примем альтернативную: "связь есть"". Типичное доказательство от противного. Т.е. в современном научном подходе мы не можем подтвердить свою гипотезу, мы можем только отклонить нулевую. Пока мы её не отклонили - она остаётся в силе; в этом - одна из причин консерватизма научного метода. 5% - не волшебное число, просто люди договорились считать малым то, что меньше или равно 5%. Такое граничное значение называется уровнем значимости. Иногда 5%-ный уровень значимости слишком строг, иногда слишком либерален. Если P<0,0000001, то такая нулевая гипотеза ещё менее правдоподобна, соответственно более правдоподобна альтернативная. Следовательно P=0.05 нигде не задаётся, ни в одном пакете или тесте; число 0,05 может понадобиться вам только для планирования объёмов выборок: понятно, что если вы хотите доказать наличие связи на 1%-ном уровне значимости понадобится больше наблюдений, чем для 5%-ного у.з.
Спасибо за ценные замечания. Теперь все более понятно. Реброву и Закса почитаю еще раз. Проблема с оценкой значений р была связана с тем, что для закрепления той информации, которая приводится в литературе я решал примеры и сравнивал свои результаты с тем,что дают авторы. Возможно я не так понял из условий задач, что они принимают за нулевую гипотезу- отсюда неправильная трактовка результатов (пересмотрю еще раз).
Цитата
4. Проверка на тренд. А как Вы закодировали веса для данных? Разве так как собирались (1-неуд, 4-отл.)? Вы их закодировали наоборот, т.е. чем больше балл, тем хуже оценка. Чтобы не путаться - перекодируйте их в привычную для интерпретации шкалу и проинтерпретируйте. Попробуйте опираясь на проведённые тесты самостоятельно сформулировать предварительные выводы - так как они будут звучать в публикации (диссертации) или можно более подробно. Потом подправим. Я имею в виду только первую таблицу, вторую потом проанализируете самостоятельно.
Хорошо, учту Ваши замечания перекодирую данные (действительно закодировал так как предлагает программа, а не так как Вы мне до этого посоветовали) и сформулирую выводы и еще, наверное, надо как-то представить полученные данные, чтобы не было вопросов на дисс.совете.
Спасибо!