Анализ качественных данных - Форум врачей-аспирантов

Анализ качественных данных

Alex_Z Просмотр профиля	11.06.2012 - 07:42 Сообщение #16
Группа: Пользователи Сообщений: 59 Регистрация: 23.12.2011 Пользователь №: 23383	DrgLena, спасибо большое за анализ моих данных! Теперь должен сам такие же результаты получить - будет как себя проверить. А в какой программе это посчитано?

DrgLena Просмотр профиля	11.06.2012 - 18:02 Сообщение #17
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Одно и тоже можно сделать по разному. Чтобы содержательно интерпретировать результат нужно рассмотреть изменения (переходы в другие категории) для каждой исходной категории исследуемого показателя. Рассмотрите маргинальные частоты и вы увидите, какие категории прибавились и какие убавились. По этим таблицам также можете посчитать количество положительных переходов, - 14 на первом этапе и 8 негативных результатов, те, 6 улучшений. При этом вы можете оценить разность этих долей, что может рассматриваться как эффективность на этом этапе 11,1% (-5,7%-27,9%), а на втором этапе лечения (третье измерение относительно первого) доля положительных сдвигов составила 42,6% (23,0% - 62,2%). Я привела расчет критерия М-Н для таблиц более 2х2, где фактически анализируется каждая категория, а также рекомендованные вам nokh тесты на симметрию. Это dos -овская программа, на входе которой задается таблица сопряженности nхn, которую вы получаете в любой программе, строки таблицы для сравнения частот по вашим данным для первого этапа 2000, 0331,36147,6252

becas84

18.07.2012 - 16:10

Сообщение #18

Группа: Пользователи
Сообщений: 20
Регистрация: 18.07.2012
Пользователь №: 23969

Доброго времени суток! Объясните пожалуйста, как правильно трактовать результаты обсчета качественных номинальных переменных? Прицельно интересует 2-Way Summary Table: Expected Frequencies (ожидаемые частоты??), 2-Way Summary Table: Observed minus Expected Frequencies (минусовые ожидаемые частоты???) и и уровень вероятности хи-квадрат пирсона и МЛ-хи-квадрат относятся к выделенным красным параметрам???

Ответить с цитированием данного сообщения

nokh Просмотр профиля	19.07.2012 - 16:28 Сообщение #19
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704	Цитата(becas84 @ 18.07.2012 - 19:10) Доброго времени суток! Объясните пожалуйста, как правильно трактовать результаты обсчета качественных номинальных переменных? Прицельно интересует 2-Way Summary Table: Expected Frequencies (ожидаемые частоты??), 2-Way Summary Table: Observed minus Expected Frequencies (минусовые ожидаемые частоты???) и и уровень вероятности хи-квадрат пирсона и МЛ-хи-квадрат относятся к выделенным красным параметрам??? 1. С первой таблицей всё ясно: пакет считает относительные частоты в %. А поскольку он не знает что вас интересует, то считает все 3 возможных типа %: по строкам, по столбцам, ну и от общего числа наблюдений в таблице. 2. Во второй таблице - ожидаемые частоты, вычисленные в предположении отсутствия взаимодействия входов таблицы частот. Выделенные красным значения более 10 - исключительно эстетические пристрастия разработчиков пакета, т.к. ни число 10, ни красный цвет никому кроме них ни о чём не говорят. 3. Разность наблюдаемой и ожидаемой частоты называется остатком (residual). Число 10 ни о чём не говорит. Да и сама величина остатка особо ни о чём не говорит. Для интерпретации различий между наблюдаемыми и ожидаемыми частотами нужны не простые, а стандартизованные остатки. Ну или отклонения Фримана-Тьюки. Эти показатели помогают оценить значимость вклада каждой ячейки таблицы в итоговое значение статистики хи-квадрат. Эти показатели Statistica считает, правда в другом модуле (логлинейный анализ) и без оценки статистической значимости вклада ячейки - это за пакетом необходимо самостоятельно досчитывать вручную. 4. В последней таблице - несколько критериев и коэффициентов ассоциации, используемых при анализе таблиц частот r x c. Под пирсоновским хи-квадратом - хи-квадрат максимального правдоподобия (M-L это maximum likelihood), который рекомендуется применять вместо пирсоновского критерия (синонимы: отношение правдоподобия, кримтерий максимального лог-правдоподобия, информационный критерий Кульбака, G-критерий Вульфа, критерий G-квадрат). Чтобы разбираться с пакетом необходимо использовать не свои данные, а данные из того учебника, где этот раздел хорошо написан и всё разжёвано. Лучше даже на таблице 2 x 2. Также необходимо читать книги по пакету и раздел помощи в самом пакете. Для пакета Statistica и то и другое есть в хороших объёмах.

becas84 Просмотр профиля	20.07.2012 - 04:54 Сообщение #20
Группа: Пользователи Сообщений: 20 Регистрация: 18.07.2012 Пользователь №: 23969	...хорошо, тогда, о чем говорит уровень p<0,05 в четвертом скрине? Какую гипотезу он считает достоверной и по отношению к чему?

DrgLena Просмотр профиля	20.07.2012 - 09:24 Сообщение #21
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Просто отвергается нулевая гипотеза об отсутствии сопряженности между категориями двух переменных и принимается альтернативная...

becas84 Просмотр профиля	22.07.2012 - 18:12 Сообщение #22
Группа: Пользователи Сообщений: 20 Регистрация: 18.07.2012 Пользователь №: 23969	а можно это предложение применить к вложениям и как это будет правильно написано?

DrgLena Просмотр профиля	23.07.2012 - 10:19 Сообщение #23
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573	Цитата(becas84 @ 22.07.2012 - 18:12) а можно это предложение применить к вложениям и как это будет правильно написано? Чтобы правильно написать, нужно владеть терминологией ?минусовые ожидаемые частоты? и ?уровень вероятности хи-квадрат? - это нельзя вылечить на форуме. Nokh дал вам профессиональную консультацию, к этому могу добавить, возьмите простую книжку для докторов, написанную доктором. Медико-биологическая статистика. Стентон Гланц и прочитайте про таблицы сопряженности. Альтернативная гипотеза ? сопряженность между двумя переменными есть. Но ведь вам этого вывода явно не достаточно. Вы должны сформулировать и доказать определенную клиническую, а не статистическую гипотезу. Что для вас важно, формулируйте сами. Например, вам можно сделать такой вывод, при определенном уровне одной переменной чаще наблюдаются определенные значения другой переменной. При Наследственность=3 var1=2 наблюдаются чаще, чем var=1 или var=3. Разница долей 71,4% (95% ДИ 42,6% - 84,6% Chi-square = 18,7 DF = 1) А возможно и наоборот, вас интересует какая наследственность чаще при определенных значениях var1.

becas84 Просмотр профиля	23.07.2012 - 17:43 Сообщение #24
Группа: Пользователи Сообщений: 20 Регистрация: 18.07.2012 Пользователь №: 23969	Елена, я это и хотел узнать. Просто в моем случае значения меньше 5 проще отвергнуть, чем проводить дополнительный анализ применяя критерий фишера. nokh написал очень подробно и ему за это отдельное спасибо, но я как раз-таки ищу простой и понятный язык...

DoctorStat Просмотр профиля	24.07.2012 - 10:22 Сообщение #25
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224	Цитата(becas84 @ 23.07.2012 - 18:43) Просто в моем случае значения меньше 5 проще отвергнуть, чем проводить дополнительный анализ применяя критерий фишера Выбрасывая параметры с ожидаемым числом<5, вы теряете информацию. Точный критерий Фишера анализа таблиц сопряженности есть во многих стат.пакетах (и на моем сайте тоже). Забудьте про критерий хи-квадрат, когда в таблице есть ячейки с малым значением! Просто включи мозги => http://doctorstat.narod.ru

« Предыдущая тема · Медицинская статистика · Следующая тема »