Анализ качественных данных |
Здравствуйте, гость ( Вход | Регистрация )
Анализ качественных данных |
11.06.2012 - 07:42
Сообщение
#16
|
|
Группа: Пользователи Сообщений: 59 Регистрация: 23.12.2011 Пользователь №: 23383 |
DrgLena, спасибо большое за анализ моих данных!
Теперь должен сам такие же результаты получить - будет как себя проверить. А в какой программе это посчитано? |
|
11.06.2012 - 18:02
Сообщение
#17
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Одно и тоже можно сделать по разному. Чтобы содержательно интерпретировать результат нужно рассмотреть изменения (переходы в другие категории) для каждой исходной категории исследуемого показателя. Рассмотрите маргинальные частоты и вы увидите, какие категории прибавились и какие убавились. По этим таблицам также можете посчитать количество положительных переходов, - 14 на первом этапе и 8 негативных результатов, те, 6 улучшений. При этом вы можете оценить разность этих долей, что может рассматриваться как эффективность на этом этапе 11,1% (-5,7%-27,9%), а на втором этапе лечения (третье измерение относительно первого) доля положительных сдвигов составила 42,6% (23,0% - 62,2%).
Я привела расчет критерия М-Н для таблиц более 2х2, где фактически анализируется каждая категория, а также рекомендованные вам nokh тесты на симметрию. Это dos -овская программа, на входе которой задается таблица сопряженности nхn, которую вы получаете в любой программе, строки таблицы для сравнения частот по вашим данным для первого этапа 2000, 0331,36147,6252 |
|
18.07.2012 - 16:10
Сообщение
#18
|
|||||
Группа: Пользователи Сообщений: 20 Регистрация: 18.07.2012 Пользователь №: 23969 |
Доброго времени суток! Объясните пожалуйста, как правильно трактовать результаты обсчета качественных номинальных переменных? Прицельно интересует 2-Way Summary Table: Expected Frequencies (ожидаемые частоты??), 2-Way Summary Table: Observed minus Expected Frequencies (минусовые ожидаемые частоты???) и и уровень вероятности хи-квадрат пирсона и МЛ-хи-квадрат относятся к выделенным красным параметрам???
|
||||
|
19.07.2012 - 16:28
Сообщение
#19
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Доброго времени суток! Объясните пожалуйста, как правильно трактовать результаты обсчета качественных номинальных переменных? Прицельно интересует 2-Way Summary Table: Expected Frequencies (ожидаемые частоты??), 2-Way Summary Table: Observed minus Expected Frequencies (минусовые ожидаемые частоты???) и и уровень вероятности хи-квадрат пирсона и МЛ-хи-квадрат относятся к выделенным красным параметрам??? 1. С первой таблицей всё ясно: пакет считает относительные частоты в %. А поскольку он не знает что вас интересует, то считает все 3 возможных типа %: по строкам, по столбцам, ну и от общего числа наблюдений в таблице. 2. Во второй таблице - ожидаемые частоты, вычисленные в предположении отсутствия взаимодействия входов таблицы частот. Выделенные красным значения более 10 - исключительно эстетические пристрастия разработчиков пакета, т.к. ни число 10, ни красный цвет никому кроме них ни о чём не говорят. 3. Разность наблюдаемой и ожидаемой частоты называется остатком (residual). Число 10 ни о чём не говорит. Да и сама величина остатка особо ни о чём не говорит. Для интерпретации различий между наблюдаемыми и ожидаемыми частотами нужны не простые, а стандартизованные остатки. Ну или отклонения Фримана-Тьюки. Эти показатели помогают оценить значимость вклада каждой ячейки таблицы в итоговое значение статистики хи-квадрат. Эти показатели Statistica считает, правда в другом модуле (логлинейный анализ) и без оценки статистической значимости вклада ячейки - это за пакетом необходимо самостоятельно досчитывать вручную. 4. В последней таблице - несколько критериев и коэффициентов ассоциации, используемых при анализе таблиц частот r x c. Под пирсоновским хи-квадратом - хи-квадрат максимального правдоподобия (M-L это maximum likelihood), который рекомендуется применять вместо пирсоновского критерия (синонимы: отношение правдоподобия, кримтерий максимального лог-правдоподобия, информационный критерий Кульбака, G-критерий Вульфа, критерий G-квадрат). Чтобы разбираться с пакетом необходимо использовать не свои данные, а данные из того учебника, где этот раздел хорошо написан и всё разжёвано. Лучше даже на таблице 2 x 2. Также необходимо читать книги по пакету и раздел помощи в самом пакете. Для пакета Statistica и то и другое есть в хороших объёмах. |
|
20.07.2012 - 04:54
Сообщение
#20
|
|
Группа: Пользователи Сообщений: 20 Регистрация: 18.07.2012 Пользователь №: 23969 |
...хорошо, тогда, о чем говорит уровень p<0,05 в четвертом скрине? Какую гипотезу он считает достоверной и по отношению к чему?
|
|
20.07.2012 - 09:24
Сообщение
#21
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Просто отвергается нулевая гипотеза об отсутствии сопряженности между категориями двух переменных и принимается альтернативная...
|
|
22.07.2012 - 18:12
Сообщение
#22
|
|
Группа: Пользователи Сообщений: 20 Регистрация: 18.07.2012 Пользователь №: 23969 |
а можно это предложение применить к вложениям и как это будет правильно написано?
|
|
23.07.2012 - 10:19
Сообщение
#23
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
а можно это предложение применить к вложениям и как это будет правильно написано? Чтобы правильно написать, нужно владеть терминологией ?минусовые ожидаемые частоты? и ?уровень вероятности хи-квадрат? - это нельзя вылечить на форуме. Nokh дал вам профессиональную консультацию, к этому могу добавить, возьмите простую книжку для докторов, написанную доктором. Медико-биологическая статистика. Стентон Гланц и прочитайте про таблицы сопряженности. Альтернативная гипотеза ? сопряженность между двумя переменными есть. Но ведь вам этого вывода явно не достаточно. Вы должны сформулировать и доказать определенную клиническую, а не статистическую гипотезу. Что для вас важно, формулируйте сами. Например, вам можно сделать такой вывод, при определенном уровне одной переменной чаще наблюдаются определенные значения другой переменной. При Наследственность=3 var1=2 наблюдаются чаще, чем var=1 или var=3. Разница долей 71,4% (95% ДИ 42,6% - 84,6% Chi-square = 18,7 DF = 1) А возможно и наоборот, вас интересует какая наследственность чаще при определенных значениях var1. |
|
23.07.2012 - 17:43
Сообщение
#24
|
|
Группа: Пользователи Сообщений: 20 Регистрация: 18.07.2012 Пользователь №: 23969 |
Елена, я это и хотел узнать. Просто в моем случае значения меньше 5 проще отвергнуть, чем проводить дополнительный анализ применяя критерий фишера. nokh написал очень подробно и ему за это отдельное спасибо, но я как раз-таки ищу простой и понятный язык...
|
|
24.07.2012 - 10:22
Сообщение
#25
|
|
Группа: Пользователи Сообщений: 377 Регистрация: 18.08.2008 Из: Москва Златоглавая Пользователь №: 5224 |
Просто в моем случае значения меньше 5 проще отвергнуть, чем проводить дополнительный анализ применяя критерий фишера Выбрасывая параметры с ожидаемым числом<5, вы теряете информацию. Точный критерий Фишера анализа таблиц сопряженности есть во многих стат.пакетах (и на моем сайте тоже). Забудьте про критерий хи-квадрат, когда в таблице есть ячейки с малым значением!Просто включи мозги => http://doctorstat.narod.ru
|
|