Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Анализ качественных данных
katu
сообщение 13.04.2013 - 13:28
Сообщение #1





Группа: Пользователи
Сообщений: 1
Регистрация: 13.04.2013
Пользователь №: 24815



Здравствуйте, уважаемые аспиранты!подскажите какой статистический критерий использовать для анализа качественных данных. в работе смотрели данные ФГДС разных пациентов, получилось 3 группы пациентов. пациенты с сахарным диабетом, с СС заболеваниями и без такой патологии(24,23 и 13 человек). для анализа качественных данных было решено наличие признака отметить 1(например 1-антральный гастрит, 0- его нет), потом следующий признак(0-нет, 1- катральный эзофагит, 2-эрозивный) и так далее. таким образом данные выглядят следующим образом: антральный гастрит: 1группа:00011101...всего 24; 2 группа: 00000111...всего23; 3 группа: 001100... всего 13 человек. вопрос в том каким критерием лучше посчитать достоверно ли отличие по наличию признака между группами.
буду признательна за помощь, поскольку статью уже нужно сдавать, а мне все никак не разобраться с этим моментом.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
100$
сообщение 13.04.2013 - 18:53
Сообщение #2





Группа: Пользователи
Сообщений: 902
Регистрация: 23.08.2010
Пользователь №: 22694



Цитата(katu @ 13.04.2013 - 13:28) *
Здравствуйте, уважаемые аспиранты!подскажите какой статистический критерий использовать для анализа качественных данных. в работе смотрели данные ФГДС разных пациентов, получилось 3 группы пациентов. пациенты с сахарным диабетом, с СС заболеваниями и без такой патологии(24,23 и 13 человек). для анализа качественных данных было решено наличие признака отметить 1(например 1-антральный гастрит, 0- его нет), потом следующий признак(0-нет, 1- катральный эзофагит, 2-эрозивный) и так далее. таким образом данные выглядят следующим образом: антральный гастрит: 1группа:00011101...всего 24; 2 группа: 00000111...всего23; 3 группа: 001100... всего 13 человек. вопрос в том каким критерием лучше посчитать достоверно ли отличие по наличию признака между группами.
буду признательна за помощь, поскольку статью уже нужно сдавать, а мне все никак не разобраться с этим моментом.


Поскольку в повседневной жизни номинальные даные используются лишь для различения объектов, и никакая вероятностно-статистическая модель при этом не используется, то и статистических методов на эту тему нет. Но для каждой выборки можно определить долю пациентов, обладающих интересующей вас патологией, и далее проверять гипотезы о доле, как учили.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
anserovtv
сообщение 4.06.2013 - 08:42
Сообщение #3





Группа: Пользователи
Сообщений: 219
Регистрация: 4.06.2013
Из: Тверь
Пользователь №: 24927



Цитата(katu @ 13.04.2013 - 14:28) *
Здравствуйте, уважаемые аспиранты!подскажите какой статистический критерий использовать для анализа качественных данных. в работе смотрели данные ФГДС разных пациентов, получилось 3 группы пациентов. пациенты с сахарным диабетом, с СС заболеваниями и без такой патологии(24,23 и 13 человек). для анализа качественных данных было решено наличие признака отметить 1(например 1-антральный гастрит, 0- его нет), потом следующий признак(0-нет, 1- катральный эзофагит, 2-эрозивный) и так далее. таким образом данные выглядят следующим образом: антральный гастрит: 1группа:00011101...всего 24; 2 группа: 00000111...всего23; 3 группа: 001100... всего 13 человек. вопрос в том каким критерием лучше посчитать достоверно ли отличие по наличию признака между группами.
буду признательна за помощь, поскольку статью уже нужно сдавать, а мне все никак не разобраться с этим моментом.

Для этого нужно использовать критерий хи-квадрат для таблиц сопряженности /сравнение распределений/ , одна из переменных - группирующая.При этом будут генерированы и диаграммы.
Я делал похожие исследования о влиянии психологической подготовки будущих матерей на их здоровье и здоровье их детей /по категориям. Получилось, что из 7 показателей различия по 3 статистически значимы.
Анатолий к.ф.-м.н. г.Тверь
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
rabika
сообщение 11.07.2013 - 09:16
Сообщение #4





Группа: Пользователи
Сообщений: 3
Регистрация: 11.07.2013
Пользователь №: 24985



Точный критерий Фишера используется только для таблицы 2 х 2 (независимый фактор имеет 2 значения) или также для 2 х n (независимый фактор имеет n значений)

Точный критерий Фишера используется только для таблицы 2 х 2 (независимый фактор имеет 2 значения) или также для 2 х n (независимый фактор имеет n значений)

Точный критерий Фишера используется только для таблицы 2 х 2 (независимый фактор имеет 2 значения) или также для 2 х n (независимый фактор имеет n значений)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 11.07.2013 - 14:37
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(rabika @ 11.07.2013 - 12:16) *
Точный критерий Фишера используется только для таблицы 2 х 2 (независимый фактор имеет 2 значения) или также для 2 х n (независимый фактор имеет n значений)

Точный критерий Фишера используется только для таблицы 2 х 2 (независимый фактор имеет 2 значения) или также для 2 х n (независимый фактор имеет n значений)

Точный критерий Фишера используется только для таблицы 2 х 2 (независимый фактор имеет 2 значения) или также для 2 х n (независимый фактор имеет n значений)

Анализ таблиц сопряжённости проводится одинаково при расположении категорий независимого входа как в строках, так и в колонках, а также и в строках, и в колонках одновременно (задача поиска ассоциаций). Поэтому какой фактор сколько имеет значений - неважно.

Собственно точным критерием (методом) Фишера называется метод для анализа таблиц сопряжённости 2х2. Хотя этот принцип можно распространить и на более крупные таблицы. Есть даже онлайновые калькуляторы: http://www.quantitativeskills.com/sisa/sta...ics/fiveby2.htm

Если у вас слабонасыщенная таблица, то лучше вообще не использовать ТМФ, т.к. он давно морально устарел и использовался за неимением лучшего пока не было компьютеров. Критерий предполагает, что данные в таблицу сопряжённости (ТС) поступают из гипергеометрического распредления, а не из биномиального/полиномиального. На практике сложно представить эксперимент, для которого мы фиксируем маргинальные частоты и по строкам, и по колонкам; в основе данных подавляющего большинства ТС - именно биномиальное/полиномиальное распределение. Т.е. применяя к своим данным ТМФ мы вообще неверно выбираем математическую модель, что теоретически очень плохо, хотя для практических выводов какими-то авторами и считается допустимым. Теоретически правильное решение - использовать точный перестановочный критерий, основанный именно на биномиальном или полиномиальном распределении, как exact permutation test в пакете StatXact.

PS. Если вам удобнее писать/читать всё по три раза, то просто скопируйте мой ответ и вставьте в любой текстовый редактор 3 раза подряд.

Сообщение отредактировал nokh - 11.07.2013 - 14:52
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему