Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Дисперсионный анализ групп разного объема, Количественные и бинарные признаки
exroman
сообщение 4.04.2010 - 21:12
Сообщение #1





Группа: Пользователи
Сообщений: 15
Регистрация: 12.03.2010
Пользователь №: 13264



Прошу прощения, если надоел со своими воросами, но уж очень нужна помощь, т.к. своего ума не хватает, а работу хочеться сделать грамотно.
У меня 3 вопроса, все также про сравнение групп.
1) Есть 4 группы, не связанных, разного объема (от 24 до 9 человек в группе), данные - бинарные. Подсажите, как правильно выявить наличие или отсутсвтие различия по исследуемому признаку во сех 4 группах сразу, а также кокой метод использовать для по парного сравнения.
2) Есть 4 группы, не связанных, разного объема (от 24 до 9 человек в группе) данные - количественные. Подсажите, какаким методом оценить нормальность распределения в группах и какой метод дисперсионного анализа использовать для выявления различия во всех 4 группах сразу, т.к. разнообразие методов велико, а ведь еще необходимо обосновать применение того или иного метода.
3) Есть опять теже 4 группы, не связанных, разного объема (от 24 до 9 человек в группе), у которых проводится тимпанометрия с выявлением типа кривых (всего 4 типа). Подсажите, как правильно проанализировать данные, т.е. как определить или предположить, что тот или иной тип кривой характерен для той или иной группы.
Заранее благодарен за помощь!

Сообщение отредактировал exroman - 4.04.2010 - 21:39
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
nokh
сообщение 5.04.2010 - 13:23
Сообщение #2





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(exroman @ 5.04.2010 - 00:12) *
1) Есть 4 группы, не связанных, разного объема (от 24 до 9 человек в группе), данные - бинарные. Подсажите, как правильно выявить наличие или отсутсвтие различия по исследуемому признаку во сех 4 группах сразу, а также кокой метод использовать для по парного сравнения.

Постройте таблицу сопряжённости 4х2 (входы: Группы и Градации бинарного признака). Если в таблице есть ячейки с частотами менее 5 - проанализируйте её предварительно с помощью диагностик Симонова - Цай и/или Хабермана на возможность использования стандартных критериев хи-квадрат и отношения правдоподобия (есть в программе AtteStat: http://attestatsoft.narod.ru/). Если диагностики покажут возможность использования аппроксимации хи-квадрат - переходите к тесту, лучше использовать отношение правдоподобия (критерий G2 по Агрести). Если такая аппроксимация невозможна - нужно использовать точный перестановочный метод в специализированном ПО StatXact (доступна 30-тидневная демо-версия). В этом случае значение G-критерия не изменится, но будет точная оценка P. Если тест покажет существование значимых отличий - можно покопаться в попарных сравнениях, проведя такой же анализ, но в соответствующих таблицах сопряжённости 2х2. Приводить нужно значение G-критерия, число степеней свободы и значение P. Если одна из 4х групп - контроль полезно также по таким четырёхклеточным таблицам рассчитать изменения отношения шансов по сравнению с контролем и 95%-ные доверительные интервалы для них.
Цитата(exroman @ 5.04.2010 - 00:12) *
2) Есть 4 группы, не связанных, разного объема (от 24 до 9 человек в группе) данные - количественные. Подсажите, какаким методом оценить нормальность распределения в группах и какой метод дисперсионного анализа использовать для выявления различия во всех 4 группах сразу, т.к. разнообразие методов велико, а ведь еще необходимо обосновать применение того или иного метода.

Сначала проведите однофакторный дисперсионный анализ (One-way ANOVA) и в его результатах посмотрите распределение остатков. Оно должно быть нормальным. Также с помощью доступных в ПО методов необходимо оценить однородность дисперсий в группах. Если эти 2 условия выполнены - приводите значение F-критерия, степени свободы и P. Попарные сравнения нужно делать внутри дисперсионного комплекса доступными в ПО методами (лучше запланированные сравнения чем post-hoc). Если распределение остатков отличалось от нормального есть 2 пути: преобразовать данные перед анализом адекватным способом (см. про преобразования данных на этом форуме) и применить дисперсионный анализ или использовать непараметрический аналог однофакторного дисперсионного анализа - критерий Краскела-Уоллиса (Kruskal-Wallis test). В последнем случае попарные сравнения можно провести с помощью критерия Манна-Уитни.
Цитата(exroman @ 5.04.2010 - 00:12) *
3) Есть опять теже 4 группы, не связанных, разного объема (от 24 до 9 человек в группе), у которых проводится тимпанометрия с выявлением типа кривых (всего 4 типа). Подсажите, как правильно проанализировать данные, т.е. как определить или предположить, что тот или иной тип кривой характерен для той или иной группы.

По типам кривых не знаю что это такое. Если имеются в виду регрессионные зависимости - используйте нелинейный регрессионный анализ. Информационный критерий Акаике (AIC) поможет выбрать наиболее подходящую функцию из 4х.
В общих чертах - так.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
exroman
сообщение 5.04.2010 - 16:04
Сообщение #3





Группа: Пользователи
Сообщений: 15
Регистрация: 12.03.2010
Пользователь №: 13264



Большое спасибо за ответ, nokh!!!
Я конечно не все понял, но ход мысли понятен, буду пополнять свои знания по статистике, теперь хоть понятно, что копать.

Цитата(nokh @ 5.04.2010 - 14:23) *
Сначала проведите однофакторный дисперсионный анализ (One-way ANOVA) и в его результатах посмотрите распределение остатков. Оно должно быть нормальным. Также с помощью доступных в ПО методов необходимо оценить однородность дисперсий в группах. Если эти 2 условия выполнены - приводите значение F-критерия, степени свободы и P. Попарные сравнения нужно делать внутри дисперсионного комплекса доступными в ПО методами (лучше запланированные сравнения чем post-hoc).
Я использую для статистического анализа AtteStat, каким именно методом правильней посмотреть распределение остатков и однороднсть дисперсий. Последнее из подчеркнутого, к сожалению, совсем не понятно. Что значит попарные сравнения внутри дисперсионного комплекса и что значит запланированные сравнения?

Цитата(nokh @ 5.04.2010 - 14:23) *
По типам кривых не знаю что это такое. Если имеются в виду регрессионные зависимости - используйте нелинейный регрессионный анализ. Информационный критерий Акаике (AIC) поможет выбрать наиболее подходящую функцию из 4х.
Кривые, это просто кривые, которые получаются в хоте диагностики. В соответствии от состояния получаются разного рода кривые, которые обозначают A, B, Ac, Ad, т.е. я имею ввиду, что получаются данные, которые являются ни количественныеми, ни бинарными, которые, думаю, нужно преобразовать и проанлизировать. Но я не знаю как правильно это сделать. weep.gif

Сообщение отредактировал exroman - 5.04.2010 - 16:06
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 6.04.2010 - 18:09
Сообщение #4





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(exroman @ 5.04.2010 - 19:04) *
Я использую для статистического анализа AtteStat, каким именно методом правильней посмотреть распределение остатков и однороднсть дисперсий. Последнее из подчеркнутого, к сожалению, совсем не понятно. Что значит попарные сравнения внутри дисперсионного комплекса и что значит запланированные сравнения?

Скачайте книгу Л.Закса: http://www.onlinedisk.ru/file/205482/ Почитайте там про дисперсионный анализ и его требования к данным, про множественные сравнения - вполне доступно всё описано. Если Вы сравниваете, скажем, контрольную группу с разными вариантами эксперимента, то далеко не всегда интересны все попарные сравнения. Поэтому можно выбрать только интересующие и образовать так называемые контрасты, которые и проверить одновременно. В этом случае увеличивается мощность статистического анализа (см. у Закса про мощность стат. критериев). Но если ортогональных контрастов не получается или интересуют все возможные попарные сравнения - используют незапланированные (так называемые post-hoc) сравнения. Часто исследователи не парятся и сразу делают post-hoc. Но их вариантов много - все со своими плюсами и минусами. В любом случае такие методы будут учитывать информацию об изменчивости признака во всём дисперсионном комплексе, поэтому я и писал о сравнениях "внутри" комплекса. За счёт этого также достигается выигрыш в мощности, т.е. возможна ситуация когда вы сравниваете две группы t-критерием Стьюдента и они значимо не отличаются, а когда их же в рамках (внутри) дисперсионного комплекса в котором присутствуют и другие группы - они будут значимо отличаться.
Универсальных пакетов нет, поэтому привыкайте использовать в анализе их комбинации. Для проведения дисперсионного анализа лучше воспользоваться пакетами, где трудозатраты будут сведены к минимуму. В вашем случае хорошо дополнит AtteStat также бесплатная программа PAST: http://folk.uio.no/ohammer/past/download.html . Скопируйте из Excel область данных и вставьте в PAST. Выделите её и далее: Statistics - One-Way ANOVA. Получите и стандартную таблицу дисперсионного анализа, и проверку выборок на однородность дисперсий по Ливену, и множественные сравнения методом Tukey's HSD, и проверку остатков (Residuals) на нормальность методом Шапиро-Уилка. Пока читайте, делайте анализ, предварительные результаты сохраняйте. Потом опишите что получается. Если потребуется преобразование данных - вернёмся к AtteStat и сделаем преобразование Бокса-Кокса.
Цитата(exroman @ 5.04.2010 - 19:04) *
Кривые, это просто кривые, которые получаются в хоте диагностики. В соответствии от состояния получаются разного рода кривые, которые обозначают A, B, Ac, Ad, т.е. я имею ввиду, что получаются данные, которые являются ни количественныеми, ни бинарными, которые, думаю, нужно преобразовать и проанлизировать. Но я не знаю как правильно это сделать. weep.gif

Немного погуглил, посмотрел файлы от Pyrosmani. Насколько понял тип этих кривых классифицируется "на глаз". Тогда эти данные нужно будет обрабатывать как качественные признаки - посчитать сколько какого типа кривых в ваших группах и свести всё в таблицу сопряжённости. Также видел, что помимо общего вида тимпанограммы она характеризуется также пиковым давлением при максимальной податливости и общим эквивалентным объёмом. Эти показатели, вероятно, также нужно оцифровать и сравнивать дисперсионным анализом. Думаю что-нибудь интересное могло бы проявиться при многомерном анализе Ваших данных, когда все признаки анализировались бы одновременно, но пока это будет, пожалуй, слишком мудрено.

Сообщение отредактировал nokh - 6.04.2010 - 18:13
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
exroman
сообщение 6.04.2010 - 20:57
Сообщение #5





Группа: Пользователи
Сообщений: 15
Регистрация: 12.03.2010
Пользователь №: 13264



И снова огромное спасибо, nokh, за разъяснения и помощь!!! smile.gif
Цитата(nokh @ 6.04.2010 - 19:09) *
Насколько понял тип этих кривых классифицируется "на глаз". Тогда эти данные нужно будет обрабатывать как качественные признаки - посчитать сколько какого типа кривых в ваших группах и свести всё в таблицу сопряжённости.
Совершенно верно поняли, классификация кривых происходит "на глаз", остальных параметров нет.
На сколько я понял, я должен создать таблицы r x с, куда вбиваю абсолютные частоты наблюдаемые для той или иной кривой в каждой группе провожу диагностику Симонова - Цай и Хабермана, и в случае положительного результата применяю критерий отношения правдоподобия. И далее как в ответе на первый вопрос.

Хотел уточнить, в исследовании нет ни одной контрольной группы.

Еще раз спасибо, nokh!

Сообщение отредактировал exroman - 6.04.2010 - 20:57
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме


Добавить ответ в эту темуОткрыть тему