Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Дисперсионный анализ групп разного объема
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
exroman
Прошу прощения, если надоел со своими воросами, но уж очень нужна помощь, т.к. своего ума не хватает, а работу хочеться сделать грамотно.
У меня 3 вопроса, все также про сравнение групп.
1) Есть 4 группы, не связанных, разного объема (от 24 до 9 человек в группе), данные - бинарные. Подсажите, как правильно выявить наличие или отсутсвтие различия по исследуемому признаку во сех 4 группах сразу, а также кокой метод использовать для по парного сравнения.
2) Есть 4 группы, не связанных, разного объема (от 24 до 9 человек в группе) данные - количественные. Подсажите, какаким методом оценить нормальность распределения в группах и какой метод дисперсионного анализа использовать для выявления различия во всех 4 группах сразу, т.к. разнообразие методов велико, а ведь еще необходимо обосновать применение того или иного метода.
3) Есть опять теже 4 группы, не связанных, разного объема (от 24 до 9 человек в группе), у которых проводится тимпанометрия с выявлением типа кривых (всего 4 типа). Подсажите, как правильно проанализировать данные, т.е. как определить или предположить, что тот или иной тип кривой характерен для той или иной группы.
Заранее благодарен за помощь!
nokh
Цитата(exroman @ 5.04.2010 - 00:12) *
1) Есть 4 группы, не связанных, разного объема (от 24 до 9 человек в группе), данные - бинарные. Подсажите, как правильно выявить наличие или отсутсвтие различия по исследуемому признаку во сех 4 группах сразу, а также кокой метод использовать для по парного сравнения.

Постройте таблицу сопряжённости 4х2 (входы: Группы и Градации бинарного признака). Если в таблице есть ячейки с частотами менее 5 - проанализируйте её предварительно с помощью диагностик Симонова - Цай и/или Хабермана на возможность использования стандартных критериев хи-квадрат и отношения правдоподобия (есть в программе AtteStat: http://attestatsoft.narod.ru/). Если диагностики покажут возможность использования аппроксимации хи-квадрат - переходите к тесту, лучше использовать отношение правдоподобия (критерий G2 по Агрести). Если такая аппроксимация невозможна - нужно использовать точный перестановочный метод в специализированном ПО StatXact (доступна 30-тидневная демо-версия). В этом случае значение G-критерия не изменится, но будет точная оценка P. Если тест покажет существование значимых отличий - можно покопаться в попарных сравнениях, проведя такой же анализ, но в соответствующих таблицах сопряжённости 2х2. Приводить нужно значение G-критерия, число степеней свободы и значение P. Если одна из 4х групп - контроль полезно также по таким четырёхклеточным таблицам рассчитать изменения отношения шансов по сравнению с контролем и 95%-ные доверительные интервалы для них.
Цитата(exroman @ 5.04.2010 - 00:12) *
2) Есть 4 группы, не связанных, разного объема (от 24 до 9 человек в группе) данные - количественные. Подсажите, какаким методом оценить нормальность распределения в группах и какой метод дисперсионного анализа использовать для выявления различия во всех 4 группах сразу, т.к. разнообразие методов велико, а ведь еще необходимо обосновать применение того или иного метода.

Сначала проведите однофакторный дисперсионный анализ (One-way ANOVA) и в его результатах посмотрите распределение остатков. Оно должно быть нормальным. Также с помощью доступных в ПО методов необходимо оценить однородность дисперсий в группах. Если эти 2 условия выполнены - приводите значение F-критерия, степени свободы и P. Попарные сравнения нужно делать внутри дисперсионного комплекса доступными в ПО методами (лучше запланированные сравнения чем post-hoc). Если распределение остатков отличалось от нормального есть 2 пути: преобразовать данные перед анализом адекватным способом (см. про преобразования данных на этом форуме) и применить дисперсионный анализ или использовать непараметрический аналог однофакторного дисперсионного анализа - критерий Краскела-Уоллиса (Kruskal-Wallis test). В последнем случае попарные сравнения можно провести с помощью критерия Манна-Уитни.
Цитата(exroman @ 5.04.2010 - 00:12) *
3) Есть опять теже 4 группы, не связанных, разного объема (от 24 до 9 человек в группе), у которых проводится тимпанометрия с выявлением типа кривых (всего 4 типа). Подсажите, как правильно проанализировать данные, т.е. как определить или предположить, что тот или иной тип кривой характерен для той или иной группы.

По типам кривых не знаю что это такое. Если имеются в виду регрессионные зависимости - используйте нелинейный регрессионный анализ. Информационный критерий Акаике (AIC) поможет выбрать наиболее подходящую функцию из 4х.
В общих чертах - так.
exroman
Большое спасибо за ответ, nokh!!!
Я конечно не все понял, но ход мысли понятен, буду пополнять свои знания по статистике, теперь хоть понятно, что копать.

Цитата(nokh @ 5.04.2010 - 14:23) *
Сначала проведите однофакторный дисперсионный анализ (One-way ANOVA) и в его результатах посмотрите распределение остатков. Оно должно быть нормальным. Также с помощью доступных в ПО методов необходимо оценить однородность дисперсий в группах. Если эти 2 условия выполнены - приводите значение F-критерия, степени свободы и P. Попарные сравнения нужно делать внутри дисперсионного комплекса доступными в ПО методами (лучше запланированные сравнения чем post-hoc).
Я использую для статистического анализа AtteStat, каким именно методом правильней посмотреть распределение остатков и однороднсть дисперсий. Последнее из подчеркнутого, к сожалению, совсем не понятно. Что значит попарные сравнения внутри дисперсионного комплекса и что значит запланированные сравнения?

Цитата(nokh @ 5.04.2010 - 14:23) *
По типам кривых не знаю что это такое. Если имеются в виду регрессионные зависимости - используйте нелинейный регрессионный анализ. Информационный критерий Акаике (AIC) поможет выбрать наиболее подходящую функцию из 4х.
Кривые, это просто кривые, которые получаются в хоте диагностики. В соответствии от состояния получаются разного рода кривые, которые обозначают A, B, Ac, Ad, т.е. я имею ввиду, что получаются данные, которые являются ни количественныеми, ни бинарными, которые, думаю, нужно преобразовать и проанлизировать. Но я не знаю как правильно это сделать. weep.gif
Pyrosmani
Цитата(exroman @ 5.04.2010 - 17:04) *
Кривые, это просто кривые, которые получаются в хоте диагностики. В соответствии от состояния получаются разного рода кривые, которые обозначают A, B, Ac, Ad, т.е. я имею ввиду, что получаются данные, которые являются ни количественныеми, ни бинарными, которые, думаю, нужно преобразовать и проанлизировать.


Мне кажется, что надо начать с определения понятия тимпанометрия. Тогда станет понятным откуда берутся кривые и какую зависимость они отражают. Я не ЛОР-врач, поэтому мне сложно Вам советовать какую-то литературу по тимпанометрии. Наверное есть какие-то методички по тимпанометрии или ЛОР-болезням, в которых этот вопрос подробно рассматривается. Прикрепил два файла, надеюсь они помогут вам решить научную задачу. В остальном следуйте советам Nokh, он мне тоже помог с применением статистических методов.
nokh
Цитата(exroman @ 5.04.2010 - 19:04) *
Я использую для статистического анализа AtteStat, каким именно методом правильней посмотреть распределение остатков и однороднсть дисперсий. Последнее из подчеркнутого, к сожалению, совсем не понятно. Что значит попарные сравнения внутри дисперсионного комплекса и что значит запланированные сравнения?

Скачайте книгу Л.Закса: http://www.onlinedisk.ru/file/205482/ Почитайте там про дисперсионный анализ и его требования к данным, про множественные сравнения - вполне доступно всё описано. Если Вы сравниваете, скажем, контрольную группу с разными вариантами эксперимента, то далеко не всегда интересны все попарные сравнения. Поэтому можно выбрать только интересующие и образовать так называемые контрасты, которые и проверить одновременно. В этом случае увеличивается мощность статистического анализа (см. у Закса про мощность стат. критериев). Но если ортогональных контрастов не получается или интересуют все возможные попарные сравнения - используют незапланированные (так называемые post-hoc) сравнения. Часто исследователи не парятся и сразу делают post-hoc. Но их вариантов много - все со своими плюсами и минусами. В любом случае такие методы будут учитывать информацию об изменчивости признака во всём дисперсионном комплексе, поэтому я и писал о сравнениях "внутри" комплекса. За счёт этого также достигается выигрыш в мощности, т.е. возможна ситуация когда вы сравниваете две группы t-критерием Стьюдента и они значимо не отличаются, а когда их же в рамках (внутри) дисперсионного комплекса в котором присутствуют и другие группы - они будут значимо отличаться.
Универсальных пакетов нет, поэтому привыкайте использовать в анализе их комбинации. Для проведения дисперсионного анализа лучше воспользоваться пакетами, где трудозатраты будут сведены к минимуму. В вашем случае хорошо дополнит AtteStat также бесплатная программа PAST: http://folk.uio.no/ohammer/past/download.html . Скопируйте из Excel область данных и вставьте в PAST. Выделите её и далее: Statistics - One-Way ANOVA. Получите и стандартную таблицу дисперсионного анализа, и проверку выборок на однородность дисперсий по Ливену, и множественные сравнения методом Tukey's HSD, и проверку остатков (Residuals) на нормальность методом Шапиро-Уилка. Пока читайте, делайте анализ, предварительные результаты сохраняйте. Потом опишите что получается. Если потребуется преобразование данных - вернёмся к AtteStat и сделаем преобразование Бокса-Кокса.
Цитата(exroman @ 5.04.2010 - 19:04) *
Кривые, это просто кривые, которые получаются в хоте диагностики. В соответствии от состояния получаются разного рода кривые, которые обозначают A, B, Ac, Ad, т.е. я имею ввиду, что получаются данные, которые являются ни количественныеми, ни бинарными, которые, думаю, нужно преобразовать и проанлизировать. Но я не знаю как правильно это сделать. weep.gif

Немного погуглил, посмотрел файлы от Pyrosmani. Насколько понял тип этих кривых классифицируется "на глаз". Тогда эти данные нужно будет обрабатывать как качественные признаки - посчитать сколько какого типа кривых в ваших группах и свести всё в таблицу сопряжённости. Также видел, что помимо общего вида тимпанограммы она характеризуется также пиковым давлением при максимальной податливости и общим эквивалентным объёмом. Эти показатели, вероятно, также нужно оцифровать и сравнивать дисперсионным анализом. Думаю что-нибудь интересное могло бы проявиться при многомерном анализе Ваших данных, когда все признаки анализировались бы одновременно, но пока это будет, пожалуй, слишком мудрено.
exroman
И снова огромное спасибо, nokh, за разъяснения и помощь!!! smile.gif
Цитата(nokh @ 6.04.2010 - 19:09) *
Насколько понял тип этих кривых классифицируется "на глаз". Тогда эти данные нужно будет обрабатывать как качественные признаки - посчитать сколько какого типа кривых в ваших группах и свести всё в таблицу сопряжённости.
Совершенно верно поняли, классификация кривых происходит "на глаз", остальных параметров нет.
На сколько я понял, я должен создать таблицы r x с, куда вбиваю абсолютные частоты наблюдаемые для той или иной кривой в каждой группе провожу диагностику Симонова - Цай и Хабермана, и в случае положительного результата применяю критерий отношения правдоподобия. И далее как в ответе на первый вопрос.

Хотел уточнить, в исследовании нет ни одной контрольной группы.

Еще раз спасибо, nokh!
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.