Присутствует ли эффект множественных сравнений при использовании непараметрических критериев?
У меня 1 контрольная группа и 4 опытных; т.к. в каждом случае кровь брали для всех 4х лекарств и контроля, считаю группы связанными/зависимыми; численность групп неодинакова ? от 8 до 12; итого 5 групп и 10 попарных сравнений... и разница статистически значима для той пары, для которой p < 0.005. Т.к. проверка на нормальность согласно Shapiro-Wilk?s Test (Statistica) показала, что распределение в выборках различны, и поэтому использовал Friedman ANOVA and Kendall Coeff. of Concordance, а потом Wilcoxon Matched Pairs Test. По последнему получил 10 попарных сравнений. Верно ли рассуждаю?
Я так понимаю: Friedman ANOVA and Kendall Coeff. of Concordance говорит нам, что есть где-то между сравниваемыми группами различие, а Wilcoxon Matched Pairs Test указывает между какими конкретно. Это так? (интересно?, а зачем такая пошаговость?)
P.S.
На форуме неоднократно звучало, что для использования параметрики или непараметрики нужно прежде всего определиться с распределением вариант генеральной совокупности, а не выборки? но как это сделать, если: (1) генеральная совокупность нам неизвестна и (2) в диссертациях всегда есть глава ?новизна?, я так понимаю, где объясняют зачем диссертант проводит исследование?, т.е. до этого никто такого же не делал? (Т.е. если бы делал, то можно было бы составить мета-анализ, объединить данные?) Как быть?
С уважением
Очень сумбурно всё написано. Опишите нормально свой эксперимент, чтобы не приходилось догадываться что там и как. И признак какой - количественный или качественный? Не думаю что столь молниеносный уход в непараметрику - хорошее решение. А пошаговость свойственна и обычному дисперсионному анализу: сначала проверяется нулевая гипотеза о равенстве всех средних, и если отклоняется - далее с помощью попарных сравнений в рамках дисперсионного комплекса выясняется за счёт чего.
nokh, cпасибо за внимание к посту
признак: количественный (мы число клеток считаем)
группы: контрольная и 4 опытных (5 групп), связанные (кровь одного и того же человека для всех групп)
объём: 8-12 человек (в разных группах по-разному)
предполагаемый алгоритм:
1. проверка на нормальность (Shapiro-Wilk?s Test)
(я так понимаю, надо ВСЕ (!!это для меня новость!!) варианты отдать под проверку для п.1, не проверяя 5 раз, а только 1)
2. (а) если ответ "приближается к нормальному", то исп. ANOVA (буду смотреть у Ребровой)
(б) если ответ "не приближается к нормальному", то вышеуказанный алгоритм
----------
P.S. а что такое "в рамках дисперсионного комплекса"? может это имеется ввиду вкладка post-hoc в диалоге в Statistica... или это не то...?
P.P.S.
натолкнулся на ресурс: http://www.socr.ucla.edu/
Мне дизайн не понятен. К сожалению помочь не смогу. Подождите более догадливых.
Незапланированные сравнения (post-hoc comparisons) - целый спектр методов, некоторые из них можно рассматривать как сравнения "внутри комплекса", некоторые - нет. В любом случае они менее мощные по сравнению с запланированными ортогональными сравнениями (planned comparisons) в которых строятся линейные контрасты между интересующими вариантами.
bubnilkin,
У пациента взяли взяли кровь, разделили на 5 частей. 1 контрольная, на 4 воздействовали 4 разными препаратами. И так у 12 пациентов, хотя, где-то материал попортили. Правильно излагаю?
nokh, если так, то это похоже на ириски .
2 Green
Ну, конечно ! Вы всё верно поняли !
тогда похоже на ковариационный анализ.
Последнее слово за nokh.
nokh, согласна
я с утра на свежую голову тоже сообразила, что это repeated measures ANOVA. Только никак до форума добраться не могла.
Тут одно только "но" - потерянные данные.
Если часть данных утеряна, то полных ( 5 измерений) будет у нескольких пациентов. А может, и ни у одного
А соответсвенно, если взять контроль и 1 измерение первого реагента от одного пациента, контроль и 1 измерение 2 реагента от другого.... то можно использовать АNCOVA, разве нет?
> Почему за мной?
Потому что Вы уже отвечали автору вопроса.
Потому что одна голова хорошо, а две лучше.
Потому что Вы действительно разобрались в кованализе.
Потому, что я уважаю Ваше мнение.
bubnilkin,
сколько человек имеют все 5 измерений?
Сколько данных потеряно?
Пропущенных данных мало.
Вперед, на Repeated Measures ANOVA
Спасибо за помощь !
Но вот ещё вопросик: в другом опыте (дизайн тот же) мы не число клеток считаем, а проценты клеток... В этом случае какой метод нужно использовать ?
Bubnilkin, рано благодарить.
К сожалению, если измерения были 1 раз на одного пациента на каждом факторе, то это не повторные измерения. Тогда это рандомизированный полноблочный план.
В общем, посмотрите
Монтгомери, Планирование эксперимента и анализ данных, 1980.
Пример 4.1, стр. 78.
Если это то, что делали Вы... то тогда будем говорить об этом.
Книга есть в Инете. Но в расчетах этого примера - ошибки в вычислениях. Не страшно, но имейте ввиду.
-------
По процентам позже, давайте все таки идентифицируем задачу.
Всё равно, спасибо за обсуждение !
Я посмотрел указанный пример. Я полностью не понял, но мне кажется, там говорится всё-таки о несвязанных группах, а у меня, как Вы верно определили, кровь каждого больного исследовалась один раз, но в разных условиях -- при действии четырёх лекарств и без них, т.е. связь между группами есть [С.Гланц, с.314, с. 308 ("Как мы уже говорили,..."), с.355 ("Каждый больной ровно один раз...", хотя там про непараметрический аналог); справка к Statistica].
Green, как Вы считаете? Другие тоже пусть высказываются по делу.
Да! Я ещё собираюсь, не только 4 лекарства с контролем сравнивать, но и между собой... Это как-нибудь влияет на выбор критерия? (думаю про критерий Даннета)
P.S.
на с.79 у Монтгомери приведена запись "F 0.05; 3; 9 = 3,86". Что такое "3" и "9"? Меж- и внутригрупповые степени свободы? И надо ли так в статьях указывать?
Я не просто так написала.
Я ранее делала Repeated Measures(RM) для таких случаев, как, например, у одного пациента берут один и тот же анализ раз в неделю на протяжении мес.
Мне было интересно, как применить RM - к Вашему случаю. Попробовала - не получилось. ( Не выдает статистик, пишет -----)
Тогда почитала еще раз внимательно help к Статистике, разобрала еще раз пример из Статистики... Потом пошла искать у Монтгомери аналог, чтобы разобраться.
У вас 12 образцов крови - так? ( У Монтгомери 4 образца материала)
У вас поделили кровь на 5 частей и воздействуют 4 реагентами ( пятый - нейтральный)
У него аналогично - кусок образца тыкают остриями.
>ещё собираюсь, не только 4 лекарства с контролем сравнивать, но и между собой
Как сделать анализ контрастов в Статистике - я расскажу.
Я бы очень хотела услышать nokh, как правильно вогнать такие данные в RM.
Потому что иначе ничего не будет.
И все таки - по каждому пациенту на каждый фактор - одно измерение?
мы решили сравнить действие 4 лекарств между собой и по отношению к контролю
мы взяли кровь человека, разделили на 5 частей: первая -- контроль (без лекарства), вторая -- кровь+лекарство1, третья -- кровь+лекарство2, четвёртая -- кровь+лекарство3, кровь+лекарство4. итого 5 групп.
так мы повторили ещё с 11 людьми, итого 12 людей.
смотрели признак -- число клеток типа А, Б
итого у нас 2 объекта (клетки типов А, Б), для каждго из них есть 5 групп (контроль и 4 лекарства) и 12 человек для всех типов клеток.
клетки типа А
_______________ человек1 человек2... человек12
контроль ...
лекарство1 ...
лекарство2 ...
лекарство3
лекарство4
клетки типа Б
_______________ человек1 человек2... человек12
контроль ...
лекарство1 ...
лекарство2 ...
лекарство3
лекарство4
"нужно понимать что с чем связано..."
я думаю, 5 групп связаны между собой
"...и как"
я не понимаю... что это значит?
"какое можно предполагать распределение" (не знаю, где это можно посмотреть?)
если проверять нормальность по отдельности для каждой из 5 групп: то, например, для клеток типа А для контроля получилось нормальное, для лекарства2 тоже, для остальных нет; клеток типа Б -- по другому
если все вместе, то для клеток типа А-- нормальное, для клеток типа Б -- нет)
ещё я не понимаю, про выбросы -- их нужно/стоит ли выбрасывать и на каком этапе?
вот ещё, ANOVA показала различие с p=,04211. а попарные сравнения с поправкой Бонферрони -- ни одного различия
и каким тестом пользоваться Бонферонни или Ньюмена-Кейлса?
Чтобы сэкономить время не отклоняясь на возможные варианты - выложите здесь свои данные, скажем по клеткам A. Лучше в Excel, в том виде как сами представили:
клетки типа А
_______________ человек1 человек2... человек12
контроль ...
лекарство1 ...
лекарство2 ...
лекарство3
лекарство4
Покручу. Пока не знаю что делать с пропусками и "переварят" ли их программы в дисперсионном комплексе. И не бегите вперёд, до Бонферрони и т.п. ещё очень далеко.
Напишите ещё:
(1) Что такое число клеток? В объёме пробы, в мазке?
(2) Каким софтом для анализа располагаете?
"что делать с пропусками"
(может, если есть пропуск для какого-то больного, то его выкинуть из анализа? и сколько можно так выкидывать, чтобы n достаточное сохранить?)
"Что такое число клеток? В объёме пробы, в мазке?"
...наверное в объёме, но точно не в мазке (для этого типа эксперимента)
"Каким софтом для анализа располагаете?"
Statistica, Excel, R (в R надо долго разбираться)
вспомнил! заключение после статанализа мы делаем для каждого типа клеток. вот только не пойму, если исследуем сначала общий тип клеток, а потом -- подтипы клеток... как быть в этом случае?
"не бегите"
...шеф напирает: "давай статью!" :|
nokh, у Игоря в Attestat написано
"При однофакторном дисперсионном анализе с повторными измерениями (repeated measurements ANOVA) предполагается, что результаты наблюдений одного и того же процесса для разных временных уровней представляют собой выборки из нормально распределенных генеральных совокупностей. Эти совокупности имеют свои средние и дисперсии, которые полагаются одинаковыми. Задачей анализа является проверка нулевой гипотезы о равенстве средних рассматриваемых совокупностей."
Ну, мне не верите, Монтгомери не верите, Статистике не верите... Игорю тоже?
Возьмите абстрактный пример и попробуйте его загнать с Статистике в RM-ANOVA.
А то, что они связаны... да, связаны. Только для такого примера....важно ли? В "ирисках" влияние ковариаты устранялось, т.е. один рассасывал медленнее, второй быстрее.
Теперь представьте, 1 рассасывает все ириски... медленно. Другой - тоже медленно. Это будет аналогичный эксперимент как дает bubnilkin. Вы найдете средние скорости рассасывания ириски, но никогда не узнаете, что кто-то рассасывает их намного быстрее. Вот такой эксперимент. Задача то- сравнить ириски по длительности расссывания! А не определить скорость рассасывания.
Конечно, задача bubnikina не кованализ, тут я согласна полностью.
так что же мне делать...?
Безусловно, оформить данные как написал nokh.
Я пока вот взяла пример Монтгомери.
mg.rar ( 175,61 килобайт )
: 468
Но почему МГ так считает?
Провела типа эксперимента. Одни и те же данные. Два варианта в Statistica.
Величины одни и те же.
RM
Green, Вы обещали "Как сделать анализ контрастов в Статистике..." я старался понять про 1 и -1, но что-то трудно...
а какие литературные источники (рус/англ) мне приводить для обоснования выбора этого стат.метода?
спасибо !
а если я применяю RM ANOVA или Friedman ANOVA, то мне их 5 раз применять (т.е. для каждой подгруппы) или для всех один...?
и нужно ли проверять на выбросы, и опять-таки, для всех сразу или для каждой подгруппы, т.е. 5 раз?
Игорь, спасибо !
Вот еще появились вопросы...! Кто знает/кому не лень/кто хочет помочь, ответьте пожалуйста!
тесты для равенства дисперсий
на с.122 ОЮ Реброва пишет: "привести следующую информацию: - число объектов в каждой из групп; средние значения и СКО изучаемого признака в каждой из групп". Т.е. имеется ввиду, что тест Левена нужно выполнять для каждой группы...?! Тогда как предыдущий шаг (проверка на нормальность) нужно выполнять 1 раз. или тесты для равенства дисперсий тоже сразу для всех данных?
По поводу выбросов
кажется, в statistica реализованы 4 теста для их нахождения при нормальном распределении (Tukey, Grubbs, Normal) и 1 при ненормальном - (Percentile).
Какой тест выбирать для нормального распределения?
Percentile, как я понял, субективен - выбираем n процентов минимальных и максимальных значений выборки. Какой процент отсекать?
И когда эти выбросы выбрасывать? На каком этапе?
после RM ANOVA
каким методом пользоваться после RM ANOVA парным t-критерием с поправкой Бонферрони или теми, которые во вкладке Post-hoc? И нужно ли для последних считать поправку Бонферрон?
"Friedman ANOVA" = "ANOVA Chi Sqr." = "Chi Sqr." ?
Форум Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)