Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Сравнение 3х связанных групп разной численности, какой критерий применить?
Capre_diem
сообщение 20.12.2008 - 20:58
Сообщение #1





Группа: Пользователи
Сообщений: 2
Регистрация: 20.12.2008
Пользователь №: 5640



Доброго времени суток, уважаемые коллеги!
Самостоятельно разобраться не получилось, хочется обратиться за компетентной помощью.

Есть 13 пациентов, у которых до лечения препаратом, спустя 2 недели и спустя 6 недель брали кровь на иммунный статус. Нужно сопоставить значения лабораторных данных на 3х этапах исследования (в динамике). К сожалению, на 3ем этапе исследования данных меньше, чем на 2м и 1м(не у всех пациентов кровь брали трижды).
Критерии Шапиро-Уилка и Колмогорова-Смирнова показали, что распределения ненормальны, плюс выборка маленькая - всего 13, поэтому начала с непараметрики.
Использовала непараметрический метод Фридмена, который не выявил стастистически значимых различий ни в 1 из случаев. Видимо, это отчасти связано с неравной численностью групп и выпали те пациенты, у которых кровь брали дважды?

А вот попарные сравнения с помощью критерия Вилкоксона выявили значимые различия. Но можно ли сразу переходить к попарным сравнениям между 3 группами результатов?


Как правильно подойти к расчетам? Какие критерии правильнее применить?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 20.12.2008 - 21:37
Сообщение #2





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(Capre_diem @ 20.12.2008 - 20:58) *
Но можно ли сразу переходить к попарным сравнениям между 3 группами результатов?
Стентон Гланц в книге «Медико-биологическая статистика», стр.359 рекомендует использовать попарные сравнения групп только после выявления значимых различий при помощи критерия множественных сравнений Фридмана.


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 21.12.2008 - 02:17
Сообщение #3





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Capre_diem @ 20.12.2008 - 22:58) *
Критерии Шапиро-Уилка и Колмогорова-Смирнова показали, что распределения ненормальны, плюс выборка маленькая - всего 13, поэтому начала с непараметрики.

На выборке в 13 объектов не имеет смысла искать отклонения от нормальности + как раз на малых выборках параметрические методы наиболее полезны, т.к. непараметрические менее мощные - можете не найти различия там где они в действительности есть. Поэтому даже если есть сомнения в нормальности лучше повозиться с преобразованием исходных данных. Одно из лучших преобразований - преобразование Бокса-Кокса (подробно обсуждалось на форуме). Для анализа всей совокупности данных здесь подошел бы двухфакторный дисперсионный анализ с фиксированным фактором "время" и случайным фактором "донор". Но т.к.у вас в этом комплексе есть пропуски, обычный дисперсионный анализ не подойдет - нужно использовать смешанную модель для несбалансированных данных (General mixed effects models for unbalanced data). Анализ смешанных моделей есть во многих пакетах, но для данных с пропусками встречал только работы с использованием пакета SAS.


Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 21.12.2008 - 21:59
Сообщение #4





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Поскольку Capre_diem обращается на статистическую ветку, то естественно, хочет получить помощь в статистическом анализе. Ее вопрос весьма традиционный для иммунологических исследований. Иммунологических показателей больше, чем число больных. При это все хотят продемонстрировать сдвиг средних значений этих показателей под лечебным воздействием. Но природа этих показателей такова, что их нормальные значения находятся в широком диапазоне нормы. Поэтому странно читаются работы, где этот сдвиг под действием иммунокорректора статистически достоверный. Возможно, что средние значения каких то показателей до и после лечения будут статистически достоврено изменяются, но они входят в диапазон нормы, как до так и после лечения. Можно было бы, конечно, провести дисперсионный анализ для повторных измерений и показать на какой срок наблюдения имеются различия, при этом включить тех больных у которых есть все данные. Но можно пойти другим путеи, показать у скольких больных по определенным показателям наблюдались нарушения, т.е. показатели были вне нормы. После лечения показать снижение числа таких больных. Т.о. эффектом лечения будет снижение числа больних с определенными сдвигами в иммунограммах.

Сообщение отредактировал DrgLena - 21.12.2008 - 22:10
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 21.12.2008 - 23:11
Сообщение #5





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(DrgLena @ 21.12.2008 - 23:59) *
Можно было бы, конечно, провести дисперсионный анализ для повторных измерений и показать на какой срок наблюдения имеются различия, при этом включить тех больных у которых есть все данные. Но можно пойти другим путеи, показать у скольких больных по определенным показателям наблюдались нарушения, т.е. показатели были вне нормы. После лечения показать снижение числа таких больных. Т.о. эффектом лечения будет снижение числа больних с определенными сдвигами в иммунограммах.

Меня учили, что если откинуть 5% данных и в результате дисперсионный комплекс станет равномерным или пропорциональным - это будет оправданная (точностью) жертва. И я недавно советовал так же. Но классический дисперсионный анализ сменили общие линейные модели (GLM) - в результате стали хорошо обрабатываться неравномерные комплексы. Сейчас GLM активно вытесняются современными техниками для обработки несбалансированных и неполных комплексов (Maximum Likelihood, Restricted Maximum Likelihood). Поэтому жертвы более неоправданы. Скачал 2 книги по теме, читаю урывками, но посоветовать пока ничего не могу. Все остальные варианты анализа - упрощения. Рекомендуемая вами схема тоже не самая простая - данные-то зависимые. Поэтому придется оставлять только пациентов с полными данными и применять те тесты симметрии, которые недавно здесь подробно обсужались в теме по МакНемару. Но тогда наблюдений будет совсем мало - ничего не найдем. Если никого не убирать - придется дробить эксперимент на 2 части и обсчитывать по МакНемару. Тогда уж лучше эти 2 части обсчитать критерием Уилкоксона для разностей пар (к тому же он уже дал какие-то результаты) или парным критерием Стьюдента после преобразования всего массива по Боксу-Коксу.
> Capre-diem. Можете обсчитать отдельно варианты "до-спустя 2 недели" и "спустя 2 недели - спустя 6 недель", но учтите, что мощность анализа снизится и что существуют техники, которые позволяют обработать ваши данные целиком. Цена за "плохие" данные - необходимость осваивать техники высшего пилотажа в прикладной статистике или использовать не вполне корректные подходы.

Сообщение отредактировал nokh - 21.12.2008 - 23:16
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 21.12.2008 - 23:27
Сообщение #6





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



На самом деле лучше выбирать трансформацию исходя из знаний предметной области - т.е. большинство иммунологических данных имеют логнормальное распределение, стоит прологарифмировать данные, а затем использовать дисперсионный анализ с повторными измерениями, как описано выше.
По поводу пропущенных данных, либо действительно MI (multiple imputation), либо заменить значения на средние, медианы и проверить результат. Либо все считать только на 13 пациентах с полным набором данных.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 22.12.2008 - 00:19
Сообщение #7





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



А разве нельзя обойтись без MI? Насколько понял - можно модифицировать значения ожидаемых средних квадратов в зависимости от того, чего в данных не хватает, а далее выстраивать тесты значимости по Sattherthwaite или какими-то современными техниками. Просмотрел недавно эту статью ( http://www.pubmedcentral.nih.gov/articlere...i?artid=2431090 ) и отправился искать в сети книги S.R. Searle.

Сообщение отредактировал nokh - 22.12.2008 - 00:21
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 22.12.2008 - 10:21
Сообщение #8





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(nokh @ 22.12.2008 - 00:19) *
А разве нельзя обойтись без MI? Насколько понял - можно модифицировать значения ожидаемых средних квадратов в зависимости от того, чего в данных не хватает, а далее выстраивать тесты значимости по Sattherthwaite или какими-то современными техниками. Просмотрел недавно эту статью ( http://www.pubmedcentral.nih.gov/articlere...i?artid=2431090 ) и отправился искать в сети книги S.R. Searle.

А я чего-то не нашел в статье про пропущенные данные, а в задаче вверху речь шла именно про это. Пропущенные данные-то все и портят (две точки вместо трех)...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 22.12.2008 - 17:32
Сообщение #9





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Может быть,

1. Заполнить пропуски по тому или иному алгоритму, а затем
2. Применить критерий Шеффе для связанных выборок.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Capre_diem
сообщение 22.12.2008 - 21:57
Сообщение #10





Группа: Пользователи
Сообщений: 2
Регистрация: 20.12.2008
Пользователь №: 5640



Спасибо за помощь всем откликнувшимся.

to nokh: после обработки данных по Боксу-Коксу получились отрицательные значения (исходные данные меньше 1). Можно дальше работать с отрицательными числами или стоит их как-то видоизменить?
to DrgLena: возвращение к норме выходящих за рамки значений есть, но насколько оно достоверно? Боюсь, что если выкинуть часть пациентов, доказать достоверность такой нормализации будет невозможно.
to плав: принялась читать про MI. Выглядит зловеще: в публикациях ни разу не сталкивалась с таким методом. Научный руководитель будет удивлен.

если мне удалось уяснить порядок, действий, то
- нормализовать распределения по Боксу-Коксу,
- ANOVA для поиска различий между 3 группами
- попарные сравнения с помощь t-критерия для связанных групп?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DoctorStat
сообщение 22.12.2008 - 22:22
Сообщение #11





Группа: Пользователи
Сообщений: 377
Регистрация: 18.08.2008
Из: Москва Златоглавая
Пользователь №: 5224



Цитата(Capre_diem @ 22.12.2008 - 21:57) *
Спасибо за помощь всем откликнувшимся.
Мне кажется, что Вы подходите к задаче не с того конца. У Вас есть значимость (p-value) теста Фридмана, объем выборки и количество временнЫх точек. По этим параметрам можно оценить величину эффекта (отклонение лабораторных показателей крови в результате лечения). Если величина эффекта клинически значима, можно дальше пытаться найти отличия более тонкими методами и удивлять руководителя современными познаниями в области статистики. Если оцененный эффект незначителен, то последующая «игра не стоит свеч».


Signature
Просто включи мозги => http://doctorstat.narod.ru
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 23.12.2008 - 13:12
Сообщение #12





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Capre_diem @ 22.12.2008 - 23:57) *
to nokh: после обработки данных по Боксу-Коксу получились отрицательные значения (исходные данные меньше 1). Можно дальше работать с отрицательными числами или стоит их как-то видоизменить?

если мне удалось уяснить порядок, действий, то
- нормализовать распределения по Боксу-Коксу,
- ANOVA для поиска различий между 3 группами
- попарные сравнения с помощь t-критерия для связанных групп?


1. Отрицательные значения - нормально, ничего с ними делать не нужно. Преобразованные значения вы используете только в анализе, а на графиках (например, box-and-whisker plot) в работе приводите непреобразованные данные. Другой вопрос какие средние и доверительные интервалы приводить. Для явно ненормальных распределений рассчитывают показатели описательной статистики по преобразованным данным, а далее выполняют обратную трансформацию к исходной шкале - эти значения и приводят в качестве среднего и ДИ. Такое обратное преобразование можно сделать и для Бокса-Кокса. Если вы для него пользовались программой AtteStat, то учтите, что там в помощи приводится формула, отличная от той по которой сделан расчет (y=x^λ/λ вместо y=(x^λ - 1)/λ , >Игорь: использовал версию 9.7.2.). Но конечно, проще делать преобразования (и прямые и обратные) для простых функций. Поэтому, может стоит, как рекомендует плав, попробовать логарифмическое преобразование. Указание на то, какое из простых преобразований ближе к вашим данным можно получить и из значения λ. Если она в районе -0,25 - +0,25, то ближе логарифмирование. Но, действительно, при выборе преобразование лучше в первую очередь руководствоваться теоретичесими соображениями.
2. "ANOVA для поиска различий между 3 группами". Дисперсионный анализ нужно делать для случая с повторными измерениями = двухфакторный как я написал выше (чтобы учесть зависимый характер данных в выборках).
3. Если вы сделаете anova, то t-критерий для связанных групп использовать уже не нужно. Нужно делать сравнения внутри дисперсионного комплекса. За счет этого достигается выигрыш в мощности. Критерий Шеффе для связанных выборок, рекомендуемый Игорем, (судя по названию) здесь должен подойти. Но я его не встречал в литературе и буду признателен Игорю за ссылку. Возможно здесь он более уместен чем другие критерии, используемые в post hoc сравнениях.
> плав. Пропусков в данных из статьи действительно нет, но там настолько несбалансированный план и так аккуратно все выражено, что я подумал может этот подход подойдет и для пропусков? Когда дочитаю книгу Searle стану умнее smile.gif.
> DoctorStat. Рассуждения не верны. Используя на первом этапе менее мощный критерий можно пропустить открытие. Конечно, это лучше, чем сделать лжеоткрытие, но все равно неприятно. Руководства использовать сначала "простые", а затем "сложные" методы действительно можно найти в литературе. Но вся она - докомпьютерная. Сидеть с арифмометром день или неделю - существенная разница, но нажать на одни кнопки в программе или на другие - уже несущественно. Нужно брать от компьютера по максимуму и не бояться отстаивать свою точку зрения перед руководителем и коллегами. Сегодня был на предзащите по иммуногенетике и с прискорбием отметил, что толковая аспирантка заменила в работе отношение правдоподобия на пирсоновский хи-квадрат, а точные перестановочные (permutation) тесты на точный метод Фишера. Боится, что то, что на ура прошло на конференции в Питере в Челябинске не поймут. Эдак мы еще очень долго будем плестись за западом.



Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 24.12.2008 - 10:31
Сообщение #13





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(nokh @ 23.12.2008 - 13:12) *
... преобразование можно сделать и для Бокса-Кокса. Если вы для него пользовались программой AtteStat, то учтите, что там в помощи приводится формула, отличная от той по которой сделан расчет (y=x^λ/λ вместо y=(x^λ - 1)/λ , >Игорь: использовал версию 9.7.2.) ...

Надо подправить формулу в Справке, чтобы уж все корректно было.
На самом деле в смысле вычисления параметров преобразования (в том числе и многомерного) отнятие константы никакой роли не играет. Функционал - тот же.

Цитата(nokh @ 23.12.2008 - 13:12) *
... Критерий Шеффе для связанных выборок, рекомендуемый Игорем, (судя по названию) здесь должен подойти. Но я его не встречал в литературе и буду признателен Игорю за ссылку. Возможно здесь он более уместен чем другие критерии, используемые в post hoc сравнениях....


Могу ошибаться (книги под рукой нет), но критерий Шеффе тут был:
Pollard J.H. A handbook of numerical and statistical techniques. - New York, NY: Cambridge University Press, 1977.

Есть русский перевод.
Поллард Дж. Справочник по вычислительным методам статистики. - М: Финансы и статистика, 1982.

Описание приводится в Справке AtteStat ("Дисперсионный анализ ...").

Сообщение отредактировал Игорь - 24.12.2008 - 10:35


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему