![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Предлагаю участникам форума поделиться в этой ветке своим опытом анализа иммунологических данных. В последние месяцы намаялись с аспирантками иммунологами-иммуногенетиками с анализом их данных. Проблемы, которые хотелось бы обсудить:
(1) выраженные в % показатели иммунограммы после преобразования арксинуса или Фримана-Тьюки сохраняют асимметрию распределения. Пробовали Бокса-Кокса - получается; но ведь использование степенных преобразований для частот - чистейший эмпирический произвол? (2) сложные асимметричные и, возможно, полимодальные распределения для одних показателей и ровненькие почти симметричные - для других. Получается, что даже интерлейкины не удаётся описать/сравнить единообразно. (3) сложности с графическим представлением результатов дисперсионных анализов (ДА). Делали сложные ДА с перекрёстными и иерархическими эффектами после предварительного преобразования данных по Боксу-Коксу и получали таблицу значимости эффектов и их взаимодействий. Однако графики для непреобразованных или лог-преобразованных переменных совсем не совпадали с бокс-коксовскими. Получается, что значимые эффекты в сложной таблице результатов ДА не удаётся подкрепить графически, кроме как в никому непонятной шкале преобразования Бокса-Кокса. (4) столь любимые иммунологами коробчатые графики (box-and-whiskers plot) не позволяют интерпретировать межгрупповые различия. А учитывая, что разные программы используют разные пороги для отнесения наблюдений к выбросам (причём для нормального распределения, что заведомо неверно) - вообще непонятно что на этих графиках изображается усами, а что выбросами. Причём авторитетных авторов статей это вообще никак не беспокоит. Вместе с тем логичные для таких данных графики с медианами и 95%-ными ДИ для медиан вообще не используются. Хотелось бы совместить на одном графике: медиану (линия), межквартильный размах (короб) и 95%-ные ДИ для медианы (усы), можно даже вручную, но не смог найти программу, где эти показатели для box-and-whiskers plot можно было бы задать вручную (мой любимый KyPlot не строит коробчатые графики:(( ) Позже выложу здесь 3 статьи по статистике в иммунологии (пока это только отвлечёт от описанных проблем), а также поделюсь нашими наработками по приведению иммунологической статистики к единообразному виду - пока на основе порядковых статистик, включая малоизвестные множественные сравнения в рамках непараметрических дисперсионных анализов Краскела-Уоллиса и Фридмана (могу с собранными формулами и примером). А позже хотелось бы обсудить ещё подход с бутстрепом. Сообщение отредактировал nokh - 12.02.2011 - 10:21 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 5 Регистрация: 19.12.2010 Пользователь №: 23055 ![]() |
Да в иммунологии можно пользоваться относительными величинами, но в педиатрической иммунологии лучше пользоваться абсолютными величинами (например, количество Т-клеток и т.д.). К тому же нет нормального распределения этих величин. В иностранной лит-ре отдельно описываются выбросы, медиана и квартили. Интерпретировать многочисленные данные сложно. Так и непонятно, нужно ли применять поправку Бонферони при сравнении нескольких групп?
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1218 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 ![]() |
Да в иммунологии можно пользоваться относительными величинами, но в педиатрической иммунологии лучше пользоваться абсолютными величинами (например, количество Т-клеток и т.д.). К тому же нет нормального распределения этих величин. В иностранной лит-ре отдельно описываются выбросы, медиана и квартили. Это из проблемы (4). В том то всё и дело, что часто ничего не описывают - дают то, что строит программа. А вариантов коробочных графиков много. Их ввёл в употребление в 1977 году Джон Тьюки. При этом в качестве выбросов он рассматривал значения, отстоящие от нижней и верхней квартилей на 1,5 расстояния межквартильного размаха. Почему на 1,5 - не понятно, так ему нравилось. Часть программ закладывает по умолчанию это число, и в качестве усов дают мин-макс без этих "выбросов". В каких-то дополнительно обозначаются некие "дикие" выбросы (wild outliers). Другие программы предлагают в качестве усов разные процентили или мин-макс. Поскольку толку от всех этих значений вообще нет, а 95%-ные ДИ для медиан программы не строят, мы пришли к такой форме ящика, в котором усами обозначаем просто минимум и максимум - это по крайней мере понятно и однозначно. А вообще, использование в качестве описательной статистики - порядковой статистики мне не очень нравится. Хотя пока на ней и остановились. Допустим есть 3 числа: 55, 56 и 560. Согласитесь, что это не 1, 2 и 3 как будет в порядковой статистике. Т.е. информация если в пределе и не искажается, то теряется. Поэтому и хочу обсудить и другие подходы к описанию данных, в частности - преобразования и бутстреп. Интерпретировать многочисленные данные сложно. Так и непонятно, нужно ли применять поправку Бонферони при сравнении нескольких групп? А с поправкой Бонферрони в принципе всё ясно. Если исследователю неизвестны/недоступны более мощные варианты для множественных сравнений - сойдёт и Бонферрони. Но лично я в последнее время рассматриваю использование этой поправки скорее в качестве маркёра недостаточной квалификации исследователя. Конечно с исключениями. Но зачем сравнивать группы методами, разработанными для 2 групп, когда групп - несколько? При таком подходе, во-первых, используется только часть имеющейся информации (не используются данные о других группах), а значит идёт потеря в мощности теста. Во-вторых, результаты даже такого неоптимального сравнения дополнительно подвергаются ограничению по Бонферрони. Т.е. идёт двойная потеря мощности. Правильный подход - использование омнибусного теста с последующими попарными сравнениями внутри него . Омнибусный тест проверяет весь набор ("омнибус") простых гипотез одновременно. Но дело в том, что достаточно часто применяют такую непараметрическую схему: сначала все группы сравнивают по Краскелу-Уоллису, а потом ищут попарные различия по Манну-Уитни, в т.ч. с поправкой Бонферрони. А это неправильно, хотя такой подход распространён. В частности одна из любимых мной программ PAST выдаёт результаты сравнений по Манну-Уитни в модуле Краскела-Уоллиса именно в качестве апостериорного (post-hoc) критерия. Но ведь если в качестве параметрического омнибусного теста используется дисперсионный анализ никто не ищет затем попарные различия t-критерием Стьдента, все используют специализированные методы множественных сравнений. Аналогичные методы есть и для случая использования в качестве непараметрического омнибусного теста критерия Краскела-Уоллиса. Это методы: Conover-Inman (ранговый аналог Fisher's LSD), Steel-Dwass (ранговый аналог Tukey's HSD), Schaich-Hamerle и пара-тройка ещё менее распространённых. Как написал выше, формулы я собрал, но пока нет времени привести всё в законченный вид. Приведу - выложу здесь. Т.е. грамотно считать так: сначала Краскел-Уоллис, а если различия есть - выясняем за счёт каких пар с помощью множественных сравнений внутри теста Краскела-Уоллиса. Сообщение отредактировал nokh - 14.02.2011 - 23:23 |
|
![]() |
![]() |
![]() ![]() |