Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Статистика в иммунологии:, описательная статистика, сравнения, бутстреп
nokh
сообщение 12.02.2011 - 10:20
Сообщение #1





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Предлагаю участникам форума поделиться в этой ветке своим опытом анализа иммунологических данных. В последние месяцы намаялись с аспирантками иммунологами-иммуногенетиками с анализом их данных. Проблемы, которые хотелось бы обсудить:

(1) выраженные в % показатели иммунограммы после преобразования арксинуса или Фримана-Тьюки сохраняют асимметрию распределения. Пробовали Бокса-Кокса - получается; но ведь использование степенных преобразований для частот - чистейший эмпирический произвол?
(2) сложные асимметричные и, возможно, полимодальные распределения для одних показателей и ровненькие почти симметричные - для других. Получается, что даже интерлейкины не удаётся описать/сравнить единообразно.
(3) сложности с графическим представлением результатов дисперсионных анализов (ДА). Делали сложные ДА с перекрёстными и иерархическими эффектами после предварительного преобразования данных по Боксу-Коксу и получали таблицу значимости эффектов и их взаимодействий. Однако графики для непреобразованных или лог-преобразованных переменных совсем не совпадали с бокс-коксовскими. Получается, что значимые эффекты в сложной таблице результатов ДА не удаётся подкрепить графически, кроме как в никому непонятной шкале преобразования Бокса-Кокса.
(4) столь любимые иммунологами коробчатые графики (box-and-whiskers plot) не позволяют интерпретировать межгрупповые различия. А учитывая, что разные программы используют разные пороги для отнесения наблюдений к выбросам (причём для нормального распределения, что заведомо неверно) - вообще непонятно что на этих графиках изображается усами, а что выбросами. Причём авторитетных авторов статей это вообще никак не беспокоит. Вместе с тем логичные для таких данных графики с медианами и 95%-ными ДИ для медиан вообще не используются. Хотелось бы совместить на одном графике: медиану (линия), межквартильный размах (короб) и 95%-ные ДИ для медианы (усы), можно даже вручную, но не смог найти программу, где эти показатели для box-and-whiskers plot можно было бы задать вручную (мой любимый KyPlot не строит коробчатые графики:(( )

Позже выложу здесь 3 статьи по статистике в иммунологии (пока это только отвлечёт от описанных проблем), а также поделюсь нашими наработками по приведению иммунологической статистики к единообразному виду - пока на основе порядковых статистик, включая малоизвестные множественные сравнения в рамках непараметрических дисперсионных анализов Краскела-Уоллиса и Фридмана (могу с собранными формулами и примером). А позже хотелось бы обсудить ещё подход с бутстрепом.

Сообщение отредактировал nokh - 12.02.2011 - 10:21
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Yngi
сообщение 14.02.2011 - 20:28
Сообщение #2





Группа: Пользователи
Сообщений: 5
Регистрация: 19.12.2010
Пользователь №: 23055



Да в иммунологии можно пользоваться относительными величинами, но в педиатрической иммунологии лучше пользоваться абсолютными величинами (например, количество Т-клеток и т.д.). К тому же нет нормального распределения этих величин. В иностранной лит-ре отдельно описываются выбросы, медиана и квартили. Интерпретировать многочисленные данные сложно. Так и непонятно, нужно ли применять поправку Бонферони при сравнении нескольких групп?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 14.02.2011 - 22:57
Сообщение #3





Группа: Пользователи
Сообщений: 1218
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Цитата(Yngi @ 14.02.2011 - 22:28) *
Да в иммунологии можно пользоваться относительными величинами, но в педиатрической иммунологии лучше пользоваться абсолютными величинами (например, количество Т-клеток и т.д.). К тому же нет нормального распределения этих величин. В иностранной лит-ре отдельно описываются выбросы, медиана и квартили.

Это из проблемы (4). В том то всё и дело, что часто ничего не описывают - дают то, что строит программа. А вариантов коробочных графиков много. Их ввёл в употребление в 1977 году Джон Тьюки. При этом в качестве выбросов он рассматривал значения, отстоящие от нижней и верхней квартилей на 1,5 расстояния межквартильного размаха. Почему на 1,5 - не понятно, так ему нравилось. Часть программ закладывает по умолчанию это число, и в качестве усов дают мин-макс без этих "выбросов". В каких-то дополнительно обозначаются некие "дикие" выбросы (wild outliers). Другие программы предлагают в качестве усов разные процентили или мин-макс. Поскольку толку от всех этих значений вообще нет, а 95%-ные ДИ для медиан программы не строят, мы пришли к такой форме ящика, в котором усами обозначаем просто минимум и максимум - это по крайней мере понятно и однозначно. А вообще, использование в качестве описательной статистики - порядковой статистики мне не очень нравится. Хотя пока на ней и остановились. Допустим есть 3 числа: 55, 56 и 560. Согласитесь, что это не 1, 2 и 3 как будет в порядковой статистике. Т.е. информация если в пределе и не искажается, то теряется. Поэтому и хочу обсудить и другие подходы к описанию данных, в частности - преобразования и бутстреп.
Цитата(Yngi @ 14.02.2011 - 22:28) *
Интерпретировать многочисленные данные сложно. Так и непонятно, нужно ли применять поправку Бонферони при сравнении нескольких групп?

А с поправкой Бонферрони в принципе всё ясно. Если исследователю неизвестны/недоступны более мощные варианты для множественных сравнений - сойдёт и Бонферрони. Но лично я в последнее время рассматриваю использование этой поправки скорее в качестве маркёра недостаточной квалификации исследователя. Конечно с исключениями. Но зачем сравнивать группы методами, разработанными для 2 групп, когда групп - несколько? При таком подходе, во-первых, используется только часть имеющейся информации (не используются данные о других группах), а значит идёт потеря в мощности теста. Во-вторых, результаты даже такого неоптимального сравнения дополнительно подвергаются ограничению по Бонферрони. Т.е. идёт двойная потеря мощности. Правильный подход - использование омнибусного теста с последующими попарными сравнениями внутри него . Омнибусный тест проверяет весь набор ("омнибус") простых гипотез одновременно.
Но дело в том, что достаточно часто применяют такую непараметрическую схему: сначала все группы сравнивают по Краскелу-Уоллису, а потом ищут попарные различия по Манну-Уитни, в т.ч. с поправкой Бонферрони. А это неправильно, хотя такой подход распространён. В частности одна из любимых мной программ PAST выдаёт результаты сравнений по Манну-Уитни в модуле Краскела-Уоллиса именно в качестве апостериорного (post-hoc) критерия. Но ведь если в качестве параметрического омнибусного теста используется дисперсионный анализ никто не ищет затем попарные различия t-критерием Стьдента, все используют специализированные методы множественных сравнений. Аналогичные методы есть и для случая использования в качестве непараметрического омнибусного теста критерия Краскела-Уоллиса. Это методы: Conover-Inman (ранговый аналог Fisher's LSD), Steel-Dwass (ранговый аналог Tukey's HSD), Schaich-Hamerle и пара-тройка ещё менее распространённых. Как написал выше, формулы я собрал, но пока нет времени привести всё в законченный вид. Приведу - выложу здесь. Т.е. грамотно считать так: сначала Краскел-Уоллис, а если различия есть - выясняем за счёт каких пар с помощью множественных сравнений внутри теста Краскела-Уоллиса.

Сообщение отредактировал nokh - 14.02.2011 - 23:23
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- nokh   Статистика в иммунологии:   12.02.2011 - 10:20
- - Yngi   Да в иммунологии можно пользоваться относительными...   14.02.2011 - 20:28
|- - nokh   Цитата(Yngi @ 14.02.2011 - 22:28) Да...   14.02.2011 - 22:57
- - DrgLena   Цитата(nokh @ 14.02.2011 - 22:57) А ...   15.02.2011 - 17:04
- - TheThing   Цитата(nokh @ 14.02.2011 - 22:57) Но...   21.02.2011 - 11:08
- - nokh   Цитата(TheThing @ 21.02.2011 - 13:08...   1.03.2011 - 05:46
- - nokh   3 статьи по статистике в иммунологии за 1992, 1997...   2.03.2011 - 12:23
|- - maxandron   Цитата(nokh @ 2.03.2011 - 12:23) 3 с...   24.09.2014 - 13:27
|- - nokh   Цитата(maxandron @ 24.09.2014 - 16:2...   24.09.2014 - 17:54
|- - maxandron   Цитата(nokh @ 24.09.2014 - 17:54) Хо...   26.09.2014 - 02:13
|- - bubnilkin   Цитата(nokh @ 24.09.2014 - 17:54) Хо...   13.09.2015 - 01:25
|- - nokh   Цитата(bubnilkin @ 13.09.2015 - 03:2...   14.09.2015 - 18:28
|- - p2004r   Цитата(nokh @ 14.09.2015 - 18:28) Ещ...   14.09.2015 - 20:54
|- - bubnilkin   Цитата(nokh @ 14.09.2015 - 18:28) .....   15.09.2015 - 16:35
|- - nokh   Цитата(bubnilkin @ 15.09.2015 - 18:3...   21.09.2015 - 09:35
- - bubnilkin   далеко от темы... http://onlinelibrary.wiley.com/...   9.09.2011 - 12:50
- - anserovtv   Считаю, что статистический анализ специфических да...   15.09.2015 - 21:28


Добавить ответ в эту темуОткрыть тему