Здравствуйте, гость ( Вход | Регистрация )
6.07.2010 - 15:13
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 2.07.2010 Пользователь №: 22590 |
Уважаемые участники форума, добрый день!
-- Краткая версия вопроса. Работа in vitro на клеточной линии, результаты теста снимаются спектрофотометрически в лунках планшета, каждое измерение тройное (3 лунки на одну концентрацию вещества). Можно ли применять параметрическую статистику для описания результатов, и проверки гипотез? Противоречие в том, что теоретически распределение должно быть нормальным и можно пользоваться параметрической статистикой (я склонен к ней); но практически в каждой группе всего три измерения и мне рекомендуют использовать непараметрику. -- Развернутая версия вопроса. Я зарегистрировался здесь, потому что очень важные детали для себя нашел в обсуждении темы: http://forum.disser.ru/index.php?showtopic...%EE%F7%ED%FB%E5 Несмотря на то, что я в аспирантуре по биологической тематике, моя "математическая" проблема очень близка. В теме обсуждается то, когда стоит применять параметрическую, а когда непараметрическую статистику. У меня с моими коллегами и руководителями нет единого мнения по данному вопросу, поэтому надеюсь на помощь профессионалов. Сразу предупреждаю, я создаю длинный пост не для того, чтобы всех утомить, а так как, чтобы дать квалифицированный ответ могут понадобиться детали. Вот их я и привожу. Если детали не интересуют, то кратко вопрос я уже изложил. Итак, задача. Я работаю с клеточной линией фибробластов легкого эмбриона человека, культура гомогенна, сохраняет свойства и фенотип при пересеве порядка 40-50 пассажей. Для экспериментов высеваю по 10 000 клеток в лунку 96-луночного планшета. Исследуется влияние 2 веществ в разных концентрациях на жизнеспособность клеток при помощи МТТ теста. Суть его в том, что живые клетки способны восстанавливать соединение МТТ, что приводит к образованию в клетках окрашенных кристаллов. После растворения кристаллов оптическая плотность раствора позволяет судить об уровне жизнеспособности клеток в культуре. (Жизнеспособность здесь - интегральный параметр, позволяющий оценить скорость роста культуры, гибель клеток в ней, если таковая присутствует, а также уровень метаболической активности). Каждая концентрация тестируется в трех лунках 96-луночного планшета, и между этими лунками сходимость высокая. В результате получаются значения ОП, к примеру 0,837 0,859 0,793 в контроле и 0,435 0,482 0,455 в опыте, которые нужно сравнить. Отступление по поводу статистического анализа МТТ теста в статьях. В литературе я встречал анализ результатов этого теста как с помощью параметрической статистики, так и непараметрической. Статистическую обработку результатов проводят как при помощи t-критерия Стьюдента, так и с использованием U-критерия Уилкоксона-Манна-Уитни. Если необходимо сравнивать все группы между собой, в случае методов параметрической статистики используют дисперсионный анализ или вместе с t-тестом применяют поправку Бонферрони; в случае методов непараметрической статистики применяют критерий Краскела-Уоллиса. Расхождение в подходах, видимо, связано с тем, что в соответствии с теоретическими предпосылками распределения значений оптического поглощения в исследуемых группах должны быть нормальными, однако в силу малых выборок (обычно 3 лунки в одном планшете) это не доказуемо . Для получения более надежных данных исследования повторяют, но в повторяемость результатов для МТТ теста признается низкой. Мало того, некоторые работы указывают, что у них распределение не было нормальным, что они проверяли по критерию Колмогорова-Смирнова. Но, конечно, как они это делали - не указано. Если они брали 3 измерения, то очевидно, никакой нормальности там быть не могло. В экспериментах на разных планшетах повторяемость не идеальна. Внутри одного планшета - хорошая. (как указано в литературе, различия больше всего обусловлены неравномерным посевом клеток). Доверительные интервалы для измерений чаще всего в пределах 5% от абсолютной величины оптической плотности, соответственно я считаю выборку репрезентативной (высокая гомогенность), и считаю, что повтора достаточно одного. Результаты по повтору должны давать близкие значения, но их, на мой взгляд, не следует сливать в одну группу с первичными. (у них отличаются и среднее значение, и дисперсия, что не удивительно). В результатах собираюсь приводить только расчет статистических параметров только для одного из экспериментов. Сейчас я рассчитываю среднее значение, стандартное отклонение и доверительный интервал в MS Excel функциями "СРЗНАЧ", "СТАНДОТКЛОН", и "ДОВЕРИТ" для отображения на графиках. Для проверки гипотез о достоверности различий между группами я собираюсь делать так. Подключив пакет "статистика" в Excel воспользоваться анализом данных "Двухвыборочный t-тест с одинаковыми дисперсиями", затем при значении t-статистики больше t критического двустороннего, считать, что есть достоверные различия (при уровне статистической значимости 0,05). В противном случае, так не считать; различия, если они просматриваются, считать не достоверными. Поправку Бонферрони я применять не собираюсь, у меня всего 2 вещества в 6 концентрациях, сравнивать буду результаты контроля и концентраций, при которых заметны различия. По большому счету интересно лишь парное сравнение с минимальной действующей концентрацией. Мне же говорят, что нужно пользоваться непараметрической статистикой, так как образцов меньше 30. Плюс к этому с меня просят минимум 2 повтора (итого 9 измерений), и если я все верно понял, то слить группы измерений в разных планшетах. Возможно мне следует сделать 30 одинаковых контролей и проверить распределение на нормальность? Или нужно 30 опытных образцов? Позволит ли это применять параметрическую статистику? Главный вопрос - кто прав в этом споре? Каким критерием правильнее всего пользоваться? Есть ли ссылки на соответствующую литературу, где содержался бы разбор такого случая? Я разбираюсь с этим уже 3 дня и самое релевантное, что я нашел - давнее обсуждение здесь на форуме. Очень прошу помочь! Хочется понять, как же делать правильно и почему. С уважением, Сергей |
|
|
![]() |
![]() |
![]() |
10.08.2010 - 12:16
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Свой вариант анализа прилагаю. Критика приветствуется, но черновик правиться не будет.
Обнаружил ляп: рис. 4 - просто копия рис. 3. Добавил второй вариант с правильным рис. 4. Сообщение отредактировал nokh - 10.08.2010 - 13:28
Прикрепленные файлы
Смешанная_модель_дисперсионного_анализа_в_пакете_Statistica.pdf ( 595,35 килобайт )
Кол-во скачиваний: 1638
Смешанная_модель_дисперсионного_анализа_в_пакете_Statistica.pdf ( 600,89 килобайт )
Кол-во скачиваний: 3475 |
|
|
![]() |
![]() |
10.08.2010 - 12:47
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Свой вариант анализа прилагаю. Критика приветствуется, но черновик правиться не будет. Прекрасное и очень подробное описание. Читать всем! Меня только вот что смущает: 1) Ортогональные контрасты - они известны своей способностью увеличивать ошибку I типа (собственно это ведь не что иное, как аналог t-теста только с общемодельной оценкой дисперсии). В пособии сделано много контрастов - соответственно резко увеличена вероятность ошибки I типа в сравнении с номинальной. 2) В комментариях по поводу post-hoc тестов - их вообще нельзя использовать, если омнибусный тест показал, что средние во всех ячейках одинаковы - это относится не только к LSD, но и к остальным, включая HSD (логика понятна - если суммарный тест говорит, что все одинаково, использование дополнительных тестов похоже на выкручивание рук с целью получить ответ "да"). Поскольку HSD значительно лучше контролирует ошибку I типа (LSD ее просто не контролирует), то соответственно, использование LSD в принципе сомнительно (если только не так, как у Вас описано, для того, чтобы убедиться, что действительно различий между группами нет, но тогда я бы брал не 0,05, а хотя бы 0,2). И еще по поводу множественности сравнений. Поскольку концентрации 1-4 вообще не сильно различаются, надо бы было объединить их в одну группу (вынеся, например, саму концентрацию в случайные факторы - ибо в реальности это - случайный фактор) и сравнивать только две концентрации 1-4 и 5-6. (либо трансформировать переменную отклика и считать концентрации количественной переменной с использованием фактически не ДА, а ANCOVA - судя по картинкам зависимость напоминает экспоненту (1-)). |
|
|
![]() |
![]() |
10.08.2010 - 13:56
Сообщение
#4
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Спасибо за комментарии! Про либеральность ортогональных контрастов не слышал, нужно будет поднимать литературу посовременнее. Несомненно представленный вариант - только вариант, возможны улучшения. С ANCOVA мы разбирались полгода назад, выкладывал подробный материал здесь: http://forum.disser.ru/index.php?showtopic=2154&st=69 . Но включить в ANCOVA случайный фактор "Повторность" не сумею.
|
|
|
![]() |
![]() |
Sergey.Pustylnikov Работа с клетками. Выбор статистических методов 6.07.2010 - 15:13
DoctorStat Цитата(Sergey.Pustylnikov @ 6.07.2010 - ... 6.07.2010 - 22:34
nokh Ваш эксперимент невозможно обработать непараметрич... 8.07.2010 - 07:06
Sergey.Pustylnikov Спасибо за рекомендации. Буду читать и думать. При... 8.07.2010 - 07:54
nokh Цитата(Sergey.Pustylnikov @ 8.07.2010 - ... 11.07.2010 - 07:02
плав 1) Если распределение теоретически нормальное, над... 13.07.2010 - 17:18
Sergey.Pustylnikov Спасибо за помощь!
Я как всегда пишу длинно ... 15.07.2010 - 14:25
nokh Впервые слышу, что малые выборки нужно обсчитывать... 16.07.2010 - 05:49
Sergey.Pustylnikov nokh, спасибо за ответ и предложение!
Я совер... 16.07.2010 - 13:58
DrgLena Поскольку есть конкретные вопросы, то и анализ мож... 18.07.2010 - 20:08
Sergey.Pustylnikov DrgLena, большое спасибо за ответ!
Мне сначал... 19.07.2010 - 08:08
DrgLena Цитата(Sergey.Pustylnikov @ 19.07.2010 ... 19.07.2010 - 09:45
Sergey.Pustylnikov DrgLena, спасибо за подсказку про анализ по услови... 20.07.2010 - 07:43
DrgLena Честно говоря, я не поняла вашей идеи, проверять н... 20.07.2010 - 09:52
nokh Модель оказалась проще чем мне показалось сначала ... 6.08.2010 - 13:42
плав Цитата(nokh @ 10.08.2010 - 14:56) Пр... 10.08.2010 - 20:22
Sergey.Pustylnikov nokh, огромное Вам спасибо за анализ!
плав, я... 13.08.2010 - 09:47
nokh К сожалению статьёй или двумя не обойтись, чтобы п... 27.08.2010 - 20:15![]() ![]() |