Здравствуйте, гость ( Вход | Регистрация )
6.07.2010 - 15:13
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 2.07.2010 Пользователь №: 22590 |
Уважаемые участники форума, добрый день!
-- Краткая версия вопроса. Работа in vitro на клеточной линии, результаты теста снимаются спектрофотометрически в лунках планшета, каждое измерение тройное (3 лунки на одну концентрацию вещества). Можно ли применять параметрическую статистику для описания результатов, и проверки гипотез? Противоречие в том, что теоретически распределение должно быть нормальным и можно пользоваться параметрической статистикой (я склонен к ней); но практически в каждой группе всего три измерения и мне рекомендуют использовать непараметрику. -- Развернутая версия вопроса. Я зарегистрировался здесь, потому что очень важные детали для себя нашел в обсуждении темы: http://forum.disser.ru/index.php?showtopic...%EE%F7%ED%FB%E5 Несмотря на то, что я в аспирантуре по биологической тематике, моя "математическая" проблема очень близка. В теме обсуждается то, когда стоит применять параметрическую, а когда непараметрическую статистику. У меня с моими коллегами и руководителями нет единого мнения по данному вопросу, поэтому надеюсь на помощь профессионалов. Сразу предупреждаю, я создаю длинный пост не для того, чтобы всех утомить, а так как, чтобы дать квалифицированный ответ могут понадобиться детали. Вот их я и привожу. Если детали не интересуют, то кратко вопрос я уже изложил. Итак, задача. Я работаю с клеточной линией фибробластов легкого эмбриона человека, культура гомогенна, сохраняет свойства и фенотип при пересеве порядка 40-50 пассажей. Для экспериментов высеваю по 10 000 клеток в лунку 96-луночного планшета. Исследуется влияние 2 веществ в разных концентрациях на жизнеспособность клеток при помощи МТТ теста. Суть его в том, что живые клетки способны восстанавливать соединение МТТ, что приводит к образованию в клетках окрашенных кристаллов. После растворения кристаллов оптическая плотность раствора позволяет судить об уровне жизнеспособности клеток в культуре. (Жизнеспособность здесь - интегральный параметр, позволяющий оценить скорость роста культуры, гибель клеток в ней, если таковая присутствует, а также уровень метаболической активности). Каждая концентрация тестируется в трех лунках 96-луночного планшета, и между этими лунками сходимость высокая. В результате получаются значения ОП, к примеру 0,837 0,859 0,793 в контроле и 0,435 0,482 0,455 в опыте, которые нужно сравнить. Отступление по поводу статистического анализа МТТ теста в статьях. В литературе я встречал анализ результатов этого теста как с помощью параметрической статистики, так и непараметрической. Статистическую обработку результатов проводят как при помощи t-критерия Стьюдента, так и с использованием U-критерия Уилкоксона-Манна-Уитни. Если необходимо сравнивать все группы между собой, в случае методов параметрической статистики используют дисперсионный анализ или вместе с t-тестом применяют поправку Бонферрони; в случае методов непараметрической статистики применяют критерий Краскела-Уоллиса. Расхождение в подходах, видимо, связано с тем, что в соответствии с теоретическими предпосылками распределения значений оптического поглощения в исследуемых группах должны быть нормальными, однако в силу малых выборок (обычно 3 лунки в одном планшете) это не доказуемо . Для получения более надежных данных исследования повторяют, но в повторяемость результатов для МТТ теста признается низкой. Мало того, некоторые работы указывают, что у них распределение не было нормальным, что они проверяли по критерию Колмогорова-Смирнова. Но, конечно, как они это делали - не указано. Если они брали 3 измерения, то очевидно, никакой нормальности там быть не могло. В экспериментах на разных планшетах повторяемость не идеальна. Внутри одного планшета - хорошая. (как указано в литературе, различия больше всего обусловлены неравномерным посевом клеток). Доверительные интервалы для измерений чаще всего в пределах 5% от абсолютной величины оптической плотности, соответственно я считаю выборку репрезентативной (высокая гомогенность), и считаю, что повтора достаточно одного. Результаты по повтору должны давать близкие значения, но их, на мой взгляд, не следует сливать в одну группу с первичными. (у них отличаются и среднее значение, и дисперсия, что не удивительно). В результатах собираюсь приводить только расчет статистических параметров только для одного из экспериментов. Сейчас я рассчитываю среднее значение, стандартное отклонение и доверительный интервал в MS Excel функциями "СРЗНАЧ", "СТАНДОТКЛОН", и "ДОВЕРИТ" для отображения на графиках. Для проверки гипотез о достоверности различий между группами я собираюсь делать так. Подключив пакет "статистика" в Excel воспользоваться анализом данных "Двухвыборочный t-тест с одинаковыми дисперсиями", затем при значении t-статистики больше t критического двустороннего, считать, что есть достоверные различия (при уровне статистической значимости 0,05). В противном случае, так не считать; различия, если они просматриваются, считать не достоверными. Поправку Бонферрони я применять не собираюсь, у меня всего 2 вещества в 6 концентрациях, сравнивать буду результаты контроля и концентраций, при которых заметны различия. По большому счету интересно лишь парное сравнение с минимальной действующей концентрацией. Мне же говорят, что нужно пользоваться непараметрической статистикой, так как образцов меньше 30. Плюс к этому с меня просят минимум 2 повтора (итого 9 измерений), и если я все верно понял, то слить группы измерений в разных планшетах. Возможно мне следует сделать 30 одинаковых контролей и проверить распределение на нормальность? Или нужно 30 опытных образцов? Позволит ли это применять параметрическую статистику? Главный вопрос - кто прав в этом споре? Каким критерием правильнее всего пользоваться? Есть ли ссылки на соответствующую литературу, где содержался бы разбор такого случая? Я разбираюсь с этим уже 3 дня и самое релевантное, что я нашел - давнее обсуждение здесь на форуме. Очень прошу помочь! Хочется понять, как же делать правильно и почему. С уважением, Сергей |
|
|
![]() |
![]() |
![]() |
13.08.2010 - 09:47
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 2.07.2010 Пользователь №: 22590 |
nokh, огромное Вам спасибо за анализ!
плав, я наверное не способен вполне оценить Ваши комментарии, но пытаюсь, тоже спасибо )) В тему я не писал, так как возникли более неотложные задачи, в связи с чем я решил обработать результаты несколько позже - для меня это действительно длительный процесс, так как во многое надо вникать "с нуля". Я очень признателен nokh, совершенно не ожидал такого подробного разбора и понятного объяснения! Постараюсь поскорее завершить работу, связанную с этими результатами, правда после отпуска. (а значит только в сентябре) Как будут выглядеть мой сокращенный вариант обсуждения результатов - обязательно в итоге выложу! Еще раз спасибо, чувствую себя у Вас в долгу. Если я могу как-то со своей стороны быть полезен, то, пожалуйста, скажите! Обязательно всем знакомым посоветую ваш форум! (Я ведь верно понял, что Вы имеете к нему прямое отношение?) Удачи во всем! -- Не по основной теме, в основном к nokh -- Кстати, мне кажется, что очень близкий подход к обработке результатов должен присутствовать в обоих очень и очень распространенных методах (как в билогии, так и в медицине) - реал-тайм ПЦР и ИФА. В обоих случаях анализы проводят в планшетах, в обоих случаях внутри планшета есть повторы, и есть повтор эксперимента целиком. (Если все по-честному, то это самый минимальный набор данных). В обоих случаях методы регистрации высокопроизводительные и точные - многоканальные спектрофотометры/флуориметры/ приборы для измерения люминесценции. Да и еще есть ОГРОМНОЕ количество тестов/китов, рассчитанных на подобную схему получения результатов (кроме RT-PCR и ELISA). И тесты, подобные МТТ, и количественное окрашивание белков - много всего. Только вот в статьях внятного руководства, как в современных программах корректно статистически обработать подобные данные - я не нашел. Ни в Statistica, ни в SPSS. В отношении первой программы я у них и на сайте поискал, так как решил с нее начать. Поискал и не нашел. В книгах зачастую ситуация такая - в первую очередь описан метод, а потом во вторую очередь, где и как его можно применить. И оглавления обычно построены таким же образом. Но тот, кому нужно сделать анализ - он же ищет исходя из того, какой был у него план исследования, какой метод, какие перед ним стоят вопросы. По "статистике" я скачал 2 книги - Владимира Боровикова "Искусство анализа данных на компьютере" и О.Ю. Ребровой "Статистический анализ медицинских данных". Может быть мне не хватило терпения найти то, что мне было нужно, но после этих книг я все-таки обратился на форум. И надо сказать (возможно, это я плохо искал, или не умело), что и в англоязычной литературе ничего внятного по поводу того, как "правильно анализировать результаты ИФА" я не нашел (искал по подобным ключевым словам). Вот пример поиска - и результаты, которые совершенно не соответствуют предмету поиска: http://scholar.google.com/scholar?q=ELISA+...&as_sdtp=on (А ключевых слов я перебрал много. На русском языке - тоже ничего не нашел подходящего.) К чему я веду? Мне кажется, что анализ, подобный вашему, очень небольшой процент медиков или биологов смогут догадаться/суметь сделать самостоятельно. К тому же времени на то, чтобы разобраться - надо очень много. Возможно, поэтому они и идут на "компромиссные варианты". Каких только критериев не увидишь - я был очень удивлен. Так вот, мне кажется, что если Вы занимаетесь научной или образовательной работой, то было бы классно, если бы Вы написали статью (или две) о том, как сегодня наиболее корректно обработать подобные результаты в современных программах. По-моему (а я очень старался такую найти) таких статей нет. Думаю, это очень востребовано в научном сообществе, и хороший журнал бы обязательно взял такую работу, потому что она бы использовалась и хорошо цитировалась. (Конечно, если она была бы в англоязычном журнале, легко находилась через Google Scholar, и бесплатно скачивалась). А главное - была бы полезна, актуальна. Это мое личное мнение, конечно. Буду рад критике этой идеи, если я в чем-то неправ. П.С. Что касается вопросов востребованности подобной работы в современных биологии и медицине - в этой теме я мог бы даже попробовать помочь, если Вы математик и не очень с этим пересекаетесь. Тогда и на английский мог бы перевести (как раз подрабатываю переводчиком статей на английский). -- |
|
|
![]() |
![]() |
27.08.2010 - 20:15
Сообщение
#3
|
|
|
Группа: Пользователи Сообщений: 1219 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
К сожалению статьёй или двумя не обойтись, чтобы покрыть пробелы в нашем образовании. Что касается классических экспериментов и их анализа различными вариантами дисперсионного анализа, то всё уже давно написано и частично переведено. В принципе одного учебника Монтгомери хватит чтобы научиться планировать эксперименты, рассчитывать математические ожидаемые для средних квадратов, получать формулы для расчёта эффектов и их взаимодействий, рассчитывать компоненты дисперсии. А с компьютерной программой нужно только найти что где есть и есть ли. С несбалансированными, неполными комплексами и GLM намного хуже, но хуже везде: читал английские статьи по грамотному анализу микрочиповых экспериментов - тяжеловато, сомневаюсь что рядовые исследователи всё поймут и кинутся считать как нужно.
Ещё важно отметить, что жёсткий, шаблонный анализ результатов пусть даже таких стандартных методов как ИФА может представлять сложности. Если бы нужное нам взаимодействие факторов оказалось статистически незначимым - нужно было бы ориентироваться по ходу что и как. Возможно было использовать и регрессионный подход - как написал плав - но с ним тоже мороки много и неизвестно окупятся ли эти трудозатраты выигрышем в мощности. Короче, возможны варианты, а описать можно только начало - по сути о лишь о выборе адекватной модели анализа. |
|
|
![]() |
![]() |
Sergey.Pustylnikov Работа с клетками. Выбор статистических методов 6.07.2010 - 15:13
DoctorStat Цитата(Sergey.Pustylnikov @ 6.07.2010 - ... 6.07.2010 - 22:34
nokh Ваш эксперимент невозможно обработать непараметрич... 8.07.2010 - 07:06
Sergey.Pustylnikov Спасибо за рекомендации. Буду читать и думать. При... 8.07.2010 - 07:54
nokh Цитата(Sergey.Pustylnikov @ 8.07.2010 - ... 11.07.2010 - 07:02
плав 1) Если распределение теоретически нормальное, над... 13.07.2010 - 17:18
Sergey.Pustylnikov Спасибо за помощь!
Я как всегда пишу длинно ... 15.07.2010 - 14:25
nokh Впервые слышу, что малые выборки нужно обсчитывать... 16.07.2010 - 05:49
Sergey.Pustylnikov nokh, спасибо за ответ и предложение!
Я совер... 16.07.2010 - 13:58
DrgLena Поскольку есть конкретные вопросы, то и анализ мож... 18.07.2010 - 20:08
Sergey.Pustylnikov DrgLena, большое спасибо за ответ!
Мне сначал... 19.07.2010 - 08:08
DrgLena Цитата(Sergey.Pustylnikov @ 19.07.2010 ... 19.07.2010 - 09:45
Sergey.Pustylnikov DrgLena, спасибо за подсказку про анализ по услови... 20.07.2010 - 07:43
DrgLena Честно говоря, я не поняла вашей идеи, проверять н... 20.07.2010 - 09:52
nokh Модель оказалась проще чем мне показалось сначала ... 6.08.2010 - 13:42
nokh Свой вариант анализа прилагаю. Критика приветствуе... 10.08.2010 - 12:16
плав Цитата(nokh @ 10.08.2010 - 13:16) Св... 10.08.2010 - 12:47
nokh Спасибо за комментарии! Про либеральность орто... 10.08.2010 - 13:56
плав Цитата(nokh @ 10.08.2010 - 14:56) Пр... 10.08.2010 - 20:22![]() ![]() |