Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Работа с клетками. Выбор статистических методов, Теоретически распределение нормальное, на практике выборки малые
Sergey.Pustylnik...
сообщение 6.07.2010 - 15:13
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 2.07.2010
Пользователь №: 22590



Уважаемые участники форума, добрый день!

--
Краткая версия вопроса.

Работа in vitro на клеточной линии, результаты теста снимаются спектрофотометрически в лунках планшета,
каждое измерение тройное (3 лунки на одну концентрацию вещества). Можно ли применять параметрическую
статистику для описания результатов, и проверки гипотез? Противоречие в том, что теоретически
распределение должно быть нормальным и можно пользоваться параметрической статистикой (я склонен к ней);
но практически в каждой группе всего три измерения и мне рекомендуют использовать непараметрику.

--
Развернутая версия вопроса.

Я зарегистрировался здесь, потому что очень важные детали для себя нашел в обсуждении темы:
http://forum.disser.ru/index.php?showtopic...%EE%F7%ED%FB%E5
Несмотря на то, что я в аспирантуре по биологической тематике, моя "математическая" проблема очень близка.
В теме обсуждается то, когда стоит применять параметрическую, а когда непараметрическую статистику.
У меня с моими коллегами и руководителями нет единого мнения по данному вопросу, поэтому надеюсь на
помощь профессионалов.

Сразу предупреждаю, я создаю длинный пост не для того, чтобы всех утомить,
а так как, чтобы дать квалифицированный ответ могут понадобиться детали.
Вот их я и привожу. Если детали не интересуют, то кратко вопрос я уже изложил.

Итак, задача.
Я работаю с клеточной линией фибробластов легкого эмбриона человека, культура гомогенна,
сохраняет свойства и фенотип при пересеве порядка 40-50 пассажей.
Для экспериментов высеваю по 10 000 клеток в лунку 96-луночного планшета.
Исследуется влияние 2 веществ в разных концентрациях на жизнеспособность клеток
при помощи МТТ теста. Суть его в том, что живые клетки способны восстанавливать соединение МТТ,
что приводит к образованию в клетках окрашенных кристаллов. После растворения кристаллов
оптическая плотность раствора позволяет судить об уровне жизнеспособности клеток в культуре.
(Жизнеспособность здесь - интегральный параметр, позволяющий оценить скорость роста культуры,
гибель клеток в ней, если таковая присутствует, а также уровень метаболической активности).
Каждая концентрация тестируется в трех лунках 96-луночного планшета, и между этими лунками сходимость высокая.
В результате получаются значения ОП, к примеру 0,837 0,859 0,793 в контроле и 0,435 0,482 0,455 в опыте,
которые нужно сравнить.

Отступление по поводу статистического анализа МТТ теста в статьях.
В литературе я встречал анализ результатов этого теста как с помощью параметрической статистики, так и непараметрической.
Статистическую обработку результатов проводят как при помощи t-критерия Стьюдента,
так и с использованием U-критерия Уилкоксона-Манна-Уитни. Если необходимо сравнивать все группы между собой,
в случае методов параметрической статистики используют дисперсионный анализ или вместе с t-тестом применяют поправку Бонферрони;
в случае методов непараметрической статистики применяют критерий Краскела-Уоллиса. Расхождение в подходах, видимо, связано с тем,
что в соответствии с теоретическими предпосылками распределения значений оптического поглощения в исследуемых группах должны
быть нормальными, однако в силу малых выборок (обычно 3 лунки в одном планшете) это не доказуемо . Для получения более надежных
данных исследования повторяют, но в повторяемость результатов для МТТ теста признается низкой. Мало того, некоторые работы
указывают, что у них распределение не было нормальным, что они проверяли по критерию Колмогорова-Смирнова. Но, конечно, как
они это делали - не указано. Если они брали 3 измерения, то очевидно, никакой нормальности там быть не могло.


В экспериментах на разных планшетах повторяемость не идеальна. Внутри одного планшета - хорошая.
(как указано в литературе, различия больше всего обусловлены неравномерным посевом клеток).
Доверительные интервалы для измерений чаще всего в пределах 5% от абсолютной величины оптической плотности,
соответственно я считаю выборку репрезентативной (высокая гомогенность), и считаю, что повтора достаточно одного.
Результаты по повтору должны давать близкие значения, но их, на мой взгляд, не следует сливать в одну группу с первичными.
(у них отличаются и среднее значение, и дисперсия, что не удивительно).
В результатах собираюсь приводить только расчет статистических параметров только для одного из экспериментов.

Сейчас я рассчитываю среднее значение, стандартное отклонение и доверительный интервал в MS Excel функциями
"СРЗНАЧ", "СТАНДОТКЛОН", и "ДОВЕРИТ" для отображения на графиках.
Для проверки гипотез о достоверности различий между группами я собираюсь делать так.
Подключив пакет "статистика" в Excel воспользоваться анализом данных
"Двухвыборочный t-тест с одинаковыми дисперсиями", затем при значении t-статистики больше
t критического двустороннего, считать, что есть достоверные различия (при уровне статистической значимости 0,05).
В противном случае, так не считать; различия, если они просматриваются, считать не достоверными.
Поправку Бонферрони я применять не собираюсь, у меня всего 2 вещества в 6 концентрациях,
сравнивать буду результаты контроля и концентраций, при которых заметны различия.
По большому счету интересно лишь парное сравнение с минимальной действующей концентрацией.

Мне же говорят, что нужно пользоваться непараметрической статистикой, так как образцов меньше 30.
Плюс к этому с меня просят минимум 2 повтора (итого 9 измерений), и если я все верно понял, то слить группы
измерений в разных планшетах.
Возможно мне следует сделать 30 одинаковых контролей и проверить распределение на нормальность?
Или нужно 30 опытных образцов? Позволит ли это применять параметрическую статистику?

Главный вопрос - кто прав в этом споре? Каким критерием правильнее всего пользоваться?
Есть ли ссылки на соответствующую литературу, где содержался бы разбор такого случая?
Я разбираюсь с этим уже 3 дня и самое релевантное, что я нашел - давнее обсуждение здесь на форуме.

Очень прошу помочь! Хочется понять, как же делать правильно и почему.

С уважением,
Сергей
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
Sergey.Pustylnik...
сообщение 13.08.2010 - 09:47
Сообщение #2





Группа: Пользователи
Сообщений: 7
Регистрация: 2.07.2010
Пользователь №: 22590



nokh, огромное Вам спасибо за анализ!

плав, я наверное не способен вполне оценить
Ваши комментарии, но пытаюсь, тоже спасибо ))

В тему я не писал, так как возникли более
неотложные задачи, в связи с чем я решил
обработать результаты несколько позже -
для меня это действительно длительный
процесс, так как во многое надо вникать "с нуля".

Я очень признателен nokh, совершенно не ожидал такого
подробного разбора и понятного объяснения!
Постараюсь поскорее завершить работу,
связанную с этими результатами, правда после отпуска.
(а значит только в сентябре)

Как будут выглядеть мой сокращенный вариант
обсуждения результатов - обязательно в итоге выложу!

Еще раз спасибо, чувствую себя у Вас в долгу.
Если я могу как-то со своей стороны быть полезен,
то, пожалуйста, скажите!
Обязательно всем знакомым посоветую ваш
форум! (Я ведь верно понял, что Вы имеете к нему
прямое отношение?)

Удачи во всем!

-- Не по основной теме, в основном к nokh --

Кстати, мне кажется, что очень близкий подход к обработке
результатов должен присутствовать в обоих очень и очень
распространенных методах (как в билогии, так и в медицине) -
реал-тайм ПЦР и ИФА. В обоих случаях анализы
проводят в планшетах, в обоих случаях внутри
планшета есть повторы, и есть повтор эксперимента целиком.
(Если все по-честному, то это самый минимальный набор данных).
В обоих случаях методы регистрации высокопроизводительные
и точные - многоканальные спектрофотометры/флуориметры/
приборы для измерения люминесценции.
Да и еще есть ОГРОМНОЕ количество тестов/китов, рассчитанных
на подобную схему получения результатов (кроме RT-PCR и ELISA).
И тесты, подобные МТТ, и количественное окрашивание белков - много всего.

Только вот в статьях внятного руководства, как в современных
программах корректно статистически обработать
подобные данные - я не нашел. Ни в Statistica, ни в SPSS.
В отношении первой программы я у них и на сайте поискал,
так как решил с нее начать. Поискал и не нашел.

В книгах зачастую ситуация такая - в первую очередь описан метод,
а потом во вторую очередь, где и как его можно применить.
И оглавления обычно построены таким же образом.
Но тот, кому нужно сделать анализ - он же ищет исходя
из того, какой был у него план исследования,
какой метод, какие перед ним стоят вопросы.
По "статистике" я скачал 2 книги -
Владимира Боровикова "Искусство анализа данных
на компьютере" и О.Ю. Ребровой "Статистический
анализ медицинских данных". Может быть мне не
хватило терпения найти то, что мне было нужно, но
после этих книг я все-таки обратился на форум.
И надо сказать (возможно, это я плохо искал, или не умело),
что и в англоязычной литературе ничего внятного по поводу
того, как "правильно анализировать результаты ИФА" я
не нашел (искал по подобным ключевым словам).
Вот пример поиска - и результаты, которые совершенно не соответствуют предмету поиска:

http://scholar.google.com/scholar?q=ELISA+...&as_sdtp=on
(А ключевых слов я перебрал много. На русском языке - тоже ничего не нашел подходящего.)

К чему я веду? Мне кажется, что анализ, подобный вашему,
очень небольшой процент медиков или биологов
смогут догадаться/суметь сделать самостоятельно.
К тому же времени на то, чтобы разобраться - надо очень много.
Возможно, поэтому они и идут на "компромиссные варианты".
Каких только критериев не увидишь - я был очень удивлен.

Так вот, мне кажется, что если Вы занимаетесь научной
или образовательной работой, то было бы классно, если
бы Вы написали статью (или две) о том, как сегодня наиболее корректно
обработать подобные результаты в современных программах.
По-моему (а я очень старался такую найти) таких статей нет.
Думаю, это очень востребовано в научном сообществе,
и хороший журнал бы обязательно взял такую работу,
потому что она бы использовалась и хорошо цитировалась.
(Конечно, если она была бы в англоязычном журнале, легко
находилась через Google Scholar, и бесплатно скачивалась).
А главное - была бы полезна, актуальна. Это мое личное мнение, конечно.
Буду рад критике этой идеи, если я в чем-то неправ.

П.С. Что касается вопросов востребованности подобной работы в современных
биологии и медицине - в этой теме я мог бы даже попробовать помочь, если Вы
математик и не очень с этим пересекаетесь. Тогда и на английский мог бы перевести
(как раз подрабатываю переводчиком статей на английский).
--
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- Sergey.Pustylnikov   Работа с клетками. Выбор статистических методов   6.07.2010 - 15:13
- - DoctorStat   Цитата(Sergey.Pustylnikov @ 6.07.2010 - ...   6.07.2010 - 22:34
- - nokh   Ваш эксперимент невозможно обработать непараметрич...   8.07.2010 - 07:06
- - Sergey.Pustylnikov   Спасибо за рекомендации. Буду читать и думать. При...   8.07.2010 - 07:54
|- - nokh   Цитата(Sergey.Pustylnikov @ 8.07.2010 - ...   11.07.2010 - 07:02
|- - плав   1) Если распределение теоретически нормальное, над...   13.07.2010 - 17:18
- - Sergey.Pustylnikov   Спасибо за помощь! Я как всегда пишу длинно ...   15.07.2010 - 14:25
|- - nokh   Впервые слышу, что малые выборки нужно обсчитывать...   16.07.2010 - 05:49
- - Sergey.Pustylnikov   nokh, спасибо за ответ и предложение! Я совер...   16.07.2010 - 13:58
- - DrgLena   Поскольку есть конкретные вопросы, то и анализ мож...   18.07.2010 - 20:08
- - Sergey.Pustylnikov   DrgLena, большое спасибо за ответ! Мне сначал...   19.07.2010 - 08:08
- - DrgLena   Цитата(Sergey.Pustylnikov @ 19.07.2010 ...   19.07.2010 - 09:45
- - Sergey.Pustylnikov   DrgLena, спасибо за подсказку про анализ по услови...   20.07.2010 - 07:43
- - DrgLena   Честно говоря, я не поняла вашей идеи, проверять н...   20.07.2010 - 09:52
- - nokh   Модель оказалась проще чем мне показалось сначала ...   6.08.2010 - 13:42
- - nokh   Свой вариант анализа прилагаю. Критика приветствуе...   10.08.2010 - 12:16
|- - плав   Цитата(nokh @ 10.08.2010 - 13:16) Св...   10.08.2010 - 12:47
|- - nokh   Спасибо за комментарии! Про либеральность орто...   10.08.2010 - 13:56
|- - плав   Цитата(nokh @ 10.08.2010 - 14:56) Пр...   10.08.2010 - 20:22
- - Sergey.Pustylnikov   nokh, огромное Вам спасибо за анализ! плав, я...   13.08.2010 - 09:47
- - nokh   К сожалению статьёй или двумя не обойтись, чтобы п...   27.08.2010 - 20:15


Добавить ответ в эту темуОткрыть тему