![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]() ![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 2.07.2010 Пользователь №: 22590 ![]() |
Уважаемые участники форума, добрый день!
-- Краткая версия вопроса. Работа in vitro на клеточной линии, результаты теста снимаются спектрофотометрически в лунках планшета, каждое измерение тройное (3 лунки на одну концентрацию вещества). Можно ли применять параметрическую статистику для описания результатов, и проверки гипотез? Противоречие в том, что теоретически распределение должно быть нормальным и можно пользоваться параметрической статистикой (я склонен к ней); но практически в каждой группе всего три измерения и мне рекомендуют использовать непараметрику. -- Развернутая версия вопроса. Я зарегистрировался здесь, потому что очень важные детали для себя нашел в обсуждении темы: http://forum.disser.ru/index.php?showtopic...%EE%F7%ED%FB%E5 Несмотря на то, что я в аспирантуре по биологической тематике, моя "математическая" проблема очень близка. В теме обсуждается то, когда стоит применять параметрическую, а когда непараметрическую статистику. У меня с моими коллегами и руководителями нет единого мнения по данному вопросу, поэтому надеюсь на помощь профессионалов. Сразу предупреждаю, я создаю длинный пост не для того, чтобы всех утомить, а так как, чтобы дать квалифицированный ответ могут понадобиться детали. Вот их я и привожу. Если детали не интересуют, то кратко вопрос я уже изложил. Итак, задача. Я работаю с клеточной линией фибробластов легкого эмбриона человека, культура гомогенна, сохраняет свойства и фенотип при пересеве порядка 40-50 пассажей. Для экспериментов высеваю по 10 000 клеток в лунку 96-луночного планшета. Исследуется влияние 2 веществ в разных концентрациях на жизнеспособность клеток при помощи МТТ теста. Суть его в том, что живые клетки способны восстанавливать соединение МТТ, что приводит к образованию в клетках окрашенных кристаллов. После растворения кристаллов оптическая плотность раствора позволяет судить об уровне жизнеспособности клеток в культуре. (Жизнеспособность здесь - интегральный параметр, позволяющий оценить скорость роста культуры, гибель клеток в ней, если таковая присутствует, а также уровень метаболической активности). Каждая концентрация тестируется в трех лунках 96-луночного планшета, и между этими лунками сходимость высокая. В результате получаются значения ОП, к примеру 0,837 0,859 0,793 в контроле и 0,435 0,482 0,455 в опыте, которые нужно сравнить. Отступление по поводу статистического анализа МТТ теста в статьях. В литературе я встречал анализ результатов этого теста как с помощью параметрической статистики, так и непараметрической. Статистическую обработку результатов проводят как при помощи t-критерия Стьюдента, так и с использованием U-критерия Уилкоксона-Манна-Уитни. Если необходимо сравнивать все группы между собой, в случае методов параметрической статистики используют дисперсионный анализ или вместе с t-тестом применяют поправку Бонферрони; в случае методов непараметрической статистики применяют критерий Краскела-Уоллиса. Расхождение в подходах, видимо, связано с тем, что в соответствии с теоретическими предпосылками распределения значений оптического поглощения в исследуемых группах должны быть нормальными, однако в силу малых выборок (обычно 3 лунки в одном планшете) это не доказуемо . Для получения более надежных данных исследования повторяют, но в повторяемость результатов для МТТ теста признается низкой. Мало того, некоторые работы указывают, что у них распределение не было нормальным, что они проверяли по критерию Колмогорова-Смирнова. Но, конечно, как они это делали - не указано. Если они брали 3 измерения, то очевидно, никакой нормальности там быть не могло. В экспериментах на разных планшетах повторяемость не идеальна. Внутри одного планшета - хорошая. (как указано в литературе, различия больше всего обусловлены неравномерным посевом клеток). Доверительные интервалы для измерений чаще всего в пределах 5% от абсолютной величины оптической плотности, соответственно я считаю выборку репрезентативной (высокая гомогенность), и считаю, что повтора достаточно одного. Результаты по повтору должны давать близкие значения, но их, на мой взгляд, не следует сливать в одну группу с первичными. (у них отличаются и среднее значение, и дисперсия, что не удивительно). В результатах собираюсь приводить только расчет статистических параметров только для одного из экспериментов. Сейчас я рассчитываю среднее значение, стандартное отклонение и доверительный интервал в MS Excel функциями "СРЗНАЧ", "СТАНДОТКЛОН", и "ДОВЕРИТ" для отображения на графиках. Для проверки гипотез о достоверности различий между группами я собираюсь делать так. Подключив пакет "статистика" в Excel воспользоваться анализом данных "Двухвыборочный t-тест с одинаковыми дисперсиями", затем при значении t-статистики больше t критического двустороннего, считать, что есть достоверные различия (при уровне статистической значимости 0,05). В противном случае, так не считать; различия, если они просматриваются, считать не достоверными. Поправку Бонферрони я применять не собираюсь, у меня всего 2 вещества в 6 концентрациях, сравнивать буду результаты контроля и концентраций, при которых заметны различия. По большому счету интересно лишь парное сравнение с минимальной действующей концентрацией. Мне же говорят, что нужно пользоваться непараметрической статистикой, так как образцов меньше 30. Плюс к этому с меня просят минимум 2 повтора (итого 9 измерений), и если я все верно понял, то слить группы измерений в разных планшетах. Возможно мне следует сделать 30 одинаковых контролей и проверить распределение на нормальность? Или нужно 30 опытных образцов? Позволит ли это применять параметрическую статистику? Главный вопрос - кто прав в этом споре? Каким критерием правильнее всего пользоваться? Есть ли ссылки на соответствующую литературу, где содержался бы разбор такого случая? Я разбираюсь с этим уже 3 дня и самое релевантное, что я нашел - давнее обсуждение здесь на форуме. Очень прошу помочь! Хочется понять, как же делать правильно и почему. С уважением, Сергей |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 2.07.2010 Пользователь №: 22590 ![]() |
nokh, спасибо за ответ и предложение!
Я совершенно не боюсь, что данные украдут, потому что они бессмысленны без детализации факторов, типа клеток и веществ. Конечно, можно пытаться догадаться, что это, но нужно быть большим оригиналом, чтобы потом пытаться это как-то использовать. По этой причине я выкладываю их прямо здесь, в конце сообщения. Возможно, кто-то тоже захочет попробовать использовать их как учебный пример, а "ответы" я выложу в конце темы, когда пойму что и как считать. "Малые выборки нужно обсчитывать непараметрикой" - я имел ввиду, что это во всех случаях, когда доказать нормальность распределения не получается. Я уже понял, что это не совсем верный подход. (Если я верно понял, то скорее непараметрика нужна тогда, когда точно видно, что нормальности нет. Но там опять же, скорее всего, исследуются какие-нибудь 2 и больше субпопуляции, и группа данных софрмировано ошибочно.) И все-таки мнение, что "когда доказать нормальность распределения не получается, нужна непараметрическая статистика" распространено, и нужно понимать что отвечать на это. У меня пока нет 100% уверенности, что смогу поспорить аргументированно на эту тему. Я уже пробовал говорить про центральную предельную теорему и т.д., но это ведь теория... А как распределены данные в выборке я не доказываю этими теориями. Статистику 9, пробную версию, можно скачать и месяц пользоваться бесплатно. У меня этот месяц скоро закончится, но попробую успеть все посчитать)) http://www.statsoft.com/support/free-statistica-9-trial/ - вот ссылка. Модуль GLM обязательно поищу. Стало интересно. Я думал, что можно условия ("вложенность данных") задать как раз в переменных... Насчет дополнительного фактора... ну если с ним сложно, то его же можно и выкинуть. В конце концов можно отдельно рассчитывать с ним и без него. SPSS я собирался скачать, но завяз в Статистике и теории, поэтому руки не дошли. Если там такое считать удобнее (а удобнее?), то попробую. Они же одинаково считают все, поэтому выбор программы вроде как не важен. Книжку скачал, обязательно прочитаю эти главы. Еще задумался над тем, что, возможно, зря в каждом отдельном опыте нормировал все по контролю... Так как дополнительный фактор присутствовал и в контроле, он мог повлиять на на его абсолютное значение. Ну уж как есть. Влиял он, как я посмотрел по цифрам, незначительно. Зато сходимость между повторами стала лучше ![]() Вообще, конечно, любая предобработка данных может как открывать глаза на истинные закономерности, так быть способом манипуляций. Подвопрос. Допустим я залил 96 контрольных лунок и получил результаты. Как проверить нормальность в Статистике? Мои поиски если и привели к результатам, то к сомнительным... Гистограмма строится, но понять какие две цифры надо сравнить (рассчетную и табличную) для критериев я не могу. -- Результаты. В текстовом виде табулированные данные легко копируются что в Excel, что в Статистику. Только надо при вставке указывать import with text labels, иначе столбец с соединениями будет пустым. (К сожалению, я не могу приложить файл, так как сообщения на форум отправляю через прокси-анонимайзер, а с ним эта опция отключена. Без анонимайзера не могу оставлять сообщения, т.к. происходит деавторизация.) 1 0 Comp 1 0 0,838951311 1 0 Comp 1 0 0,926966292 1 0 Comp 1 0 1,2340824 1 0 Comp 1 0,0025 0,948864437 1 0 Comp 1 0,0025 0,978191254 1 0 Comp 1 0,0025 0,998057808 1 0 Comp 1 0,005 0,887372724 1 0 Comp 1 0,005 0,865614118 1 0 Comp 1 0,005 0,875074381 1 0 Comp 1 0,01 1,0084641 1 0 Comp 1 0,01 1,02076244 1 0 Comp 1 0,01 0,957378674 1 0 Comp 1 0,02 0,963054833 1 0 Comp 1 0,02 0,945080332 1 0 Comp 1 0,02 0,894940935 1 0 Comp 1 0,04 0,823988958 1 0 Comp 1 0,04 0,843855512 1 0 Comp 1 0,04 0,880750539 1 0 Comp 1 0,08 0,708573742 1 0 Comp 1 0,08 0,649920108 1 0 Comp 1 0,08 0,656542293 1 0 Comp 2 0 0,838951311 1 0 Comp 2 0 0,926966292 1 0 Comp 2 0 1,2340824 1 0 Comp 2 0,0025 1,00467999 1 0 Comp 2 0,0025 0,963054833 1 0 Comp 2 0,0025 0,92994391 1 0 Comp 2 0,005 0,91953762 1 0 Comp 2 0,005 0,890210803 1 0 Comp 2 0,005 0,878858487 1 0 Comp 2 0,01 0,927105831 1 0 Comp 2 0,01 0,926159805 1 0 Comp 2 0,01 0,943188279 1 0 Comp 2 0,02 0,829665116 1 0 Comp 2 0,02 0,840071406 1 0 Comp 2 0,02 0,906293251 1 0 Comp 2 0,04 0,678300899 1 0 Comp 2 0,04 0,6962754 1 0 Comp 2 0,04 0,695329373 1 0 Comp 2 0,08 0,319756909 1 0 Comp 2 0,08 0,333001278 1 0 Comp 2 0,08 0,351921805 1 1 Comp 1 0 0,951490357 1 1 Comp 1 0 0,987142022 1 1 Comp 1 0 1,06136762 1 1 Comp 1 0,0025 0,935125658 1 1 Comp 1 0,0025 1,01227352 1 1 Comp 1 0,0025 0,977206312 1 1 Comp 1 0,005 1,07071888 1 1 Comp 1 0,005 0,971361777 1 1 Comp 1 0,005 0,92226768 1 1 Comp 1 0,01 1,02162478 1 1 Comp 1 0,01 1,00058445 1 1 Comp 1 0,01 0,999415546 1 1 Comp 1 0,02 1,00642899 1 1 Comp 1 0,02 0,971361777 1 1 Comp 1 0,02 0,902396259 1 1 Comp 1 0,04 0,849795441 1 1 Comp 1 0,04 0,862653419 1 1 Comp 1 0,04 0,915254237 1 1 Comp 1 0,08 0,720046756 1 1 Comp 1 0,08 0,679135009 1 1 Comp 1 0,08 0,696668615 1 1 Comp 2 0 0,951490357 1 1 Comp 2 0 0,987142022 1 1 Comp 2 0 1,06136762 1 1 Comp 2 0,0025 1,20748101 1 1 Comp 2 0,0025 1,09292811 1 1 Comp 2 0,0025 1,04617183 1 1 Comp 2 0,005 1,00642899 1 1 Comp 2 0,005 0,986557569 1 1 Comp 2 0,005 0,939801286 1 1 Comp 2 0,01 0,977206312 1 1 Comp 2 0,01 0,902396259 1 1 Comp 2 0,01 0,925774401 1 1 Comp 2 0,02 0,789012274 1 1 Comp 2 0,02 0,749269433 1 1 Comp 2 0,02 0,87434249 1 1 Comp 2 0,04 0,599649328 1 1 Comp 2 0,04 0,603156049 1 1 Comp 2 0,04 0,641729982 1 1 Comp 2 0,08 0,0958503799 1 1 Comp 2 0,08 0,0829924021 1 1 Comp 2 0,08 0,0689655172 2 0 Comp 1 0 0,980513729 2 0 Comp 1 0 1,03542958 2 0 Comp 1 0 0,984056687 2 0 Comp 1 0,0025 0,800708592 2 0 Comp 1 0,0025 0,897254207 2 0 Comp 1 0,0025 0,824623561 2 0 Comp 1 0,005 0,709477414 2 0 Comp 1 0,005 0,905225864 2 0 Comp 1 0,005 0,775907883 2 0 Comp 1 0,01 0,796279894 2 0 Comp 1 0,01 0,887511072 2 0 Comp 1 0,01 0,783879539 2 0 Comp 1 0,02 0,853852967 2 0 Comp 1 0,02 0,785651019 2 0 Comp 1 0,02 0,852967228 2 0 Comp 1 0,04 0,862710363 2 0 Comp 1 0,04 0,930912312 2 0 Comp 1 0,04 0,86891054 2 0 Comp 1 0,08 0,746678477 2 0 Comp 1 0,08 0,766164748 2 0 Comp 1 0,08 0,779450841 2 0 Comp 2 0 0,980513729 2 0 Comp 2 0 1,03542958 2 0 Comp 2 0 0,984056687 2 0 Comp 2 0,0025 1,09565988 2 0 Comp 2 0,0025 0,953941541 2 0 Comp 2 0,0025 0,89105403 2 0 Comp 2 0,005 0,997342781 2 0 Comp 2 0,005 0,976085031 2 0 Comp 2 0,005 0,987599646 2 0 Comp 2 0,01 0,93445527 2 0 Comp 2 0,01 0,939769708 2 0 Comp 2 0,01 0,923826395 2 0 Comp 2 0,02 0,774136404 2 0 Comp 2 0,02 0,852967228 2 0 Comp 2 0,02 0,842338353 2 0 Comp 2 0,04 0,73870682 2 0 Comp 2 0,04 0,76173605 2 0 Comp 2 0,04 0,751992914 2 0 Comp 2 0,08 0,125775022 2 0 Comp 2 0,08 0,125775022 2 0 Comp 2 0,08 0,139946856 2 1 Comp 1 0 0,968532526 2 1 Comp 1 0 0,983963691 2 1 Comp 1 0 1,04750378 2 1 Comp 1 0,0025 1,10287443 2 1 Comp 1 0,0025 1,03479576 2 1 Comp 1 0,0025 1,02753404 2 1 Comp 1 0,005 1,00030257 2 1 Comp 1 0,005 0,954916793 2 1 Comp 1 0,005 0,932223903 2 1 Comp 1 0,01 0,972163389 2 1 Comp 1 0,01 0,931316188 2 1 Comp 1 0,01 0,91225416 2 1 Comp 1 0,02 0,936762481 2 1 Comp 1 0,02 0,890468986 2 1 Comp 1 0,02 0,863237519 2 1 Comp 1 0,04 0,865960666 2 1 Comp 1 0,04 0,892284418 2 1 Comp 1 0,04 0,845990923 2 1 Comp 1 0,08 0,776096823 2 1 Comp 1 0,08 0,763388805 2 1 Comp 1 0,08 0,752496218 2 1 Comp 2 0 0,968532526 2 1 Comp 2 0 0,983963691 2 1 Comp 2 0 1,04750378 2 1 Comp 2 0,0025 1,05476551 2 1 Comp 2 0,0025 1,06838124 2 1 Comp 2 0,0025 1,07564297 2 1 Comp 2 0,005 0,95128593 2 1 Comp 2 0,005 0,953101362 2 1 Comp 2 0,005 0,960363086 2 1 Comp 2 0,01 0,937670197 2 1 Comp 2 0,01 0,879576399 2 1 Comp 2 0,01 0,980332829 2 1 Comp 2 0,02 0,820574887 2 1 Comp 2 0,02 0,819667171 2 1 Comp 2 0,02 0,917700454 2 1 Comp 2 0,04 0,726172466 2 1 Comp 2 0,04 0,704387292 2 1 Comp 2 0,04 0,744326778 2 1 Comp 2 0,08 0,165204236 2 1 Comp 2 0,08 0,184266263 2 1 Comp 2 0,08 0,173373676 |
|
![]() |
![]() |
![]() ![]() |