![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 6.11.2007 Пользователь №: 4508 ![]() |
Привет знатокам статистики и методологии.
Сформулирую свои вопросы на конкретном примере. Надо узнать влияние вещества А на жизнеспособность организма В. Жизнеспособность измеряется в силе люминисценции (измеряется прибором и выдает численое значение). Опыт: берется 10 чашек петри для контроля и 10 для опыта (в опытные чашки в питательную среду добавляется вещество А). На каждую чашку высеваются колонии (клетки) организма В. Через какое-то время проводится анализ жизнеспособности (по люм. свечению). Для этого из каждой чашки абсолютно случайным образом выбирается 15 клеток которые и измеряются. Получаем определенный набор цифр. Для каждой чашки расчитывается средняя величина свечения и ст. Отклонение (по 15 клеткам) Теперь собствено вопросы: 1. Как определить если какая/ие-то из 10 чашек (повторностей) не укладываются (статистически) в общую картину? Если такое происходит что надо делать все равно рассматривать эту/и повторности со всеми или надо выкинуть? 2. Как считать разницу между контролем и опытом. Взять среднию (по десяти чашкам)-средних (по 15 клеткам) и ст. отклонение для опыта и контроля и их сравнить между собой (здесь N для опыта и контроля будет по 10) или же правильней будет объеденить все повторности в одну (если не все то те которые не отличаются (статистически) от общей картины) для них расчитать среднее и ст. отклонение и сравнить опыт и контроль. Только во втором случае N будет равно по 150 для опыта и контроля, собственно столько сколько клеток было проанализировано. Заранее благодарю за ответ. Особено было бы классно показать ход расчетов на примере Statistica 6.0 |
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Ну одно логарифмирование вряд ли достаточно, надо по крайней мере попробовать взятие квадратного корня, но самое главное у Вас единица наблюдения - чашка. Распределение должно быть нормальным в популяции клеток, откуда Вы взяли 15 клеток. По идее если нет систематических факторов и Вы берете случайным образом клетки, распределение должно быть нормальным (влияют только случайные факторы). Если это так и Вы на группе из 15 клеток не получаете нормальности (точнее, какова по KS вероятность нормальности в Вашем случае?) то у Вас очень большая вероятность ошибки II типа, т.е. Вы признаете распределение не нормальным, когда оно на самом деле нормально. Если интересно, посмотрите в других ветках примеры расчетов, я приводил. Непараметрика - особенно многомерная - разработана не очень хорошо. Поэтому если Вы будете настаивать на непараметрике у Вас будут проблемы (а многомерная модель у Вас, поскольку влияет номер чашки и наличие в чашке вещества).
Что касается ANOVA. Post Hoc сравнения НЕЛЬЗЯ делать, если суммарный (омнибусный) тест показывает недостоверность модели. так что к Post Hoc она не сводится. Более того, в Вашем случае ANOVA ответит на следующие вопросы: учитывая разброс свечения в чашках (номер чашки) есть ли различия между чашками (это не интересно) и в зависимости от добаления вещества. Соответственно, если у Вас фактор "вещество" оказывается достоверным, то это и есть ответ на мучающий Вас вопрос (без всякого Post Hoc сравнения - сравниваются только факторы). Более того, Вы можете получить откорректированные средние свечения (т.е. средние с веществом и без с учетом различий в чашках) Некоторое - с примерами введение в дисперсионный анализ можно найти тут http://www.pubhealth.spb.ru/SASDIST/SAS1-3.htm, а для повторных наблюдений - тут http://www.pubhealth.spb.ru/SASDIST/SAS1-4.htm. Там все примеры в SAS, но в ней проще объяснять (сами программы при чтении можно опускать). Кстати, в самой Statistica в подсказке очень неплохо описан дисперсионный анализ с примерами. Что касается анализа выживаемости - для него разработаны специальные методики, самая известная - и мощная - модель пропорционального риска Кокса. Считается полупараметрической (не требует задания типа распределения времен выживаемости, как модели Вейбулла или Гомпертца). По поводу выкидования данных - статистически удаление данных не приветствуется. Это может делать только сам исследователь на основании анализа условий эксперимента. Если чашка стояла близко к обогревателю или наоборот около открытого окна, ее надо выбрасывать. Однако если Вы предполагаете, что она стояла не там на основании данных - вот это уже делать нельзя, ибо Ваше предположение может оказаться ложным и делаться только для того, чтобы "причесать" данные. В принципе удаление данных на основании "интуиции" рассматривается как подделка данных. |
|
![]() |
![]() |
![]() ![]() |