Допустим имеем 2 группы по 6 крыс в каждой. У каждой крысы взято по 3 биоптата. Как анализировать?
Вариант 1 расчитать среднее по 3 биоптатам для каждой крысы и сравнить 6 и 6. (скажем, сделать Манна-Уитни)
Вариант 2 сравнить 18 биоптатов одной группы с 18 другой.
Правильно конечно делать первый вариант, поскольку при втором увеличивается вклад индивидуальной вариабельности и мы недооценим риск получить различия обусловленные случайной комбинацией крыс. Но чувствительность в первом варианте достаточно мала а хочется все-таки больше.
Есть какие-нибудь ещё варианты?
Цитата(Varta @ 30.10.2008 - 10:00)

Допустим имеем 2 группы по 6 крыс в каждой. У каждой крысы взято по 3 биоптата. Как анализировать?
Вариант 1 расчитать среднее по 3 биоптатам для каждой крысы и сравнить 6 и 6. (скажем, сделать Манна-Уитни)
Вариант 2 сравнить 18 биоптатов одной группы с 18 другой.
Правильно конечно делать первый вариант, поскольку при втором увеличивается вклад индивидуальной вариабельности и мы недооценим риск получить различия обусловленные случайной комбинацией крыс. Но чувствительность в первом варианте достаточно мала а хочется все-таки больше.
Есть какие-нибудь ещё варианты?
Классическая задача дисперсионного анализа с повторными измерениями. Только вот про МУ забудьте - непараметрика для более-менее сложных дизайнов не отработана.
DrgLena
30.10.2008 - 12:16
А что и как измерили в биоптатах? Если например, измерили активность фермента, при этом три раза измерили, чтобы взять среднее, или три раза измерили в разное время и интересует динамика, то тогда методы одни, а если результат измерения выражен бинарно - есть или нет в биоптате определенные клетки, то и подход к анализу будет другим.
Плав, я поняла вашу точку зрения. Я неполно сформулировала вопрос. Дисперсионный повторных не подходит, поскольку меня не интересует динамика. Биоптаты взяты в одно время с целью уменьшить ошибку измерения.
DrgLena Данные количественные. Допустим, количество нейтрофилов в поле зрения на 1 сутки после нанесения раны.
Группа исследования:
Крыса 1
12
20
30
Крыса 2
15
7
10
И т.д.
Считаем содержание нейтрофилов в ране как среднее по 3 биоптатам:
1 Крыса 20,7
2 крыса 10,7
И т д
Либо анализируем, используем выборку из 6 наблюдений
20,7
10,7
...
Либо как выборку из 18 наблюдений
12
20
30
15
7
...
DoctorStat
30.10.2008 - 20:02
Наблюдения для одной крысы зависимы, поэтому нельзя анализировать выборку из всех наблюдений для всех крыс - 18 наблюдений. Сначала нужно усреднить данные для (внутри) одной крысы и получить выборку из 6 независимых наблюдений для каждой (из двух) групп крыс. Потом проверить эти выборки на нормальность, равенство дисперсий и отсутствие выбросов. Если обе выборки нормальны и их дисперсии равны, то применить дисперсионный анализ (или критерий Стъюдента, что для 2-х выборок одно и тоже). Если нормальность вызывает сомнения, то сравнить выборки каким-нибудь непараметрическим критерием (например, Крускала-Уоллиса).
Дисперсионный анализ с повторными измерениями разрабатывался и традиционно используется именно для вашего случая. Во-первых он позволяет учесть зависимый характер между измерениями, а во-вторых - разделить ошибку эксперимента на 2 части: в нашем случае - на биологическую и техническую. Изменчивость крыс внутри группы - биологическая изменчивость, а изменчивость биоптатов внутри крыс -методическая (техническая). Такой анализ будет работать и при изучении динамики (если бы 2 ваши группы характеризовали 2 временные точки), но отнюдь им не ограничивается. Дисперсионный анализ это - единственное что вы можете сделать, чтобы максимально использовать имеющуюся информацию. Работа с усредненными значениями - грубый подход снижающий мощность исследования и делающий во-многом бессмысленным вашу затею с уменьшением ошибки.
В иерархическом дисперсионном комплексе будут следующие факторы.
(1) Группы. Фиксированный фактор, отражающий различия двух групп по числу нейтрофилов при усреднении данных по крысам и биоптатам внутри групп.
(2) Крыса внутри группы. Случайный фактор, отражающий изменчивость крыс по числу нейтрофилов при усреднении данных по биоптатам от одной крысы - т.е. «внутри» крысы.
Взаимодействия факторов (Группы х Крыса внутри группы) быть не может, т.к. в каждой группе крысы свои. (Если бы эксперимент был организован так, что и в первой и во второй группах были использованы одни и те же животные - мы имели бы другой экспериментальный план (experimental design) в котором бы было такое взаимодействие).
В ошибку дисперсиооного комплекса и всего эксперимента уйдет техническая изменчивость между биоптатами внутри крысы.
Таким образом, в результате единственного анализа общая изменчивость оказывается разложенной на все возможные составляющие компоненты. Это хорошо и грамотно, поскольку если бы вы использовали только один биоптат от животного, то в ошибку эксперимента ушла бы техническая изменчивость (ошибка анализа) и биологическая изменчивость между крысами. Ошибка была бы больше и обнаружить различия межу группами при фиксированном числе экспериментальных животных было бы труднее. А непараметрика здесь вообще грубо говоря все сведет на нет. Распределение сосчитанных значений близко к логарифмически нормальному, поэтому перед анализом исходные данные - количество нейтрофилов в поле зрения - можно преобразовать логарифмированием.
Напишите какие статистические программы у вас есть. Я могу подсказать как делать такой анализ в Statistica, SYSTAT и SPSS.
P.S. Думаю, что методическая изменчивость будет очень велика если смотреть только 1 поле зрения. Она может перекрыть (и скорее всего перекроет) именчивость между кусочками ткани из разных мест раны. В этом случае изменчивость между биоптатами будет почти целиком отражать неравномерность содержания нейтрофилов в поле зрения и смысл во взятии 3х биоптатов теряется. Сколько полей зрения рекомендуется просматривать по методике которой вы работаете?
DoctorStat
31.10.2008 - 13:11
Цитата(nokh @ 30.10.2008 - 20:56)

Дисперсионный анализ с повторными измерениями разрабатывался и традиционно используется именно для вашего случая.
В данной ситуации нельзя использовать 2-х факторный дисперсионный анализ, т.к. внутри группы крысы ничем не отличаются, а в разных группах сидят разные крысы. Мы могли бы использовать 2-х факторный анализ в следующих случаях:
БЕСПОВТОРНЫЙ АНАЛИЗ.
Если бы содержание или питание крыс отличалось, то мы могли бы использовать эту переменную в качестве дополнительного фактора, чтобы с помощью многофакторного дисперсионного анализа учесть его влияние.
ПОВТОРНЫЙ АНАЛИЗ.
Если бы в разных группах сидели бы одни и те же крысы, то мы могли бы учесть индивидуальность крысы в результатах.
Цитата(DoctorStat @ 31.10.2008 - 16:11)

В данной ситуации нельзя использовать 2-х факторный дисперсионный анализ, т.к. внутри группы крысы ничем не отличаются, а в разных группах сидят разные крысы. Мы могли бы использовать 2-х факторный анализ в следующих случаях:
БЕСПОВТОРНЫЙ АНАЛИЗ.
Если бы содержание или питание крыс отличалось, то мы могли бы использовать эту переменную в качестве дополнительного фактора, чтобы с помощью многофакторного дисперсионного анализа учесть его влияние.
ПОВТОРНЫЙ АНАЛИЗ.
Если бы в разных группах сидели бы одни и те же крысы, то мы могли бы учесть индивидуальность крысы в результатах.
Вы обозначили самые примитивные дисперсионные комплексы. Описанный мной - сложнее. Мне вообще не нравится термин анализ с повторными измерениями, т.к. организовать повторности можно по-разному, а это постоянно приводит к путанице между истинными и мнимыми повторностями. В рассматриваемой структуре можно повторять анализ полей зрения внутри биоптата, биоптатов внутри крысы и крыс внутри группы. Можно также целиком повторить эксперимент на других животных, оставив неизменным только исследуемый фактор по которому животные делятся на 2 группы (истинная повторность). Все это будут разные экспериментальные планы и для их анализа потребуются соответствующие и разные варианты дисперсионного анализа. Поскольку здесь присутствует фиксированный по плану эксперимента фактор (одна група получала что-либо, другая - нет) - есть перекрестный компонент, поскольку присутствуют влженные эффекты (что-либо внутри чего-либо) - есть иерархический или гнездовой компонент. Поэтому такой анализ можно назвать перекрестно-иерархическим (cross-nested anova). Также, поскольку есть и фиксированный эффект (группы), и случайный эффект (крыса внутри группы) такой анализ можно назвать смешанной моделью дисперсионного анализа (mixed model anova). Также, поскольку оцениваются эффекты между субъектами и внутри субъектов такой анализ можно назвать between-within anova. Названия разные, методология одна. Классический анализ с повторными измерениями наиболее простой вариант перекрестно-иерархических группировок. Посмотрите в Монтгомери главу про живые и мертвые индексы и правила нахождения математических ожиданий для средних квадратов. Этого источника достаточно чтобы навсегда разобраться со сбалансированными дисперсионными комплексами. Несбалансированные - отдельная песня.
DoctorStat
31.10.2008 - 15:44
Цитата(nokh @ 31.10.2008 - 14:27)

Посмотрите в Монтгомери главу
Я прочитал главу "гнездовые или иерархические планы" книги Монтгомери «Планирование эксперимента». Вы правы, эксперимент с крысами можно рассчитать с помощью иерархического (гнездового) дисперсионного анализа. В качестве результата он покажет, существует ли различие:
1. между группами,
2. внутри каждой группы крыс.
С другой стороны, этот сложный анализ можно заменить более простыми и интуитивно понятными статистическими методами:
1. Убедиться с помощью однофакторного дисперсионного анализа, что крысы внутри каждой группы не отличаются (однородность групп, 2 теста)
2. Найти среднее для каждой крысы и с помощью того же однофакторного дисперсионного анализа проверить отличие между группами (1 тест)
3. Рассчитать поправку уровня значимости p-value на множественные сравнения (всего 1+2=3 сравнения)
Цитата(DoctorStat @ 31.10.2008 - 15:44)

Я прочитал главу "гнездовые или иерархические планы" книги Монтгомери «Планирование эксперимента». Вы правы, эксперимент с крысами можно рассчитать с помощью иерархического (гнездового) дисперсионного анализа. В качестве результата он покажет, существует ли различие:
1. между группами,
2. внутри каждой группы крыс.
С другой стороны, этот сложный анализ можно заменить более простыми и интуитивно понятными статистическими методами:
1. Убедиться с помощью однофакторного дисперсионного анализа, что крысы внутри каждой группы не отличаются (однородность групп, 2 теста)
2. Найти среднее для каждой крысы и с помощью того же однофакторного дисперсионного анализа проверить отличие между группами (1 тест)
3. Рассчитать поправку уровня значимости p-value на множественные сравнения (всего 1+2=3 сравнения)
Только вот одна проблема. При переходе от 1 к 2 искуственно занижается ошибка (разброс данных внутри биоптатов игнорируется). Если бы количество наблюдений было бы большим, то это влияние было бы малым. А в данном примере игнорировать его нельзя. Поэтому, повторюсь, ДА с повторными измерениями единственный возможный тут метод анализа.
Спасибо за ценную информацию.
При пристальном изучении смотрю вопрос анализа нескольких биоптатов с животного уже здесь затрагивался в этой теме
http://forum.disser.ru/index.php?showtopic...&#entry5687Но до конкретных рекомендаций дело не дошло.
На самом деле никто толком пока этого не знает, и анализируют и так и сяк. Я когда в аспирантуре писала диссертацию, смело свалила все биоптаты в кучу - по сравнению с расчетом средних различий получилось процентов на 30 больше. Позже я уже стала понимать, что делать так нельзя, но как делать, никто из тех кого я спрашивала не знал. Читая зарубежные статьи, обращала внимание на дизайн и методы расчета, но там в общем-то тоже авторы частенько предпочитали просто включить в анализ биоптаты как отдельные наблюдения и расчитать критерий Манна-Уитни, а не крыс.
Nokh, вы любезно согласились дать конкретные рекомендации
Цитата
Напишите какие статистические программы у вас есть. Я могу подсказать как делать такой анализ в Statistica, SYSTAT и SPSS.
можно поймать вас на слове? Есть и Statistica и SPSS, пользуюсь и тем и тем в зависимости от задач.
Можно ли там сделать там больше уровней иерархии? Поле зрения --- биоптат ---- крыса ---- изучаемый фактор
Возможно ли на каком-то уровне ввести логарифмирование?
Например предполагаем, что по биоптатам распределение сдвинуто влево (попадаются биоптаты с значительно большим количеством нейтрофилов).
минимальное количество наблюдений? Можно ли анализировать по два-три биоптата с крысы - или тут уже смысла нет, оценка дисперсии будет слишком грубой и надо брать хотя бы 5-6.
Как часто пользовались таким анализом? Насколько результаты внушают доверие не получалось ли неожиданных?
Цитата(Varta @ 3.11.2008 - 08:28)

1) Можно ли там сделать там больше уровней иерархии? Поле зрения --- биоптат ---- крыса ---- изучаемый фактор
2) Возможно ли на каком-то уровне ввести логарифмирование?
Например предполагаем, что по биоптатам распределение сдвинуто влево (попадаются биоптаты с значительно большим количеством нейтрофилов).
3) минимальное количество наблюдений? Можно ли анализировать по два-три биоптата с крысы - или тут уже смысла нет, оценка дисперсии будет слишком грубой и надо брать хотя бы 5-6.
4) Как часто пользовались таким анализом? Насколько результаты внушают доверие не получалось ли неожиданных?
1) Можно, количество вложенных факторов может быть большим
2) Да, если Вы хорошо знаете статистическую программу, с которой работаете - в этом отношении SPSS будет лучше, чем, например, Statistica. Еще лучше использовать трансформацию Бокса-Кокса, поскольку она позволяет отобрать наиболее "эффективнй" метод трансформации данных.
3) Можно и по три (обычно, все-таки принято использовать трипликат), чем больше, тем точнее оценка внутригрупповой дисперсии. Количество наблюдений зависит от величины этой самой дисперсии
4) В литературе используется очень часто, введите в Google repeated measures ANOVA rat и получите большое количество примеров статей с использованием этого метода. Соответственно, это - стандартный метод и неожиданных результатов давать не должен.
repeated measures ANOVA rat это все-таки анализ повторных измерений.
Погуглила и прочитала дизайн в первых 4 полнотекстовых статьях. Там говорилось именно о повторных измерениях. В данном случае измерения выполнены у одной крысы, но они не повторные.
Цитата(Varta @ 3.11.2008 - 14:09)

repeated measures ANOVA rat это все-таки анализ повторных измерений.
Погуглила и прочитала дизайн в первых 4 полнотекстовых статьях. Там говорилось именно о повторных измерениях. В данном случае измерения выполнены у одной крысы, но они не повторные.
Вам надо ехать или шашечки? Или Вы считаете, что те, кто отвечает на вопросы умственно отсталые и не могут понять вопроса?
Итак - дизайн с повтроными измерениями означает, что принимается во внимание тот факт, что часть данных измерялась у одного и того же субъекта, а часть - у разных. Правильное название подхода - смешанные модели (mixed models), в них анализируется меж- и и внутрисубъектная вариабельность (ну что, легче стало?). Соовтетственно, есть внутрисубъектные факторы (within) и межсубъектные (between). Ввиду коррелированности измерений внутрисубъектных факторов использовать допущение независимости наблюдений, на котором строится обычный дисперсионный анализ нельзя. Поэтому должна использоваться информация о принадлежности информации одному субъекту при анализе ковариационной структуры. Поскольку такие методы ЧАЩЕ всего используются для анализа повторных измерений, их называют repeated measures. Однако нигде в анализе временная зависимость измерений не включается.
Если бы Вы потрудились посмотреть ссылки, то нашли бы на первой странице того, что дает Google вот эту
http://udel.edu/~mcdonald/stattwoway.html, где есть следующая фраза " Sometimes the repeated measures are repeated at different places rather than different times, such as the hip abduction angle measured on the right and left hip of individuals."
Если очень хочется начать с азов, возьмите хороший учебник по статистике и планируемых экспериментах, например того же Монтгомери, прочитате его весь, разберитесь, а уже потом пытайтесь найти разницу между repeated measures и взятием образцов у одного животного.
Выше я неправильно назвал комплекс перекрестно-иерархическим. Это - чистая иерархия, т.к. нет ни одного взаимодействия. Данные преобразуются не на этапах анализа, а в самом начале. Справедливо рекомендуемое Плавом преобразование Бокса-Кокса удобно провести в программе Attestat (
http://www.attestatsoft.com ). Комплекс строим для случая анализа нескольких полей зрения с каждого биоптата.
Этап 1. МодельYijkl = M + Ai + Bj(i) + Ck(ij) + El(ijk), где
Yijkl - количество нейтрофилов, M (мю) - общее для всего комплекса среднее, Ai - эффект i-той группы, Bj(i) - эффект j-той крысы внутри i-той группы, Ck(ij)- эффект k-того биоптаты внутри комбинации крысы и группы, El(ijk) - эффект l-ного поля зрения внутри всего остального (ошибка). Фактор группы фиксированный, остальные - случайные.
Этап 2. Заполнение таблицы в SPSSКолонка 1: Data - Исходные данные, т.е. натуральный логарифм количества нейтрофилов в поле зрения или преобразованное по Боксу-Коксу значение.
Колонка 2: Group - метка принадлежности наблюдения к группе (1 или 2)
Колонка 3: Rat - метка принадлежности наблюдения к конкретной крысе внутри группы (1, 2 или 3).
Колонка 4: Bt - метка принадлежности наблюдения к конкретному биоптату от конкретной крысы (1, 2 или 3 для в случае 3-х биоптатов).
Метку принадлежности к полю зрения ставить не нужно, дисперсия для этого компонента будет ошибкой дисперсионого комплекса.
Сохраните файл, например exper.sav и скопируйте его в корневой каталог диска С: (чтобы потом длинный путь не прописывать).
Этап 3. Анализ.В SPSS действительно удобнее делать любые модели. Будем делать через синтаксис, т.к. это быстрее + из менюшки далеко не все модели можно построить.
File - New - Sintax. Откроется окно. В него вставить следующий фрагмент:
GET
FILE='C:\exper.sav'.
UNIANOVA
Data BY Group Rat Bt
/RANDOM = Rat Bt
/METHOD = SSTYPE(3)
/INTERCEPT = I-N-C-L-U-D-E
(!!! Напишите без черточек, на этом сайте какой-то глюк - вместо набитого слова отбражаете число 5670252)/CRITERIA = ALPHA(.05)
/DESIGN = Group Rat(Group) Bt(Group*Rat)
Далее: Run - All, OK и ждать появления таблицы результатов.
4. В Statistica 6.0. вполне удобно делать иерархические модели, но неудобно более сложные. В вашем случае строим точно такую же таблицу с теми же переменными и обозначениями.
Statistics - Advanced Linear/Nonlinear models - General linear models - Nested design ANOVA. В открывшейся форме
Переходим на закладку Options (чтобы потом не забыть с этого лучше начинать) в кнопке Random factors выделить случайные факторы Rat и Bt.
Возвращаемся на закладку Quik и заполняем кнопочки:
Variables. Dependent - Data, Categorical - Group Rat Bt
Factor codes - Select All
Between effects.
Group оставляем Not nested,
Rat делаем Nested in Group,
Bt - Nested in Group Rat (удерживая левую кнопку мыши выделить сразу оба фактора)
OK
В форме результатов смотрим таблицу дисперсионного анализа в кнопке All Effeсts.
Вставьте полученную таблицу сюда. Я поясню как ее оформить.
А почему не хотите использовать процедуру MIXED?
MIXED
Data
BY rat group
WITH bt
/PRINT = SOLUTION TESTCOV G
/FIXED = group rat
/RANDOM = bt | COVTYPE(UN) SUBJECT(rat).
кстати, вот тут
http://www.stat.tamu.edu/ftp/pub/mspeed/stat653_f03/spss/ есть трансформация Бокса-Кокса для SPSS
С mixed я еще не разобрался. Ваш код выдает результаты в терминах обобщенных (generalized) линейных моделей, а я не знаю что с ними далее делать кроме как посмотреть стат. значимость фиксированных эффектов. Описанный мной подход - обычный nested anova, который обсчитывается в настоящее время с помощью общих (general) линейных моделей и результаты которого выдаются в терминах классического аnova. Поскольку дизайн в задаче Varta сбалансировнный - дисперсию можно аккуратно разложить и без привлечения обобщенных моделей. В этом случае, в отличие от mixed, достаточно просто найти выражения для ожидаемых средних квадратов и если нужно - разложить далее дисперсию на компоненты. В общем, достаточно изящный анализ. Обобщенные модели становятся все популярнее на глазах, но я это связываю с увеличением использования несбалансированных планов и комплексов с пропущенными ячейками в некоторых областях биологии, а также с необходимостью учета between-within-структуры в сложных логлинейных моделях, например, в longitudinal исследованиях. В рассматриваемой задаче все куда проще.
Принципиальным вижу другое различие. Вы отнесли крысу к фиксированным факторам, почему? Мне она представляется самой что ни на есть случайной, как и биоптаты и поля зрения. Эффект "крыса внутри группы" отражает индивидуальную биологическую изменчивость между крысами - неконтролируемый исследователем случайный фактор.
Цитата(nokh @ 3.11.2008 - 22:06)

Принципиальным вижу другое различие. Вы отнесли крысу к фиксированным факторам, почему? Мне она представляется самой что ни на есть случайной, как и биоптаты и поля зрения. Эффект "крыса внутри группы" отражает индивидуальную биологическую изменчивость между крысами - неконтролируемый исследователем случайный фактор.
крыса - индивидуальный фактор (поэтому там код subject(rat), характерно для синтаксиса смешанных моделей)
Кстати, вот тут картинки по смешанным моделям в SPSS
http://www.medspan.info/spss-guide/ch14/c14-2.htm
Таблица из Статистики 6.0
взяты группа - крыса - поле зрения. Изучается объемная плотность коллагеновых волокон в поле зрения.
Всего 30 крыс, разделенных на 2 группы. У каждой крысы изучено 8 полей зрения.

Для полноты картины:
Сравнение 2 выборок из биоптатов -
р=0.0019 (Манна-Уитни) - 0.00041 (Т-тест)
Сравнение выборок из усредненных значений по каждой крысе -
р=0,51 (Т-тест)
Разница в содержании коллагена между группами была довольно ощутимая - 38 и 45 единиц, но у крыс был достаточно приличный разброс.
>плав. Ясно, значит это терминологические тонкости. За ссылки спасибо, буду по-возможности разбираться.
>Varta. Крысы не Fixed, поэтому никакой драмы нет, просто некорректный анализ. А вот первая табличка нормальная. Свободный член (Intersept) можно не включать в итоговую таблицу, т.к. это тест равенства общего среднего нулю. Остальные включаем, вручную досчитываем недостающее (за Statistica нужно частенько что-то досчитывать) и строим итоговую таблицу - она во вложении (замаялся сюда вставлять). Итак, различия между группами статистически незначимы и даже не дотягивают до тенденции. Какие данные вы использовали? Если непреобразованные - после преобразования P уменьшится и если будет в промежутке между 0,05 и 0,10 - эффект уже полезно обсуждать. В преобразовании никакой крамолы нет - никто не виноват, что природа меряет признаки своей, а не нашей линейкой. Всё. Такие анализы делаются так. Прочитать про это можно у Монтгомери - ссылку на книгу давал в близкой теме. Далее можно построить математические ожидания для средних квадратов, рассчитать по ним дисперсии для эффектов комплекса и выразить их в % от общей (по SS этого сделать нельзя). Типа на изменчивость между полями зрения приходится х%, на крысиную изменчивость - у%, с групповыми различиями связано z% изменчивости.
Преобразование ситуацию не спасет, я для того, чтобы разобраться взяла параметр с более-менее близким к нормальному распределением.
Здесь ситуацию возможно спасти могло бы добавление динамики по суткам.
Помимо того, что у одной крысы каждый раз смотрели несколько полей зрения в биоптате, у этой же одной крысы брали биоптаты в разные сроки. Т.е
Данные по одной крысе:
1 сут - 8 полей зрения
3 сут - 8 полей зрения и т.д.
Как провести сравнения в таком случае?
План тут уже будет перекрестно-иерархический. Пробую сочинить модель самостоятельно, но пока не разобралась еще до конца.
Цитата
Крысы не Fixed, поэтому никакой драмы нет, просто некорректный анализ.
Просто смотрю для себя, то произойдет при некорректном анализе. Удалила, чтобы никого не смущать.
плав
Цитата
Если бы Вы потрудились посмотреть ссылки, то нашли бы на первой странице того, что дает Google вот эту
http://udel.edu/~mcdonald/stattwoway.html, где есть следующая фраза " Sometimes the repeated measures are repeated at different places rather than different times, such as the hip abduction angle measured on the right and left hip of individuals."
Если очень хочется начать с азов, возьмите хороший учебник по статистике и планируемых экспериментах, например того же Монтгомери, прочитате его весь, разберитесь, а уже потом пытайтесь найти разницу между repeated measures и взятием образцов у одного животного.
Монтгомери, стр 248
Иногда возникает сомнение, является ли фактор пересекающимся или группированным. Если уровни фактора можно перенумеровать произвольным образом, то этот фактор сгруппирован.
Стр 252-253
Пример некорректного анализа двухступенчатого иерархического плана, как факторного плана с двумя пересекающимися факторами.
Sometimes the repeated measures are repeated at different places rather than different times, such as the hip abduction angle measured on the right and left hip of individuals.
В этом примере два уровня фактора - правое бедро и левое бедро.
Если бы я брала поля зрения по определенным правилам, например: 1 - на уровне эпидермиса, 2 - на уровне дна раны раны, 3- на середине расстояния и т.д. то repeated measures было бы самое то.
Вы вступаете в неконструктивную полемику с человеком, искушенным в статистике. Зачем? Я выше говорил, что повторные измерения крайне неудачный термин. Вы сами писали что считают такие данные кто во что горазд, так вот я думаю что именно из-за терминологической неразберихи. Попробуйте построить модель для комплекса с учетом времени (появятся взаимодействия), я тоже подумаю. Здесь торопиться нельзя, т.к. программа будет обсчитывать ту модель, которую ей дадут.
Цитата(Varta @ 4.11.2008 - 08:39)

плав
Монтгомери, стр 248
Иногда возникает сомнение, является ли фактор пересекающимся или группированным. Если уровни фактора можно перенумеровать произвольным образом, то этот фактор сгруппирован.
Стр 252-253
Пример некорректного анализа двухступенчатого иерархического плана, как факторного плана с двумя пересекающимися факторами.
Sometimes the repeated measures are repeated at different places rather than different times, such as the hip abduction angle measured on the right and left hip of individuals.
В этом примере два уровня фактора - правое бедро и левое бедро.
Если бы я брала поля зрения по определенным правилам, например: 1 - на уровне эпидермиса, 2 - на уровне дна раны раны, 3- на середине расстояния и т.д. то repeated measures было бы самое то.
А Вы берете биоптаты абсолютно случайно? Т.е. делите участок на много зон и используете генератор случайных чисел для того, чтобы выбрать место для биопсии? Только в этом случае у Вас истинно случайные факторы. И при этом Вы уверены, что между моментом t и t+1, когда Вы взяли следующий биоптат ничего не произошло или Вы берете биопсию в абсолютно один и тот же момент?
ничего биологически значимого не произошло.
В данном случае заменителем генератора случайных чисел является то, что гистолог перемещает стекло под микроскоп в произвольном положении, а затем считает клетки попавшие в поле зрения. Это возможно не идеальный, но приемлемый способ генерации случайности. )
Из-за терминологической путаницы и приходится вступать в полемику. Не хочется совершать ошибку из-за недопонимания.
Мы вообще-то об одном говорим?
Цитата из первого поста:
"Допустим имеем 2 группы по 6 крыс в каждой. У каждой крысы взято по 3 биоптата. Как анализировать?"
Теперь уже речь идет о полях зрения...
На самом деле вот поля зрения не принято анализировать как отдельные переменные (в любом случае гистолог, который передвигает стекло не действует случайным образом, у него почти всегда есть система).
Поэтом, что касается полей зрения, то вот тут уж лучше брать среднее, чем тянуть в анализ 8 новых переменных с подозрительной случайностью взятия (логика тут такая - а что, если мы берем не 8 полей зрения, а одно поле, равное по площади 8, т.е. сумму 8 измерений - все будет то же самое, но расчетно - по другому. С биопсиями это невозможно по определению - разные места). Кроме того, если Вы возьмете 8 полей зрения ошибка измерения будет в 2,8 раза разброса числа нейтрофилов в образце, а разброс числа нейтрофилов в образце не должен быть большим (если он большой, у Вас гетерогенный препарат и анализ его как случайного фактора опять-таки сомнителен).
Когда я лет пять назад делала эксперимент в аспирантуре, мы оценивали количество нейтрофилов морфометрически - т.е. считали их в полях зрения. При этом я столкнулась с трудностями оценки, ибо такой вариант трудоемкий и дает достаточно вариабельные результаты. Сейчас мы планируем работу и с теми же целями хотим брать три кусочка из разных мест раны и в каждом определять содержание миелопероксидазы - того фермента, который лежит в нейтрофилах. Собственно вопрос я задавала имея в виду нашу будущую работу. Результатов у нас пока нет, а поскольку смысла нет разбираться в такой теме умозрительно. я вытащила старые данные и пробовала на них. Из стары-х данных я взяла не нейтрофилы, а содержание коллагена в ране. Дело в том, что препарат замедляет фибропластическую активность. Это сто раз доказано и известно, и визуально в препаратах группы сравнения было больше коллагена, чем у получавших препарат. То есть, проводя такое сравнение я уже точно знаю, что нулевая гипотеза несправедлива. Но если брать среднее - мы ее будем вынуждены принять из-за слишком грубой оценки, если считать так, как неправильно, т.е. сравнивать выборки из полей зрения - то мы ее отвергаем. Меня интересовало, существует ли анализ, который был бы корректен и позвволял отвергнуть нулевую гипотезу. Делая nested ANOVA мы ее все ж таки принимаем, но р уже значительно меньше.
Случайны ли поля зрения и как их включать в анализ - вопрос действительно сложный. Распределение воспалительного инфильтрата в ране неравномерно (а иначе зачем нам брать несколько биопсий, правда?) Когда мы берем биопсии - мы как бы делим рану на квадраты 2*2 мм и случайным образом берем 3 из них. Когда берем поля зрения - делим рану на срезы и в срезах берем квадраты 8*8 мкм. С гистологом мы договаривались именно чтобы он не следовал схемам, а брал поля зрения случайно. Мне самой не очень это нравится - но где выход? Увеличить количество животных мы не могли, могли лишь увеличить количество информации, получаемой с каждого животного.
Кстати, мы 8 полей зрения оценивали не по одному срезу, а по двум. Т.е. 4 поля зрения с одного среза и 4 с другого. Прийду с работы, попробую посчитать, беря в анализ срезы, посмотрю что изменится.
Фактор может быть в анализе фиксированным или случайным исходя из целей эксперимента и контекста экспериментального плана. Хотя в данном случае выбор полей зрения, возможно, и не является абсолютно случайным в строгом понимании этого термина, но это - неподконтрольный эспериментатору фактор. Если бы анализировались поля зрения в центре и на периферии среза - фактор был бы фиксированным. Также проход препарата под микроскопом может осуществляться по разным схемам и т.о. случайная изменчивость опять-таки оказывается ограничена (фиксирована) какими-то рамками. В вашей же экспериментальной схеме фактор "поле зрения" однозначно является случайным. По поводу срезов. Грамотный анализ, безусловно, должен учитывать все особенности эксперимента и т.о. включать все ступени иерархии. Но давайте посмотрим приведет ли включение срезов к уменьшению P для эффекта "Группы". Для этого нужно знать структуру математических ожидаемых средних квадратов. Исходя из этой структуры проводится оценка значимости эффектов. В рассчитанном вами примере фактор «Группы» оценивался на фактор «Крысы внутри группы». Это можно увидеть по тому, на какой MS делился MS оцениваемого фактора. Фактор «Крысы внутри группы» оценивался на фактор «Поле зрения внутри Крысы», который выступал здесь Ошибкой всего комплекса. Если сейчас мы введем (а это нужно сделать) случайный фактор «Срез внутри Крысы», то MS «Крысы внутри группы» будет делиться на него, а сам он на MS «Поле зрения внутри среза». Таким образом, изменчивость, которая раньше уходила в Ошибку окажется разбитой на 2 части: изменчивость межу срезами и новую Ошибку, которая будет меньше прежней. Это приведет к тому, что эффект «Крысы внутри группы» будет оценен корректнее и точнее, P для него еще уменьшится, но это не значит, что уменьшится сам эффект - SS для этого фактора останется прежней. Введение фактора «Срез внутри Крысы» не затронет отношения средних квадратов MS для фактора «Группы» - он будет прежним. Т.о. иерархия никак не позволяет нам снизить индивидуальную изменчивость крыс, она по-прежнему остается высокой. Что имеем - то имеем. Выход - увеличение числа степеней свободы для фактора «Крыса». Тогда его MS уменьшится и величина F-критерия для «Групп» увеличится. Поскольку эксперимент проведен и количества животных не увеличить - давайте увеличивать степени свободы введением фактора «Время». Возвращаемся на старые позиции: попробуйте написать модель для такого анализа, а я проверю и напишу как это сделать в Statistica, хотя сильно подозреваю что она сдастся - предложить анализировать в другом модуле, что некорректно. (В SPSS принципиальным образом ничего не изменится). Думаю, с иерархическими комплексами мы разобрались

, давайте двинемся к перекрестно-иерархическим. (по терминологии Монтгомери это планы с группированными и пересекающимися факторами - стр. 257).
Фактически я не могу проанализировать данные по полям зрения как связанные выборки, потому что биоптат на 1 сутки никак не привязать к другому биоптату на 2 сутки. Т.е тут связаны крысы, а не биоптаты внутри крыс.
Вот результаты анализа повторных измерений, если брать выборки из средних по каждой крысе.
DEPENDENT = koll1 "koll2";
GROUPS = group(2 3);
DESIGN = group;
INTERCEPT =5670252;
LACKOFFIT = no;
PARAM = sigma;
SSTYPE = 6;
ESTIMATE = none;
SDELTA = 7;
IDELTA = 12;
REPEATED = R1 2;
WDESIGN = R1;
SAMPLE = none;
OUTPUT = none;

Как видно, практически самый выдающийся - эффект взаимодействия, т.е. собственно введение препарата изменяет динамику накопления коллагена в ране.
Вот результаты, если сделать перекрестно-иерархический анализ, где фактор времени - не повторные измерения, а независимые выборки. Получилось все то же самое. Т.е. включение в анализ данных по полям зрения, сгруппированных внутри крыс и изменение плана не изменило F и р у основных эффектов и взаимодействия?
DESIGN = group + time+group*time+rat(group)+rat(group*time)

Пробовала все это делать в Statistica 6.0
С модулем Repeated Measures не работаю по уже указанным причинам. Поэтому по первой таблице ничего не скажу. По второй таблице. Ваш план:
DESIGN = group + time+group*time+rat(group)+rat(group*time)
В нем фактор rat представлен дважды: один раз внутри группы, другой - внутри взаимодействия «Группа*Время». Т.е. он с ошибкой. Эффект rat(group*time) был бы возможен, если бы в каждой группе и временной точке использовались разные животные - такое обычно бывает, когда животные для анализа умерщвляются. Чтобы не запутаться я выписываю главные эффекты (group, time, rat) и начинаю перебирать какие взаимодействия возможны.
group*time. В одной группе в это время y1, в другой - y2. Может.
group*rat. В одной группе крыса имеет y1, в другой она же - y2. Не может. Значит rat(group)
time*rat. В одно время крыса имеет y1, в другой она же - y2. Может.
group*time*rat. Не может, т.к. rat(group). Имеем план:
DESIGN = group + time + rat(group) + group*time + time*rat(group)
Видимо вы уже нашли где это делается в Statistica, но может еще кто будет разбираться, поэтому - путь: Statistics - Advanced Linear/Nonlinear models - General linear models - General linear models. Нужно выбрать Use custom effects и выделяя разные эффекты и их сочетания добиться чтобы все компоненты плана были представлены и обозначались как написал выше. На закладке Option выбрать случайный фактор (rat). Также можно посмотреть Syntax editor и все проверить. ВАЖНО: несмотря на то, что в DESIGN у нас time*rat(group) в итоговой таблице anova приграмма может выдать rat(group*time), хотя считала не этот эффект. Это - небольшая недоработка программистов, т.к. считает она правильно - проверял ее пакетами SPSS, SYSTAT и JMP (разработка SAS). Поэтому и полезно посмотреть DESIGN, а саму итоговую таблицу anova придется подправить, чтобы было Время*Крыса внутри Группы. Кстати, в Statistica 5 и 5.5 все было намного проще: нужно было только отметить что в чем nested и программа сама корректно строила модель из всех возможных сочетаний факторов.
В сложных дисперсионных комплексах если они сбалансированы, то любые подходы дадут одинаковый результат. Но если число наблюдений в ячейках будет сильно различаться - рассмотренный нами классический anova поплывет. На этот случай есть современные подходы, про которые у Монтгомери не написано, описаны в: Shayle R. Searle, George Casella, Charles E. McCulloch. Variance Components (Wiley Series in Probability and Statistics). Книга есть на gigapedia.org. Вроде всё.
Спасибо за объяснения, правда вникаю с трудом пока.
Книгу скачаю, буду читать.
time*rat(group) - можно поподробнее? То есть time*group - этот эффект означает, что препарат изменяет динамику накопления коллагена (замедляет фибропластическую активность, скажем). time*rat(group) если будет достоверен, означает, что этот эффект препарата по разному выражен у разных крыс, допустим - у одних замедляет совсем чуть-чуть, у других сильно - я правильно понимаю?
Еще раз спасибо за подробные объяснения.
Цитата(Varta @ 9.11.2008 - 13:23)

time*rat(group) - можно поподробнее? То есть time*group - этот эффект означает, что препарат изменяет динамику накопления коллагена (замедляет фибропластическую активность, скажем). time*rat(group) если будет достоверен, означает, что этот эффект препарата по разному выражен у разных крыс, допустим - у одних замедляет совсем чуть-чуть, у других сильно - я правильно понимаю?
Да все так и есть. Взаимодействие time*group показывает насколько отличается динамика показателя в группах. Если оно значимо - динамики различны. Интересная особенность применения дисперсионного анализа для изучения различий в динамике - возможность анализировать любые динамики, в том числе те, для которых нет хороших моделей. Мы это уже обсуждали здесь в другой ветке посвященной анализу динамических процессов. Взаимодействие time*rat(group) отражает различия индивидуальных динамик у животных внутри группы. Да, у одних замедляет немного, у других сильно, а у некоторых может и ускоряет (если это теоретически возможно). Этот компонент сам по себе обычно не очень интересен и необходим в первую очередь для полноты разложения дисперсии в комплексе. Но помню анализировал данные по влиянию электростимуляции органов ЖКТ на скорость разрешения послеоперационного пареза. Так там индивидуальная изменчивость оказалась крайне высока. Настолько, что начали с ней разбираться. Оказалось что одни пациенты положительно и сильно реагировали на стимуляцию, а другие - слабее и отрицательно. Первая категория лиц и обеспечивала в целом высокий положительный эффект. Т.о. количественный анализ позволил выйти на качественные различия.
Цитата(nokh @ 10.11.2008 - 19:26)

Но помню анализировал данные по влиянию электростимуляции органов ЖКТ на скорость разрешения послеоперационного пареза. Так там индивидуальная изменчивость оказалась крайне высока. Настолько, что начали с ней разбираться. Оказалось что одни пациенты положительно и сильно реагировали на стимуляцию, а другие - слабее и отрицательно. Первая категория лиц и обеспечивала в целом высокий положительный эффект. Т.о. количественный анализ позволил выйти на качественные различия.
Это на самом деле достаточно важный момент - понять, всем надо назначать лекарство или только части больных. Обычно ставится цель - доказать что лекарство работает у некоего усредненного пациента с какой-либо патологией.
DrgLena
11.11.2008 - 15:34
Позволю себе реплику, не по поводу статистических рекомендаций двух специалистов, которые сами по себе являются весьма ценными, для изучающих статистику. Я по поводу примера, по поводу которого дискуссия возникла. Методика планирования, прежде всего, должна быть корректной. Она должна быть над статистикой. Жаль, что нет такой ветки на форуме, где можно было бы получить столь же профессиональные рекомендации, и причем «нашару», то бишь даром.
Если в эксперименте в двух группах по 6 крыс, то размышления о больных явно преждевременны. И интересует, все же активность фермента, а не число нейтрофилов в биоптатах, методика определения которых, весьма приблизительна. Обычно, активность ферментов в тканях определяют очень точными методами (сперктрофотометрическими), готовя при этом стандартные гомогенаты тканей, и выделяя центрифугированием конкретную фракцию, и в ней определяют активность фермента. Мы, правда, ткани исследуем только после вывода животного из эксперимента, не из биоптата, а в динамике - только кровь. Миелопероксидазу мы не определяем, но массу других ферментов делаем, в частности, глутатионпероксидазу в тканях глаза и печени. Может вам стоит подумать, прежде всего, о методиках, а иначе крыс вам понадобится очень много, этический комитет не одобрит.
Цитата(DrgLena @ 11.11.2008 - 15:34)

Позволю себе реплику, не по поводу статистических рекомендаций двух специалистов, которые сами по себе являются весьма ценными, для изучающих статистику. Я по поводу примера, по поводу которого дискуссия возникла. Методика планирования, прежде всего, должна быть корректной. Она должна быть над статистикой. Жаль, что нет такой ветки на форуме, где можно было бы получить столь же профессиональные рекомендации, и причем «нашару», то бишь даром.
Позволю себе с вами на 200% согласиться. И даже еще немного расширить тему. Беды наших отечественных научных работ в области медицины связаны даже не с незнанием статистики, а с грубыми ошибками в планировании и протоколе исследования. Я уже молчу про выбор конкретного способа измерения интересующего параметра. Но, извиняюсь, часто вижу работы уже как бы в стадии завершения набора материала и статистической обработки. И только на этой стадии вдруг выясняется что, например, у группы исследования соискатель определил показатель до назначения лечения и после, а у группы сравнения - только до. А зачем после - мы же их не лечили? Или еще какие-нибудь "мелочи", благодаря которым, полученные данные пригодны только для украшения мусорного ведра. Наши аспиранты, например, по моему глубокому убеждению, должны первые месяцы аспирантуры, ДО того как начать набирать материал по своей теме, банально учить матчасть, посещать полный учебный день занятия по предметам study design, RCT, clinical epidemiology, GCP, basic statistic, advanced statistic и т.д. и т.п. и кандидатский минимум сдавать не в объеме философии и английского, а в объеме дисциплин "методология клинического исследования" и "биостатистика"
Для просмотра полной версии этой страницы, пожалуйста,
пройдите по ссылке.