Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Парный (paired) критерий Стьюдента?
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
bubnilkin
берём клетки у 1 мыши

вносим их [клетки] на 5 лунок

добавляем в лунку 1 физраствор (нулевой контроль)
в лунку 2 -- вещество А, в лунку 3 -- вещество Б, в лунку 4 -- вещество В

повторяем такой же эксперимент 7 раз (получаем n = 8).


т.к. группы связанные (1 объект (клетки одной и той же мыши) подвергается различным воздействиям (1 контроль и 4 вещества)) делаю repeated measures ANOVA, нахожу различия
для нахождения возможных различий между конкретными группами делаю попарное сравнение для некоторых групп, используя paired two-tailed Student's t test

алгоритм верный?

заранее спасибо
nokh
Повторные измерения - нормально, парный критерий Стьюдента - не совсем корректно, лучше провести запланированные сравнения внутри ANOVA средствами, имеющимися в вашем статпакете. Но если очень срочно - наверное сойдёт и Стьюдент, по крайней мере это будет куда ближе к истине, чем ориентироваться на доверительные интервалы для средних - последние для зависимых выборок совсем не показательны (показательна средняя разность между вариантами с ДИ для неё).
bubnilkin
благодарю за ответ smile.gif
bubnilkin
QUOTE (nokh @ 16.05.2011 - 05:25) *
...лучше провести запланированные сравнения внутри ANOVA средствами...


ещё раз спасибо за ответы smile.gif

т.е. контрасты это честнее (оптимальнее) всего. но, по правде сказать, начал анализировать "после того как", значит в этом случае обязан делать post-hoc анализ...
прочитал ваше руководство по ANOVA в статистике (за что спасибо большое).

там вы приводите Tukey's HSD, но в моём (RM ANOVA, группы зависимые/?/связанные) он, вроде, не подходит (The observations being tested are independent (http://en.wikipedia.org/wiki/Tukey%27s_range_test)) или я путаю?

и потом, т.к. я заранее не запланировал что с чем сравнивать, думаю, что число возм сравнений = 10 (конечно сюда попадают сравнения которые не имеют смысла (в моём случае всего 1), но т.к. я не запланировал то приходится ставить 10.... это верно?)

потом отсекаю некоторые из полученных p методом Holm (1979) (http://en.wikipedia.org/wiki/Holm%E2%80%93Bonferroni_method), на том основании, что групы должны быть связанными, прочитал тут (стр. 4, внизу): nitro.biosci.arizona.edu/workshops/aarhus2006/pdfs/Multiple.pdf)

в некоторых случаях после предыдущего этапа остаются значимые p (для них я записываю M; 95%CI (обратно преобразовав (если расчёты делал в преобразованной шкале или высчитав из непреобразованных, если трансформации не было))

НО.

иногда я не получаю значимых различий:
1/ или на этапе RM ANOVA,
2/ или и на этапе post-hoc (Tukey's HSD ?),
3/ или на этапе Holm.

возникает вопрос: получив "не значимо" сразу делать post-hoc power analysis для метода, который не выявил стат.значимых различий?

к сожалению, в AtteStat пока не реализован (как я понял) требуемый модуль.
нашёл программу G*Power (http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3/download-and-register). справка для свежей версии (3.1.2) пока не заполнена, а для предыдущих (http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/how_to_use_gpower.html) идёт речь о RM ANOVA: within, between, within-between factors.
думаю, что within вариант подходит в моём случае, т.к. в плане 1 фактор (вещество или физ.раствор) и я ищу различия внутри этого фактора (верно?)

для остальных этапов (2/, 3/)пока не нашёл... и нужно ли?

P.S.
про "зависимых выборок ...показательна средняя разность между вариантами с ДИ для неё)." к сожалению, не понимаю...

(спросить больше не у кого, благо есть этот форум и люди, отвечающие на такие дилетантские вопросы)

буду премного благодарен за ответы
DrgLena
Цитата(bubnilkin @ 10.06.2011 - 05:41) *
про "зависимых выборок ...показательна средняя разность между вариантами с ДИ для неё)." к сожалению, не понимаю...

Что именно вы измеряете (считаете). Вы не до конца объяснили суть эксперимента. На какой вопрос вы хотите получить ответ в этом эксперименте?
В 5 лунок внесено одинаковое, (или не одинаковое, но известное) число клеток, и необходимо узнать после каких воздействий клеток стало больше, или меньше? Или вы измеряете уровень каких то показателей до и после 5 видов воздействий?
bubnilkin
smile.gif

Цитата(DrgLena @ 10.06.2011 - 13:08) *
Что именно вы измеряете (считаете)

я считаю долю (процент) лимфоцитов, несущих на своей мембране определённый рецептор, от всех лимфоцитов. например, у меня 2000 лимфоцитов на лунку, из них меня интересует доля (процент,численность) только лимфоцитов с этим самым рецептором, например их 30%, т.е. 600 лимфоцитов с рецептором

Почему я уцепился за проценты, а не за абсолютные числа? т.к. в данном случае (проточная цтометрия) принято анализировать проценты (может быть слишком безапеляционно... но в принципе так -- проценты)
Почему я думаю про распределение Пуассона и почему я "считаю клетки": я предположил это из:
"We would now say that the statistics of counts conform to the Poisson distribution"
в разделе "Poisson Statistics and Precision in Counting" и
"Some people seem to think that counting hundreds of thousands or millions of cells lets them beat the Poisson statistics" из следующего раздела "Rare Event Analysis: The Fundamental Things Apply as Cells Go By"
книги Practical Flow Cytometry (by H.M. Shapiro)
(http://books.google.com/books?id=_fKfABEzCt0C&dq=Beckman+Coulter&q=Poisson+Statistics+and+Precision+in+Counting#v=snippet&q=Poisson%20Statistics%20and%20Precision%20in%20Counting&f=false
Page 19)

Цитата(DrgLena @ 10.06.2011 - 13:08) *
На какой вопрос вы хотите получить ответ в этом эксперименте?

Изменяется ли доля/процент/численность лимфоцитов с данным рецептором при инкубировании при действии разных условий (с разными веществами)?

Цитата(DrgLena @ 10.06.2011 - 13:08) *
В 5 лунок внесено одинаковое, (или не одинаковое, но известное) число клеток

в лунки старался вносить одинаково: 2 млн лейкоцитов (но из них меня интересовали лимфоциты, а из последних -- лимфоциты с определённым рецептором). т.е. я рассчитывал процент лимфоцитов с рецептором на х (на 2000) лимфоцитов

Цитата(DrgLena @ 10.06.2011 - 13:08) *
необходимо узнать после каких воздействий клеток стало больше, или меньше?

да, под воздействием каких веществ

Цитата(DrgLena @ 10.06.2011 - 13:08) *
Или вы измеряете уровень каких то показателей до и после 5 видов воздействий?

нет. все подсчёты лимфоцитов с интересующим рецептором проводил только "после", временные сравнения не предусмотрены


заранее спасибо shuffle.gif
DrgLena
Спасибо, увлекательные объяснения достигли своей цели, я поняла суть, и нашла параллели аналогичных исследований. Многие иммунологические показатели получаю как в абсолютных числах, так и в относительных, т.е. в процентах относительно общего числа лимфоцитов. Чаще анализируют, как раз, последние.
Почему я просила разъяснить суть эксперимента, потому, что на мой взгляд, тут нет связанных выборок с повторными измерениями. Изучается влияние фактора на долю лимфоцитов с определенным рецептором. В группах n=8 и n получено повторением, но например третья повторность в группе А никак не связана с третьей повторностью группы Б, и.т.д. Вот если бы сначала было воздействие А, а потом в те же лунки воздействие Б и вы проводили подсчет после А и после Б, то выборки были бы связанными. Нужно было бы анализировать разницу по каждой лунке.
Поэтому можно использовать обычный однофакторый дисперсионный анализ. Т.к. у вас есть контроль, то лучше после ANOVA использовать критерий Даннета для сравнения групп А Б В с контролем. Все 5 групп наглядно могут быть представлены средними и 95% ДИ.
Nokh писал вам, что для связанных выборок нужно представлять среднюю разность между вариантами с ДИ для неё. Но при этом, у вас будет этих разностей столько, сколько сравнений вы хотите сделать.
bubnilkin
вот я и сел в лужу... insane.gif

спасибо за ответ, а как быть с другими вопросами?
DrgLena
Цитата(bubnilkin @ 13.05.2011 - 05:36) *
алгоритм верный?

Это один вопрос, и я просто предложила другой алгоритм, но вовсе не обязательно, что это абсолютная истина. Гораздо хуже, когда в методиках, основанных на подсчете розеток вообще в некоторые лунки не попадают клетки, на которых их нужно подсчитывать. Как сравнить хотя бы две группы в такий ситуации? Как считать, нет розеткообразрования - это одна ситуация, а не попали клетки - другая. У вас все проще, можете выложить матрицу данных 5х8 , чтобы можно было точнее оценить, как лучше решить Вашу задачу.
bubnilkin
Цитата(DrgLena @ 14.06.2011 - 10:30) *
Это один вопрос, и я просто предложила другой алгоритм, но вовсе не обязательно, что это абсолютная истина.

Я Вас понимаю... (я в смысле про анализ мощности shuffle.gif )

Цитата(DrgLena @ 14.06.2011 - 10:30) *
Гораздо хуже, когда в методиках, основанных на подсчете розеток вообще в некоторые лунки не попадают клетки, на которых их нужно подсчитывать. Как сравнить хотя бы две группы в такий ситуации? Как считать, нет розеткообразрования - это одна ситуация, а не попали клетки - другая. У вас все проще, можете выложить матрицу данных 5х8 , чтобы можно было точнее оценить, как лучше решить Вашу задачу.

конечно, чтобы клетки попали во все лунки равновероятно я их ресуспендировал/взбалтывал непосредственно перед тем как в лунки наливать (здесь мы использовали проточную цитометрию)

Цитата(DrgLena @ 14.06.2011 - 10:30) *
У вас все проще, можете выложить матрицу данных 5х8 , чтобы можно было точнее оценить, как лучше решить Вашу задачу.

в приложенном файле один эксперимент из ~50, характерный для всех проведённых
графа "донор" содержит порядковые номера доноров (вместо фио), данные в остальных графах -- проценты
графа "К" = клетки инкубировавшиеся с физраствором (на самом деле, конечно, с культуральной средой но без добавления веществ; выше писал про физраствор для краткости smile.gif )
DrgLena
Цитата(bubnilkin @ 13.05.2011 - 05:36) *
берём клетки у 1 мыши
....
повторяем такой же эксперимент 8 раз (получаем n = 8).

? А в приведенных данных, действительно связанные выборки, а контроль только один или два, как вы писали в первом посте?
bubnilkin
QUOTE (DrgLena @ 14.06.2011 - 18:46) *
? А в приведенных данных, действительно связанные выборки...?

да, строчка чисел = одна мышь, другая строчка -- другая и т.д.


QUOTE (DrgLena @ 14.06.2011 - 18:46) *
? А в приведенных данных, действительно связанные выборки, а контроль только один или два, как вы писали в первом посте?

извиняюсь, в этих данных 1 контроль (физр-р) (ЛПС убрал, хотя можно и добавить smile.gif )
DrgLena
В приведенных данных другой дизайн исследования, нужно сделать обобщение по многим донорам, и тут ,действительно, связанные выборк,и и должно быть ANOVA для повторных измерений. А в первом посте у вас всего одна мышка, и нужно сравнить средние по 8 параллелям в 5 группах и все. В примере по донором различий между воздействиями A B C D нет, но есть статистически значимые различия между контролем и каждой из этих групп.
DrgLena
Какими статистическими методами пользоваться для получения выводов, затрудняюсь ответить, познакомившись с этими данными. Подобных данных в работе много и хотелось бы, чтобы описанные в материалах и методы их анализа были однотипными. Есть ряд преимуществ использования параметрического ДА, неоднократно обсуждаемых на форуме, однако, традиционно представляемые при этом средние и SD, при таких разбросах данных не характеризуют выборки. Представление данных в виде среднего 6,37 и 4,21 SD, как в группе А, во многих ученых советах приведет к вопросу, почему по значению 2SD ваши значения уйдут в область отрицательных значений. Ответ, как правило, задающий вопрос не знает.
А такое представление, пока что доминирует, все рецензенты хотят видеть средние, иногда SD заменяют m и т.к. оно меньше, то все довольны. Но, известный Леонов поместит такую работу в свою кунсткамеру.
Классиками более показан для этих данных непараметрический ANOVA Фридмана, после чего также необходимы парные сравнения. В этом модуле в Statistica наряду с рангами приводятся и средние и SD, я вставила в график. И становится понятно, что рейтинг рангов и средних по сравниваемым группам может не совпадать, как в данном примере.
bubnilkin
QUOTE (DrgLena @ 15.06.2011 - 09:47) *
В приведенных данных другой дизайн исследования... и должно быть ANOVA для повторных измерений

значит, я так понял, что 1-way RM ANOVA

но я подумал (в который раз smile.gif), что у меня 3 фактора:
1/ Условие (контроль и вещества)
2/ Мышь (8 штук)
3/ Концентрация (0 (для контроля) и X (для веществ)) (хотя этот п.3 думаю = 1, не могу понять...)

QUOTE (DrgLena @ 15.06.2011 - 09:47) *
в первом посте у вас всего одна мышка, и нужно сравнить средние по 8 параллелям в 5 группах и все.

строчка цифр #1 для мышь #1, строчка цифр #2 для мышь #2 и т.д.
bubnilkin
QUOTE (DrgLena @ 15.06.2011 - 13:06) *
Какими статистическими методами пользоваться для получения выводов, затрудняюсь ответить, познакомившись с этими данными.

таких таблиц у меня штук 70 insane.gif ... в 60 -- эксперимент однотипный, в 10 других добавляется ещё 1 концентрация для веществ и добавляется ещё положительный контроль тоже в двух концентрациях (как с этими 10 быть я вообще ума не приложу...).

но все эти 70 можно разделить на 2 класса:
1/ считал процент клеткок с рецептором (почему я и упоминал пуассона)
2/ измерял продукцию цитокинов

выкладывать всё и просить о помощи было бы наглостью...

QUOTE (DrgLena @ 15.06.2011 - 13:06) *
...значения уйдут в область отрицательных значений. Ответ, как правило, задающий вопрос не знает.

да, Вы правы... я тоже задавал себе этот вопрос давно... когда статистика сторила ось ординат начиная с "-5"... так и не смог объяснить себе. а объяснение сложное?

QUOTE (DrgLena @ 15.06.2011 - 13:06) *
А такое представление, пока что доминирует

хочу, чтобы как надо было smile.gif

QUOTE (DrgLena @ 15.06.2011 - 13:06) *
Классиками более показан для этих данных непараметрический ANOVA Фридмана

т.к. распределение ненормальное?

QUOTE (DrgLena @ 15.06.2011 - 13:06) *
после чего также необходимы парные сравнения.

Dunnet ? (но мне и между собой вещества тоже нужно сравнить...)
Tukey's HSD ? (но он для несвязанных вроде)

QUOTE (DrgLena @ 15.06.2011 - 13:06) *
В этом модуле в Statistica наряду с рангами приводятся и средние и SD, я вставила в график. И становится понятно, что рейтинг рангов и средних по сравниваемым группам может не совпадать, как в данном примере.

спасибо за расчёты smile.gif

а как быть с анализом мощности? его на всех этапах проводить, где не было найдено различий?
DrgLena
Мощность не считают по окончании исследования, это - этап планирования. Вы просто выбирая непараметрику теряете мощность, т.к. параметрические критерии более мощные. Post-hoc выбирайте сами от самых консерванивных до очень строгих, я использую Ньюмана-Кейлса и Тьюки, они годятся и для повторных измерений. Выбирая параметрическую ANOVA, важно не столько нормальное распределение самих переменных в совокупности, сколько нормальность остатков. Ждите мнения других участников форума относительно ваших конкретных данных. Цитокины тоже анализирую и уже писала на форуме как.
bubnilkin
спасибо за ответы.

жду smile.gif
nokh
А в чём проблема-то? Обычный дисп. анализ с повторными измерениями. Т.к. были %, можно предварительно преобразовать к/л угловым преобразованием. Но я посмотрел - распределение ошибки и так получается симметричным колоколообразным, т.е. в принципе, можно и не преобразовывать. Через параметрику выходит что все группы кроме последней отличаются от контроля, но не различаются между собой. Можно и через непараметрику, Фридман с последующими post-hoc. У меня получилось, что таким способом отличия значимы только для первой группы и контроля.
bubnilkin
QUOTE (nokh @ 27.06.2011 - 11:57) *
А в чём проблема-то? Обычный дисп. анализ с повторными измерениями. Т.к. были %, можно предварительно преобразовать к/л угловым преобразованием. Но я посмотрел - распределение ошибки и так получается симметричным колоколообразным, т.е. в принципе, можно и не преобразовывать. Через параметрику выходит что все группы кроме последней отличаются от контроля, но не различаются между собой. Можно и через непараметрику, Фридман с последующими post-hoc. У меня получилось, что таким способом отличия значимы только для первой группы и контроля.


спасибо за ответ. да, у меня так же получается. просто хотелось бы уточнить некоторые детали.
про мощность я прочитал.
но тут откуда не возьмись появляется тест Mauchly (http://en.wikipedia.org/wiki/Mauchly%27s_sphericity_test). это критично?
и потом: мой случай 2-х факторная смешанная (fixed - условие культивации (5 уровней), random - мышь) RM ANOVA или однофакторная?

И если группа A отличается от B, а C не отличается от B, как A может не отличаться от C ?
nokh
Цитата(bubnilkin @ 10.07.2011 - 19:32) *
...и потом: мой случай 2-х факторная смешанная (fixed - условие культивации (5 уровней), random - мышь) RM ANOVA или однофакторная?

Это просто разные классификации дисперсионного анализа. Его классифицируют по:
1). По числу факторов:
а) Однофакторный ДА (One-way ANOVA)
б) Двухфакторный ДА (Two-way ANOVA)
в) Многофакторный ДА (Multi-way ANOVA)
2). По модели дисперсионного анализа:
а) Модель I ? с фиксированными факторами
б) Модель II ? со случайными факторами
в) Смешанная модель. Все варианты ДА с повторными измерениями (Repeated measures ANOVA) являются смешанными моделями
3). По классификация факторов в двух- и многофакторных ДА выделяют:
а) Перекрёстную схему анализа ? классический вариант ДА с взаимодействием факторов (Factorial ANOVA).
б) Иерархическую схему (Nested ANOVA).
в) Перекрестно-иерархическую схему (Cross-nested ANOVA).
4). По числу наблюдений в ячейке дисперсионного комплекса:
а) Комплексы с пропущенными значениями
б) Комплексы с единственным наблюдением на ячейку
в) Равномерные комплексы
г) Пропорциональные комплексы
д) Неравномерные комплексы.

По этой классификации ваш анализ: Двухфакторный ДА, смешанная модель, перекрёстная схема и равномерный комплекс.

Т.к. случайный фактор в ДА с повторными измерениями подразумевается самим термином "повторные измерения" (чего? : препаратов, индивидов и т.п.) часто используется и другая терминология именно для ДА с повторными измерениями. Согласно ей помимо индивидов у вас только один фактор.

Т.о. ваш анализ: смешанная модель двухфакторного дисперсионного анализа или однофакторный дисперсионный анализ с повторными измерениями. Думаю вторая формулировка немного точнее, т.к. расшифровывает, что случайный фактор представлял собой индивидов для которых делались повторные измерения.

bubnilkin
QUOTE (nokh @ 4.08.2011 - 20:29) *
Т.о. ваш анализ: ...однофакторный дисперсионный анализ с повторными измерениями...

спасибо, nokh smile.gif
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.