Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Нужна помощь!!
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
x-rays
Суть в следующем:
Изучаем атеросклероз сонных артерий .
Как известно, у человека 2 сонные артерии - правая и левая.
Таким образом у 1 пациента 2 сонных артерий всего.
Существует разная степень стеноза ( сужение просвета до 30 %, когда еще не надо оперироваться и более 30% когда уже пора под нож:) )

Целью работы является выявление мозговых, глазных и т.п. признаков наличия стеноза до и более 30% а так-же оценка данных кровотока по этим артериям...

У меня данные 140 пациентов, т.е. 280 сонных артерий.
У одного о того-же пациента может быть 2 проявления этого заболевания (до 30% с одной стороны и более 30% с другой) Это же альтернативный признак?

Разбил на группы так:
В 1-ю группу были включены 149 случаев стеноза сонных артерий более 30% у 105 пациентов.
Во 2-ю группу вошли 110 случаев стеноза менее 30% сонных артерий у 86 пациентов.

Таким образом получилось, что пациенты из 1 гр есть во 2-й и наоборот.

Профессор говорит, что так нельзя. Но объяснить почему - не может, Я сомневаюсь...
Как ему толково объяснить, что можно? Или переписывать диссер ??
Помогите, пожалуйста!
p2004r
Цитата(x-rays @ 17.11.2011 - 20:38) *
Профессор говорит, что так нельзя. Но объяснить почему - не может, Я сомневаюсь...


В модель придется добавить фактор "пациент". Иначе теряется случайность данных.




x-rays
Цитата(p2004r @ 17.11.2011 - 22:26) *
В модель придется добавить фактор "пациент". Иначе теряется случайность данных.

спасибо
Если не затруднит можно пояснить что имеется ввиду на моем примере?
p2004r
Цитата(x-rays @ 17.11.2011 - 22:44) *
спасибо
Если не затруднит можно пояснить что имеется ввиду на моем примере?


понадобится применить linear mixed model или скорее в данном случае generalized mixed model для борьбы с Pseudoreplication

если ?c nested within b which in turn is nested within a?

то пишем lme(fixed = y~1, random = ~ 1 | a/b/c) или lmer(y~1+( 1 | a/b/c))
x-rays
СПАСИБО!!!
Эта информация видимо очень ценна, но мне нужно словами объяснить профессору, что мой способ разделения имеет право на жизнь,
потому-что....
Боюсь что "linear mixed model и generalized mixed model для борьбы с Pseudoreplication" он не осилит, так же как и я....
хотя, я начинаю понимать...поправьте если я ошибусь...
Все путем, потому что при стат. обработке результатов мы применили спец метод генерализованой смешанной модели для избавления от псевдоповторов....так?
П.С. я в статистике самый настоящий "ДУХ".
p2004r
Цитата(x-rays @ 18.11.2011 - 00:14) *
СПАСИБО!!!
Эта информация видимо очень ценна, но мне нужно словами объяснить профессору, что мой способ разделения имеет право на жизнь,
потому-что....
Боюсь что "linear mixed model и generalized mixed model для борьбы с Pseudoreplication" он не осилит, так же как и я....
хотя, я начинаю понимать...поправьте если я ошибусь...
Все путем, потому что при стат. обработке результатов мы применили спец метод генерализованой смешанной модели для избавления от псевдоповторов....так?
П.С. я в статистике самый настоящий "ДУХ".


Для аргументов в разговоре можно прочитать 19 главу книги The R Book от Michael J. Crawley. (она попадается в интернете, там просто рассказано) Только не забудьте потом выполнить эти вычисления smile.gif
x-rays
Цитата(p2004r @ 18.11.2011 - 00:20) *
Для аргументов в разговоре можно прочитать 19 главу книги The R Book от Michael J. Crawley. (она попадается в интернете, там просто рассказано) Только не забудьте потом выполнить эти вычисления smile.gif

weep.gif
спасибо... сейчас буду ее покупать....
Уже скачал в торрентах!!!
буду переводить..
DrgLena
Цитата(x-rays @ 18.11.2011 - 00:32) *
weep.gif
спасибо... сейчас буду ее покупать....

Руководитель прав. Статистика не исправит ошибки в методологии. Объектом исследования является больной ( а не его правая или левая артерия), которому на основании ряда исследований нужно дать ответ о необходимости операции и этот ответ да или нет. А для ответа на этот вопрос каждый больной в исследовании должен принадлежать только к одной группе, есть ли у него сужение более 30% (на одной или на двух ветках) или нет.
x-rays
Цитата(DrgLena @ 18.11.2011 - 00:52) *
Объектом исследования является больной ( а не его правая или левая артерия), которому на основании ряда исследований нужно дать ответ о необходимости операции и этот ответ да или нет.

Спасибо за мнение, противоположное предыдущему и близкое ко мнению моего профессора! Теперь я совсем в растерянности.
Почему нельзя примениеть методику стат обработки данных для исключения pseudoreplications?
Я запутываюсь! Объект исследования - больной, или его 2 артерии, которые могут иметь 2- степени проявлени болезни ?!
Понятно, что нельзя рассматривать артерии отдельно от больного...
У нас задача не дать ответ -оперироваться или нет, а выявить симптомокомплекс , которые чаще проступает на стороне более грубого сосудистого поражения (Ну типа инсульты или преходящие поражения зрения чаще со стороны, где артерия сильнее сужена)
Внесите ясность!!
DrgLena
Цитата(x-rays @ 18.11.2011 - 10:06) *
Я запутываюсь! Объект исследования - больной, или его 2 артерии, которые могут иметь 2- степени проявлени болезни ?!

Вот вы уже все и объяснили, можно выделить три группы больных. Группа с двухсторонним стенозом, с односторонним, причем важно L или R, и без выраженного стеноза. Теперь вы можете доказать мне, что у больных с односторонним стенозом на стороне поражения чаще наблюдаются соответствующие стороне стеноза глазные проблемы.
Относительно того, что больной может быть только в одной клинической группе, есть литература по доказательной медицине, вы сами можете эту информацию найти, лучше, если это сделаете вы, а не ваши оппоненты . В основе моего мнения ? только логика и опыт анализа офтальмологических данных.
p2004r
Цитата(x-rays @ 18.11.2011 - 09:06) *
Спасибо за мнение, противоположное предыдущему и близкое ко мнению моего профессора! Теперь я совсем в растерянности.
Почему нельзя примениеть методику стат обработки данных для исключения pseudoreplications?
Я запутываюсь! Объект исследования - больной, или его 2 артерии, которые могут иметь 2- степени проявлени болезни ?!
Понятно, что нельзя рассматривать артерии отдельно от больного...
У нас задача не дать ответ -оперироваться или нет, а выявить симптомокомплекс , которые чаще проступает на стороне более грубого сосудистого поражения (Ну типа инсульты или преходящие поражения зрения чаще со стороны, где артерия сильнее сужена)
Внесите ясность!!


Я лично исхожу в совете из того, что "глобус и сова выданы".

Безусловно в первую очередь модель со смешанными эффектами предназначена для случаев с неустранимым дефектом в дизайне эксперимента.

Ваш руководитель прав в том смысле что Вы можете группировать данные без псевдорепликации.

У Вас при таком искусственном дизайне имеется иерархия "левая-правая" внутри "пациент", целевая бинарная "умеренный-сильный" (ну и куча независимых параметров модели).

В принципе модель со смешанными эффектами как бы и предназначена для исследования возможности сокращения схемы полного факторного дизайна за счет не влияющих на модель сочетаний факторов.

Вот экологи ломают копья
http://www.ievbras.ru/ecostat/Kiril/Article/A30/12/12_r.htm
x-rays
to DrgLena
Цитата
Вот вы уже все и объяснили, можно выделить три группы больных. Группа с двухсторонним стенозом, с односторонним, причем важно L или R, и без выраженного стеноза.

При таком разделении в группы получаются неравнозначны по кол-ву человек, чуть ли не 25 со стенозом более 30% (r+l r, l), 15 со стенозом менее 30% (r+l r, l) и 120 (смешанных)

Цитата
Теперь вы можете доказать мне, что у больных с односторонним стенозом на стороне поражения чаще наблюдаются соответствующие стороне стеноза глазные проблемы.

Это доказуемо, и видно даже в сырых необсчитанных данных... Могу ли я это два верхних пункта взять за ооправдание моему кривому дизайну....
Причем, когда мы переходим к интерпретации данных гемодинамики в экстраокуляоных сосудах, тут "более выгодно" рассматривать не пациентов, а именно артерии в вышележащих отделах( типа глазные R и L и изменение параметров по отношению к нижележащим сонным R и L)

Ключевой момент - я не имею возможности перепечатать весь диссер, разослать заново все авторефераты и предоставить на защите совсем другую работу (((
Я хочу защитить эту)))
Спасибо за советы... по крайней мере я не буду мямлить что-то непонятное, а скажу определенными терминами, что мое исследование кривое, и это намеренно, и это не запрещено.... и т.п.
x-rays
to p2004r
СПАСИБО, вы вселяете мне моральные силы и надежду, что не все так плохо..
как вы думаете, на защите кандидатской много людей разбираются в статистическом вопросе? insane.gif
p2004r
Цитата(x-rays @ 18.11.2011 - 17:45) *
как вы думаете, на защите кандидатской много людей разбираются в статистическом вопросе? insane.gif


откуда ж знать, это как карта ляжет smile.gif

надо все таки посчитать модель со смешанными эффектами. сразу скажу что она большая получается (да вы сами в книге видите пример какого объема). подготовить слайды (показывать их только если зададут конкретный вопрос о кривом дизайне). если косяков влияющих на выводы в анализе выявлено не будет, можно этим размахивать выкрикивая умные слова из книги и посыпая голову пепелом что не удалось (или вообще невозможно) набрать группы достаточного размера для классического дизайна эксперимента. можно наверное нанять спеца по статанализу который в теме и сможет отвечать на очень уж глубоко копающие вопросы.

но лучше если до этого не дойдет конечно.
x-rays
Цитата(p2004r @ 19.11.2011 - 10:47) *
откуда ж знать, это как карта ляжет smile.gif

надо все таки посчитать модель со смешанными эффектами. сразу скажу что она большая получается (да вы сами в книге видите пример какого объема). подготовить слайды (показывать их только если зададут конкретный вопрос о кривом дизайне). если косяков влияющих на выводы в анализе выявлено не будет, можно этим размахивать выкрикивая умные слова из книги и посыпая голову пепелом что не удалось (или вообще невозможно) набрать группы достаточного размера для классического дизайна эксперимента. можно наверное нанять спеца по статанализу который в теме и сможет отвечать на очень уж глубоко копающие вопросы.

но лучше если до этого не дойдет конечно.

пробую считать модель со смешанными эффектами.
Правильно ли я понимаю, что если в моем исследовании стеноз до 30% и более 30% - есть фиксированный тип признака (перевод может быть не совсем точный) и он коррелирует с наличием изменений на стороне этого самого стеноза, то все ок и я могу посыпать голову пеплом))?
p2004r
Цитата(x-rays @ 19.11.2011 - 14:25) *
пробую считать модель со смешанными эффектами.
Правильно ли я понимаю, что если в моем исследовании стеноз до 30% и более 30% - есть фиксированный тип признака (перевод может быть не совсем точный) и он коррелирует с наличием изменений на стороне этого самого стеноза, то все ок и я могу посыпать голову пеплом))?


0. у вас дифдиагноз в ситуации когда стеноз уже установлен как факт. и все что дает модель относится _только_ к этой ситуации

1. сам по себе стеноз в процентах не переменная типа да-нет, её такой делаете вы сами преобразовывая проценты стеноза в бинарную переменную.

2. доказательство что уровни вложенного (иерархического) дизайна можно опустить для конкретной модели надо доказать недостоверностью соответствующих уровней в связи с независимыми переменными которые предсказывают сделанную вами бинарную переменную. Просто корреляцией тут не обойтись.
x-rays
Цитата(p2004r @ 19.11.2011 - 14:48) *
2. То что уровни вложенного (иерархического) дизайна можно опустить для конкретной модели надо доказать недостоверностью соответствующих уровней в связи с независимыми переменными которые предсказывают сделанную вами бинарную переменную.


Это очень сложно(( до меня доходит как до дерева...
Имеется ввиду, что правая или левая (уровни иерархии) не имеет значение по отношению к стенозам 30% и более 30% ?
p2004r
Цитата(x-rays @ 19.11.2011 - 18:49) *
Это очень сложно(( до меня доходит как до дерева...
Имеется ввиду, что правая или левая (уровни иерархии) не имеет значение по отношению к стенозам 30% и более 30% ?


у вас есть и "правая-левая" и "пациент", причем первая вложена во вторую. эти эффекты будут отражены в модели и показана их значимость. уже можно что то сказать. ну и конечно можно исключать потом определенные уровни и смотреть как отличаются модели.

как то так (пример из хелпа пакета lme4 в R)

Код
## generalized linear mixed model
     (gm1 <- glmer(cbind(incidence, size - incidence) ~ period + (1 | herd),
                   family = binomial, data = cbpp))
     ## GLMM with individual-level variability (accounting for overdispersion)
     cbpp$obs <- 1:nrow(cbpp)
     (gm2 <- glmer(cbind(incidence, size - incidence) ~ period +
         (1 | herd) +  (1|obs),
                   family = binomial, data = cbpp))
     anova(gm1,gm2)


только здесь факторы herd и obs не вложены, в книжке на стр.631 ?c nested within b which in turn is nested within a? пишется в формуле как а/b/c

например:
There is a single fixed effect (Treatment), and pseudoreplication enters the dataframe because
each rat?s liver is cut into three pieces and each separate liver bit produces two readings.
The rats are numbered 1 and 2 within each treatment, so we need Treatment as the largest
scale of the random effects.

model<-lmer(Glycogen~Treatment+(1|Treatment/Rat/Liver))

9oclock
как я понял, существенно менять диссер уже не получится((
но и надеяться на то, что не будет спецов в статистике тоже не стоит - ведь тут дело даже не в статистике, а в здравом смысле! Вы пытаетесь выявить стаистически значимые отличия в выборке и найти корреляции, используя пересекающиеся (!) группы.

если вы ни в какую не хотите отзывать работу и все-таки выходить на защиту, то мой совет следующий:
1. как уже советовали - разбить нормально на группы: 1: в обеих > 30, 2: только в правой > 30, 3: только в левой >30, 4: в обоих < 30. И быстренько посчитать так. Чтобы просто знать как там дела на самом деле. Можно воспользоваться услугами - полно людей, которые занимаются статистической обработкой - например, http://exacts.ru/statistics или http://statlab.kubsu.ru/node/1. Потом подготовить "запасные" слайды, чтобы если будут вопросы на эту тему было чем отсреляться. Если после такого расчета выявится что-то значимое и это по смыслу совпадет с вашими выводами, то вам лишний плюсик. Если из-за малого количества пациентов в группе при таком разделении окажется, что статистика "не сыграет" - вам опять же лишний плюсик, можете рассуждать, что при разделении на 4 группы не получилось набрать необходимую по колву выборку и пришлось использовать "более сложные статистические методы с пересекающимися группами" (написал в кавычках, так как в принципе не понимаю как такое возможно, но раз люди тут вам пишут...). Кстати то, что по колву человек группы разные не должно вас смущать! это не главное, если отличия в параметрах существенные, то даже на маленькой выборке можно получить статистически значимые выводы.
2. пытаться логично сформулировать гипотезу так, чтобы и такое деление на группы казалось логичным. Понятно, что если так делить, то рассматриваете не людей, а органы. Причем тут тоже есть свои "но!", потому что не совсем понятно как вы делали стат анализ... у вас получается выборка увеличилась за счет тех у которых одна >30 а другая <30, так?

то, что вас с таким "порно" допустили до защиты, это обнадеживает... может быть и проскочите smile.gif Удачи!
p2004r
Цитата(9oclock @ 20.11.2011 - 22:40) *
и пришлось использовать "более сложные статистические методы с пересекающимися группами" (написал в кавычках, так как в принципе не понимаю как такое возможно, но раз люди тут вам пишут...).


уверяю что эта "параллельная реальность" существует не только в моем воображении

https://stat.ethz.ch/pipermail/r-sig-mixed-models/

9oclock
Цитата(p2004r @ 21.11.2011 - 12:09) *
уверяю что эта "параллельная реальность" существует не только в моем воображении

https://stat.ethz.ch/pipermail/r-sig-mixed-models/


а в каком-то более воспринимаемом виде на эту тему нет материала - в виде статьи, например... или может прям кто-то применял такие подходы?
по ссылке этой - там туча всего, люди обсуждают уже какие-то детали (вплоть до команд в программе), а по сути не понятно... правда, может быть, я и не очень внимательно смотрел - почувствовал, что тут можно пару дней убить и не стал smile.gif А вами конечно можно гордиться - пытаетесь идти в ногу со временем и остальным миром - думаю в чем, а уж в статистике швейцарцы понимают)))))))))

мне сам принцип не понятен... зачем анализировать условно назовем "отличия" в пересекающихся группах... ведь любому понятно, что в этом случае, чем больше это пересечение, тем меньше будет отличие. ну вот не могу я себе представить некий естественный механизм (в организме и какой-либо другой системе), который нужно было бы отлавливать таким образом)))
другое дело, от бедности - ну нет большой выборки... и могу допустить, что светлые умы что-то такое придумали, чтобы искусственно ее увеличить, но без потери качества - космос конечно, но мало ли))

сами посудите - представим у нас 2 группы по 100 чел, в них 50 - общие))) т.е. когда мы будем по всем измеряемым параметрам пытаться найти значимые отличия, то нам всегда будут "вставлять палки в колеса" эти 50! ведь для них эти величины идентичны и получается, что они только размывают нам желанные отличия, которые, допустим, действительно есть.
p2004r
Цитата(9oclock @ 21.11.2011 - 13:00) *
а в каком-то более воспринимаемом виде на эту тему нет материала - в виде статьи, например... или может прям кто-то применял такие подходы?


выше в дискуссии я несколько раз ссылался на книжку в которой изложена суть и приведены ключевые слова

основные для понимания это Fixed effects и Random effects

вот линк на еще одну книжку http://www.dartmouth.edu/~eugened/index.php http://www.dartmouth.edu/~eugened/index.ph...=summary_points

на википедии достаточно много ссылок http://en.wikipedia.org/wiki/Mixed_model

практически некоторые уровни дизайна эксперимента просто могут оказаться несущественны, некоторые мы можем вывести за модель в которой мы измеряем то что нам надо...

С группами не так... "группа" это фактически фактор, тоесть признак по которому варианта относится в искуственно выделяемую выборку. Все варианты объединяет то что у них измерена некая величина(ы). Ну вот факторам можно отдать часть (ко)вариации эксперимента.

Например группа объявляется признаком каждому уровню которой свой интерцепт регрессионной модели может соответствовать. И избыточность данных позволяет просто построить семейство регрессий у которых наложено условие что коэффициент при интересующим нас параметре общий, а интерцепты индивидуальны для каждого уровня фактора "объект наблюдения".

ну и эти факторы в которые у нас превратились "суконнопосконные" группы естественно могут быть вложенными... анализ и покажет значимо ли сочетание уровней получившегося плана эксперимента. И исключить несущественные уровни по объективно причине.

Причем эту вложенность и пересечение не избежать например в измерениях которые повторяются во времени и измерениях данных с пространственной привязкой.
DrgLena
Цитата(p2004r @ 21.11.2011 - 15:11) *
основные для понимания это Fixed effects и Random effects

Основное для понимания ? что есть зависимая переменная, а что есть независимые.
9oclock и я, очевидно, в одной реальности, а р2004r считает переменную, которая является откликом (зависимая переменная), фактором и предлагает изучать фиксированные или смешанные эффекты этой переменной, а не на эту переменную.

Нам ничего не известно о том, какой метод использовал автор поста, может просто проценты сравнивал, доказывая, что чаще был инсульт с той стороны, где имеется стеноз, или логистическую регрессию для зависимой переменной имеющей 3 градации (нет стеноза, односторонний и нет вообще), или t критерий при сравнении кровотока на стороне стеноза и без стеноза, что более всего вероятно. Почему же мы должны использовать терминологию дисперсионного анализа и говорить о случайных или смешанных эффектах. А чтобы ?замылить? очи руководителю, который изволил почитать уже готовый автореферат, а статьи он читал?, там он, наверное, первый автор. Если есть что то опубликованное, дайте ссылку, пожалуйста.
9oclock
Цитата(DrgLena @ 21.11.2011 - 17:17) *
а статьи он читал?, там он, наверное, первый автор. Если есть что то опубликованное, дайте ссылку, пожалуйста.


А действительно! Как-то сразу не сообразил - раз диссер подан, значит где-то сие опубликовано)))
да, тут не столько, наверное, ошибка диссертанта, сколько руководителя
x-rays
Цитата
Нам ничего не известно о том, какой метод использовал автор поста, может просто t критерий при сравнении кровотока на стороне стеноза и без стеноза, что более всего вероятно.

именно так и было...
Цитата
Если есть что то опубликованное, дайте ссылку, пожалуйста.


Зачем...чтоб всех подставить?!
Мой руководитель - милый человек и я ему обязан своим поступлением в аспирантуру и тем опытом "клиническим", который он мне дал...

Неладное подметил оппонент, честь ему и хвала! Хоть кто-то вчитался в мою работу!

В конце концов, статистика- это злая вещь...при совершенно правильном дизайне исследования можно понять, что определенный процент людей с злокачественными опухолями ел манку с комочками в детском саду))
x-rays
Цитата(9oclock @ 21.11.2011 - 17:05) *
А действительно! Как-то сразу не сообразил - раз диссер подан, значит где-то сие опубликовано)))
да, тут не столько, наверное, ошибка диссертанта, сколько руководителя


Да, я даже не задумывался о вкравшейся ошибке дизайна... Все теперь очень печально.
Вообще очень грустно - видеть как "делается наука" изнутри.
Как пишут диссеры, подгоняя под нужный результат данные.
Как делают 100 вместо 30 пациентов,
Как защищаются на высосанных из пальца темах папенькины сынки,
как не до конца удаляют опухоль, чтоб пациент вернулся на повторные операции....
и т.д и т.п.
Тупо, грустно! Не хочу быть таким.
p2004r
Цитата(DrgLena @ 21.11.2011 - 16:17) *
Основное для понимания ? что есть зависимая переменная, а что есть независимые.
9oclock и я, очевидно, в одной реальности, а р2004r считает переменную, которая является откликом (зависимая переменная), фактором и предлагает изучать фиксированные или смешанные эффекты этой переменной, а не на эту переменную.


с прискорбием вижу, что в предположениях о моих "ошибках" счет уже 3:0 frown.gif

нет, я совершенно ясно сказал что строится модель
glmer(степень_стеноза~ предикторы + (1|человек/сторона), family = binomial)

откуда из этого можно сделать вывод о том что зависимая переменная "степень_стеноза" не является откликом?

обратите внимание на описание дизайна: "сторона" внутри "человек". что тут не так? все уровни эксперимента воспроизводятся в модели.

Кроме того, это совершенно принятый (уже и степень активности специализированного листа рассылки привел и кучу ссылок) способ изучить псевдорепликацию не способом "мамой клянусь глазные дела зависят от стороны стеноза", а доказать это статистически.

PS собственно R и придумали, что бы не упражняться в филологических описаниях хода анализа (и пытаться их понять), а однозначно излагать свои мысли.

x-rays
tо p2004r :

Да, порой тяжело менять что-то в устоявшемся сознании, шаблонности, стереотипах поведения других.

Не обвиняю никого, ни в чем, т.к. сам в этом - полный лох.

Просто недавно поехал к другому профессору за отзывом на автореферат...он сидел, долго пытался открыть мою флешку, чтоб отпечатать отзыв (мною написанный)
После серии неудачных попыток, он отказал мне в просьбе поискать другой компьютер с работающим USB портом, а протянут визитку и попросил прислать ему на е-мейл мои "бумажки".
Причем днем раньше я предлагал этот-же вариант, и получил отказ - мол, приезжайте к 9.00, - "Это вам надо, или мне?"
А ехать мне пришлось с щелковской до щукинской)) и встать в 6.00..
Ну это я о наболевшем....

На основе ваших ответов подготовил текст для отстреливания от статист нападок))
зацените, может подшлифуете..:

"Все правильно, пациенты 1-й группы встречаются во 2-й и наоборот,
Здесь вторичную роль играет то, к какой группе относится пациент.
На первом плане для статистической обработки – то, какой тип стеноза.
Согласен, что по тяжести диагноза и тактике ведения пациент с хотя бы одним значимым стенозом сразу попадает в свою ?колею? ( желательно на операцию), а с незначимым – в свою – динамическое наблюдение и консервативное лечение. Это логично.
В начале работы мы думали, что правильнее было-бы сгруппировать данные без псевдорепликации , т.е. создать 3-ю группу пациентов со смешанными стенозами (значимыми и незначимыми у одного пациента) Но в этом случае группы получались слишком малочисленные.
Поэтому пришлось намеренно сгруппировать по случаям.
Сам по себе стеноз в процентах не переменная типа да-нет, его таким делаем мы сами преобразовывая данные о гемодинамической значимости в бинарную переменную.

При таком искусственном дизайне имеется иерархия "левая-правая" внутри "пациент", целевая бинарная "умеренный-сильный" (ну и куча независимых параметров модели). (КАКИХ ЕЩЕ?)
То что уровни( КАКИЕ НАПРИМЕР?) вложенного (иерархического) дизайна можно опустить для этой конкретной модели доказывалось недостоверностью соответствующих уровней в связи с независимыми переменными которые предсказывают сделанную нами бинарную переменную.
У нас дифдиагноз в ситуации, когда стеноз уже установлен как факт. и все что дает модель относится _только_ к этой ситуации
Сообственно, для случаев с неустранимым дефектом в дизайне эксперимента и предназначена модель со смешанными эффектами

строится модель так:
glmer(степень_стеноза~ предикторы + (1|человек/сторона), family = binomial)
зависимая переменная "степень_стеноза" является откликом
описание дизайна: "сторона" внутри "человек" все уровни эксперимента воспроизводятся в модели.

Важным моментом, статистической обработки было задействование функции ?generalized mixed model? для борьбы с псевдоповторами.
Об этом методе подробно описано в книге.
Michael J. Crawley - The R Book глава 19. (книгу прилагаю)

Пришлось применить generalized mixed model для борьбы с Pseudoreplication

если ?c nested within b which in turn is nested within a?

то пишем lme(fixed = y~1, random = ~ 1 | a/b/c) или lmer(y~1+( 1 | a/b/c))

В принципе модель со смешанными эффектами как бы и предназначена для исследования возможности сокращения схемы полного факторного дизайна за счет не влияющих на модель сочетаний факторов.
Можно изучать фиксированные или смешанные эффекты этой переменной, а не влияния на эту переменную.
Кроме того, это совершенно принятый способ изучить псевдорепликацию не способом "мамой клянусь глазные дела зависят от стороны стеноза", а доказать это статистически.Собственно, R и придумали, что бы не упражняться в филологических описаниях хода анализа (и пытаться их понять), а однозначно излагать свои мысли.

Ковариация (от англ. covariation - "совместная вариация") - мера линейной зависимости двух величин.
DrgLena
Ошибка планирования статистикой не лечится. Хоть у нас статистика и ?прикладная?, это не значит, что ее можно к больному месту как попало прикладывать smile.gif .
Чтобы однозначно излагать свои мысли, иметь R не обязательно, можно даже и калькулятора не иметь. А чему вы R научите, то он вам и выдаст. Вряд ли , R разработали, чтобы лечить корявые дизайны. Неужели вы всерьез думаете, что доктор, который Стьюдентом уже все порешал, будет сейчас R изучать, модель на защите демонстрировать или использовать какие то магические слова для ответа рецензенту.

p2004r
Цитата(DrgLena @ 21.11.2011 - 19:38) *
Ошибка планирования статистикой не лечится. Хоть у нас статистика и ?прикладная?, это не значит, что ее можно к больному месту как попало прикладывать smile.gif .
Чтобы однозначно излагать свои мысли, иметь R не обязательно, можно даже и калькулятора не иметь. А чему вы R научите, то он вам и выдаст. Вряд ли , R разработали, чтобы лечить корявые дизайны. Неужели вы всерьез думаете, что доктор, который Стьюдентом уже все порешал, будет сейчас R изучать, модель на защите демонстрировать или использовать какие то магические слова для ответа рецензенту.


1. Очень часто эксперимент не управляем, а является всего навсего наблюдением. И "другого дизайна у меня для вас нет" (С) Природа-мать-ваша smile.gif (nb. насчет конкретно этого случая я сразу писал в начале треда). Кроме того, наши потуги при планировании дизайна тоже нуждаются в проверке, и данный метод хорош и массово востребован.

2. Насчет "однозначно излагать" не согласен, поскольку если поступить по моему то хоть желание потроллить у собеседников отпадает. Ну и метрологические проблемы как то сами собой переходят из разряда пенисометрии в область метрологии smile.gif.

3. Ну после где то 4 итерации вероятность уже упала до весьма низкой (хотя шансы есть, в конце концов я никого не сужу за глаза, всегда можно ошибиться). четкий план как поступить я предлагал сразу.

да, модель если там с десяток предикторов даст длинный листинг, его надо думать-сокращать... можно и не успеть. frown.gif

но я лично никогда не сдаюсь в стремлении помогать людям smile.gif кроме того все это по любому полезно. :-|

PS а вообще во многом думаю из-за такого отношения к статистике (не обязательно и не столько этот тред, здесь хоть вменяемый человек, виновата среда...) сложилось положение со ссылками на медицинские работы из региона бСССР frown.gif
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.