Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

2 страниц V  < 1 2  
Добавить ответ в эту темуОткрыть тему
> Нужна помощь!!, Заворачивают с кандидатской диссертацией. :((
p2004r
сообщение 19.11.2011 - 14:48
Сообщение #16





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(x-rays @ 19.11.2011 - 14:25) *
пробую считать модель со смешанными эффектами.
Правильно ли я понимаю, что если в моем исследовании стеноз до 30% и более 30% - есть фиксированный тип признака (перевод может быть не совсем точный) и он коррелирует с наличием изменений на стороне этого самого стеноза, то все ок и я могу посыпать голову пеплом))?


0. у вас дифдиагноз в ситуации когда стеноз уже установлен как факт. и все что дает модель относится _только_ к этой ситуации

1. сам по себе стеноз в процентах не переменная типа да-нет, её такой делаете вы сами преобразовывая проценты стеноза в бинарную переменную.

2. доказательство что уровни вложенного (иерархического) дизайна можно опустить для конкретной модели надо доказать недостоверностью соответствующих уровней в связи с независимыми переменными которые предсказывают сделанную вами бинарную переменную. Просто корреляцией тут не обойтись.


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
x-rays
сообщение 19.11.2011 - 18:49
Сообщение #17





Группа: Пользователи
Сообщений: 12
Регистрация: 17.11.2011
Пользователь №: 23308



Цитата(p2004r @ 19.11.2011 - 14:48) *
2. То что уровни вложенного (иерархического) дизайна можно опустить для конкретной модели надо доказать недостоверностью соответствующих уровней в связи с независимыми переменными которые предсказывают сделанную вами бинарную переменную.


Это очень сложно(( до меня доходит как до дерева...
Имеется ввиду, что правая или левая (уровни иерархии) не имеет значение по отношению к стенозам 30% и более 30% ?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 19.11.2011 - 20:14
Сообщение #18





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(x-rays @ 19.11.2011 - 18:49) *
Это очень сложно(( до меня доходит как до дерева...
Имеется ввиду, что правая или левая (уровни иерархии) не имеет значение по отношению к стенозам 30% и более 30% ?


у вас есть и "правая-левая" и "пациент", причем первая вложена во вторую. эти эффекты будут отражены в модели и показана их значимость. уже можно что то сказать. ну и конечно можно исключать потом определенные уровни и смотреть как отличаются модели.

как то так (пример из хелпа пакета lme4 в R)

Код
## generalized linear mixed model
     (gm1 <- glmer(cbind(incidence, size - incidence) ~ period + (1 | herd),
                   family = binomial, data = cbpp))
     ## GLMM with individual-level variability (accounting for overdispersion)
     cbpp$obs <- 1:nrow(cbpp)
     (gm2 <- glmer(cbind(incidence, size - incidence) ~ period +
         (1 | herd) +  (1|obs),
                   family = binomial, data = cbpp))
     anova(gm1,gm2)


только здесь факторы herd и obs не вложены, в книжке на стр.631 ?c nested within b which in turn is nested within a? пишется в формуле как а/b/c

например:
There is a single fixed effect (Treatment), and pseudoreplication enters the dataframe because
each rat?s liver is cut into three pieces and each separate liver bit produces two readings.
The rats are numbered 1 and 2 within each treatment, so we need Treatment as the largest
scale of the random effects.

model<-lmer(Glycogen~Treatment+(1|Treatment/Rat/Liver))



Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
9oclock
сообщение 20.11.2011 - 22:40
Сообщение #19





Группа: Пользователи
Сообщений: 6
Регистрация: 20.11.2011
Пользователь №: 23314



как я понял, существенно менять диссер уже не получится((
но и надеяться на то, что не будет спецов в статистике тоже не стоит - ведь тут дело даже не в статистике, а в здравом смысле! Вы пытаетесь выявить стаистически значимые отличия в выборке и найти корреляции, используя пересекающиеся (!) группы.

если вы ни в какую не хотите отзывать работу и все-таки выходить на защиту, то мой совет следующий:
1. как уже советовали - разбить нормально на группы: 1: в обеих > 30, 2: только в правой > 30, 3: только в левой >30, 4: в обоих < 30. И быстренько посчитать так. Чтобы просто знать как там дела на самом деле. Можно воспользоваться услугами - полно людей, которые занимаются статистической обработкой - например, http://exacts.ru/statistics или http://statlab.kubsu.ru/node/1. Потом подготовить "запасные" слайды, чтобы если будут вопросы на эту тему было чем отсреляться. Если после такого расчета выявится что-то значимое и это по смыслу совпадет с вашими выводами, то вам лишний плюсик. Если из-за малого количества пациентов в группе при таком разделении окажется, что статистика "не сыграет" - вам опять же лишний плюсик, можете рассуждать, что при разделении на 4 группы не получилось набрать необходимую по колву выборку и пришлось использовать "более сложные статистические методы с пересекающимися группами" (написал в кавычках, так как в принципе не понимаю как такое возможно, но раз люди тут вам пишут...). Кстати то, что по колву человек группы разные не должно вас смущать! это не главное, если отличия в параметрах существенные, то даже на маленькой выборке можно получить статистически значимые выводы.
2. пытаться логично сформулировать гипотезу так, чтобы и такое деление на группы казалось логичным. Понятно, что если так делить, то рассматриваете не людей, а органы. Причем тут тоже есть свои "но!", потому что не совсем понятно как вы делали стат анализ... у вас получается выборка увеличилась за счет тех у которых одна >30 а другая <30, так?

то, что вас с таким "порно" допустили до защиты, это обнадеживает... может быть и проскочите smile.gif Удачи!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 21.11.2011 - 11:09
Сообщение #20





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(9oclock @ 20.11.2011 - 22:40) *
и пришлось использовать "более сложные статистические методы с пересекающимися группами" (написал в кавычках, так как в принципе не понимаю как такое возможно, но раз люди тут вам пишут...).


уверяю что эта "параллельная реальность" существует не только в моем воображении

https://stat.ethz.ch/pipermail/r-sig-mixed-models/



Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
9oclock
сообщение 21.11.2011 - 13:00
Сообщение #21





Группа: Пользователи
Сообщений: 6
Регистрация: 20.11.2011
Пользователь №: 23314



Цитата(p2004r @ 21.11.2011 - 12:09) *
уверяю что эта "параллельная реальность" существует не только в моем воображении

https://stat.ethz.ch/pipermail/r-sig-mixed-models/


а в каком-то более воспринимаемом виде на эту тему нет материала - в виде статьи, например... или может прям кто-то применял такие подходы?
по ссылке этой - там туча всего, люди обсуждают уже какие-то детали (вплоть до команд в программе), а по сути не понятно... правда, может быть, я и не очень внимательно смотрел - почувствовал, что тут можно пару дней убить и не стал smile.gif А вами конечно можно гордиться - пытаетесь идти в ногу со временем и остальным миром - думаю в чем, а уж в статистике швейцарцы понимают)))))))))

мне сам принцип не понятен... зачем анализировать условно назовем "отличия" в пересекающихся группах... ведь любому понятно, что в этом случае, чем больше это пересечение, тем меньше будет отличие. ну вот не могу я себе представить некий естественный механизм (в организме и какой-либо другой системе), который нужно было бы отлавливать таким образом)))
другое дело, от бедности - ну нет большой выборки... и могу допустить, что светлые умы что-то такое придумали, чтобы искусственно ее увеличить, но без потери качества - космос конечно, но мало ли))

сами посудите - представим у нас 2 группы по 100 чел, в них 50 - общие))) т.е. когда мы будем по всем измеряемым параметрам пытаться найти значимые отличия, то нам всегда будут "вставлять палки в колеса" эти 50! ведь для них эти величины идентичны и получается, что они только размывают нам желанные отличия, которые, допустим, действительно есть.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 21.11.2011 - 14:11
Сообщение #22





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(9oclock @ 21.11.2011 - 13:00) *
а в каком-то более воспринимаемом виде на эту тему нет материала - в виде статьи, например... или может прям кто-то применял такие подходы?


выше в дискуссии я несколько раз ссылался на книжку в которой изложена суть и приведены ключевые слова

основные для понимания это Fixed effects и Random effects

вот линк на еще одну книжку http://www.dartmouth.edu/~eugened/index.php http://www.dartmouth.edu/~eugened/index.ph...=summary_points

на википедии достаточно много ссылок http://en.wikipedia.org/wiki/Mixed_model

практически некоторые уровни дизайна эксперимента просто могут оказаться несущественны, некоторые мы можем вывести за модель в которой мы измеряем то что нам надо...

С группами не так... "группа" это фактически фактор, тоесть признак по которому варианта относится в искуственно выделяемую выборку. Все варианты объединяет то что у них измерена некая величина(ы). Ну вот факторам можно отдать часть (ко)вариации эксперимента.

Например группа объявляется признаком каждому уровню которой свой интерцепт регрессионной модели может соответствовать. И избыточность данных позволяет просто построить семейство регрессий у которых наложено условие что коэффициент при интересующим нас параметре общий, а интерцепты индивидуальны для каждого уровня фактора "объект наблюдения".

ну и эти факторы в которые у нас превратились "суконнопосконные" группы естественно могут быть вложенными... анализ и покажет значимо ли сочетание уровней получившегося плана эксперимента. И исключить несущественные уровни по объективно причине.

Причем эту вложенность и пересечение не избежать например в измерениях которые повторяются во времени и измерениях данных с пространственной привязкой.

Сообщение отредактировал p2004r - 21.11.2011 - 14:25


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 21.11.2011 - 16:17
Сообщение #23





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Цитата(p2004r @ 21.11.2011 - 15:11) *
основные для понимания это Fixed effects и Random effects

Основное для понимания ? что есть зависимая переменная, а что есть независимые.
9oclock и я, очевидно, в одной реальности, а р2004r считает переменную, которая является откликом (зависимая переменная), фактором и предлагает изучать фиксированные или смешанные эффекты этой переменной, а не на эту переменную.

Нам ничего не известно о том, какой метод использовал автор поста, может просто проценты сравнивал, доказывая, что чаще был инсульт с той стороны, где имеется стеноз, или логистическую регрессию для зависимой переменной имеющей 3 градации (нет стеноза, односторонний и нет вообще), или t критерий при сравнении кровотока на стороне стеноза и без стеноза, что более всего вероятно. Почему же мы должны использовать терминологию дисперсионного анализа и говорить о случайных или смешанных эффектах. А чтобы ?замылить? очи руководителю, который изволил почитать уже готовый автореферат, а статьи он читал?, там он, наверное, первый автор. Если есть что то опубликованное, дайте ссылку, пожалуйста.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
9oclock
сообщение 21.11.2011 - 17:05
Сообщение #24





Группа: Пользователи
Сообщений: 6
Регистрация: 20.11.2011
Пользователь №: 23314



Цитата(DrgLena @ 21.11.2011 - 17:17) *
а статьи он читал?, там он, наверное, первый автор. Если есть что то опубликованное, дайте ссылку, пожалуйста.


А действительно! Как-то сразу не сообразил - раз диссер подан, значит где-то сие опубликовано)))
да, тут не столько, наверное, ошибка диссертанта, сколько руководителя
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
x-rays
сообщение 21.11.2011 - 17:34
Сообщение #25





Группа: Пользователи
Сообщений: 12
Регистрация: 17.11.2011
Пользователь №: 23308



Цитата
Нам ничего не известно о том, какой метод использовал автор поста, может просто t критерий при сравнении кровотока на стороне стеноза и без стеноза, что более всего вероятно.

именно так и было...
Цитата
Если есть что то опубликованное, дайте ссылку, пожалуйста.


Зачем...чтоб всех подставить?!
Мой руководитель - милый человек и я ему обязан своим поступлением в аспирантуру и тем опытом "клиническим", который он мне дал...

Неладное подметил оппонент, честь ему и хвала! Хоть кто-то вчитался в мою работу!

В конце концов, статистика- это злая вещь...при совершенно правильном дизайне исследования можно понять, что определенный процент людей с злокачественными опухолями ел манку с комочками в детском саду))

Сообщение отредактировал x-rays - 21.11.2011 - 17:35
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
x-rays
сообщение 21.11.2011 - 17:40
Сообщение #26





Группа: Пользователи
Сообщений: 12
Регистрация: 17.11.2011
Пользователь №: 23308



Цитата(9oclock @ 21.11.2011 - 17:05) *
А действительно! Как-то сразу не сообразил - раз диссер подан, значит где-то сие опубликовано)))
да, тут не столько, наверное, ошибка диссертанта, сколько руководителя


Да, я даже не задумывался о вкравшейся ошибке дизайна... Все теперь очень печально.
Вообще очень грустно - видеть как "делается наука" изнутри.
Как пишут диссеры, подгоняя под нужный результат данные.
Как делают 100 вместо 30 пациентов,
Как защищаются на высосанных из пальца темах папенькины сынки,
как не до конца удаляют опухоль, чтоб пациент вернулся на повторные операции....
и т.д и т.п.
Тупо, грустно! Не хочу быть таким.

Сообщение отредактировал x-rays - 21.11.2011 - 17:40
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 21.11.2011 - 18:42
Сообщение #27





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(DrgLena @ 21.11.2011 - 16:17) *
Основное для понимания ? что есть зависимая переменная, а что есть независимые.
9oclock и я, очевидно, в одной реальности, а р2004r считает переменную, которая является откликом (зависимая переменная), фактором и предлагает изучать фиксированные или смешанные эффекты этой переменной, а не на эту переменную.


с прискорбием вижу, что в предположениях о моих "ошибках" счет уже 3:0 frown.gif

нет, я совершенно ясно сказал что строится модель
glmer(степень_стеноза~ предикторы + (1|человек/сторона), family = binomial)

откуда из этого можно сделать вывод о том что зависимая переменная "степень_стеноза" не является откликом?

обратите внимание на описание дизайна: "сторона" внутри "человек". что тут не так? все уровни эксперимента воспроизводятся в модели.

Кроме того, это совершенно принятый (уже и степень активности специализированного листа рассылки привел и кучу ссылок) способ изучить псевдорепликацию не способом "мамой клянусь глазные дела зависят от стороны стеноза", а доказать это статистически.

PS собственно R и придумали, что бы не упражняться в филологических описаниях хода анализа (и пытаться их понять), а однозначно излагать свои мысли.



Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
x-rays
сообщение 21.11.2011 - 19:33
Сообщение #28





Группа: Пользователи
Сообщений: 12
Регистрация: 17.11.2011
Пользователь №: 23308



tо p2004r :

Да, порой тяжело менять что-то в устоявшемся сознании, шаблонности, стереотипах поведения других.

Не обвиняю никого, ни в чем, т.к. сам в этом - полный лох.

Просто недавно поехал к другому профессору за отзывом на автореферат...он сидел, долго пытался открыть мою флешку, чтоб отпечатать отзыв (мною написанный)
После серии неудачных попыток, он отказал мне в просьбе поискать другой компьютер с работающим USB портом, а протянут визитку и попросил прислать ему на е-мейл мои "бумажки".
Причем днем раньше я предлагал этот-же вариант, и получил отказ - мол, приезжайте к 9.00, - "Это вам надо, или мне?"
А ехать мне пришлось с щелковской до щукинской)) и встать в 6.00..
Ну это я о наболевшем....

На основе ваших ответов подготовил текст для отстреливания от статист нападок))
зацените, может подшлифуете..:

"Все правильно, пациенты 1-й группы встречаются во 2-й и наоборот,
Здесь вторичную роль играет то, к какой группе относится пациент.
На первом плане для статистической обработки – то, какой тип стеноза.
Согласен, что по тяжести диагноза и тактике ведения пациент с хотя бы одним значимым стенозом сразу попадает в свою ?колею? ( желательно на операцию), а с незначимым – в свою – динамическое наблюдение и консервативное лечение. Это логично.
В начале работы мы думали, что правильнее было-бы сгруппировать данные без псевдорепликации , т.е. создать 3-ю группу пациентов со смешанными стенозами (значимыми и незначимыми у одного пациента) Но в этом случае группы получались слишком малочисленные.
Поэтому пришлось намеренно сгруппировать по случаям.
Сам по себе стеноз в процентах не переменная типа да-нет, его таким делаем мы сами преобразовывая данные о гемодинамической значимости в бинарную переменную.

При таком искусственном дизайне имеется иерархия "левая-правая" внутри "пациент", целевая бинарная "умеренный-сильный" (ну и куча независимых параметров модели). (КАКИХ ЕЩЕ?)
То что уровни( КАКИЕ НАПРИМЕР?) вложенного (иерархического) дизайна можно опустить для этой конкретной модели доказывалось недостоверностью соответствующих уровней в связи с независимыми переменными которые предсказывают сделанную нами бинарную переменную.
У нас дифдиагноз в ситуации, когда стеноз уже установлен как факт. и все что дает модель относится _только_ к этой ситуации
Сообственно, для случаев с неустранимым дефектом в дизайне эксперимента и предназначена модель со смешанными эффектами

строится модель так:
glmer(степень_стеноза~ предикторы + (1|человек/сторона), family = binomial)
зависимая переменная "степень_стеноза" является откликом
описание дизайна: "сторона" внутри "человек" все уровни эксперимента воспроизводятся в модели.

Важным моментом, статистической обработки было задействование функции ?generalized mixed model? для борьбы с псевдоповторами.
Об этом методе подробно описано в книге.
Michael J. Crawley - The R Book глава 19. (книгу прилагаю)

Пришлось применить generalized mixed model для борьбы с Pseudoreplication

если ?c nested within b which in turn is nested within a?

то пишем lme(fixed = y~1, random = ~ 1 | a/b/c) или lmer(y~1+( 1 | a/b/c))

В принципе модель со смешанными эффектами как бы и предназначена для исследования возможности сокращения схемы полного факторного дизайна за счет не влияющих на модель сочетаний факторов.
Можно изучать фиксированные или смешанные эффекты этой переменной, а не влияния на эту переменную.
Кроме того, это совершенно принятый способ изучить псевдорепликацию не способом "мамой клянусь глазные дела зависят от стороны стеноза", а доказать это статистически.Собственно, R и придумали, что бы не упражняться в филологических описаниях хода анализа (и пытаться их понять), а однозначно излагать свои мысли.

Ковариация (от англ. covariation - "совместная вариация") - мера линейной зависимости двух величин.

Сообщение отредактировал x-rays - 21.11.2011 - 19:47
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 21.11.2011 - 19:38
Сообщение #29





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



Ошибка планирования статистикой не лечится. Хоть у нас статистика и ?прикладная?, это не значит, что ее можно к больному месту как попало прикладывать smile.gif .
Чтобы однозначно излагать свои мысли, иметь R не обязательно, можно даже и калькулятора не иметь. А чему вы R научите, то он вам и выдаст. Вряд ли , R разработали, чтобы лечить корявые дизайны. Неужели вы всерьез думаете, что доктор, который Стьюдентом уже все порешал, будет сейчас R изучать, модель на защите демонстрировать или использовать какие то магические слова для ответа рецензенту.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
p2004r
сообщение 21.11.2011 - 20:07
Сообщение #30





Группа: Пользователи
Сообщений: 1091
Регистрация: 26.08.2010
Пользователь №: 22699



Цитата(DrgLena @ 21.11.2011 - 19:38) *
Ошибка планирования статистикой не лечится. Хоть у нас статистика и ?прикладная?, это не значит, что ее можно к больному месту как попало прикладывать smile.gif .
Чтобы однозначно излагать свои мысли, иметь R не обязательно, можно даже и калькулятора не иметь. А чему вы R научите, то он вам и выдаст. Вряд ли , R разработали, чтобы лечить корявые дизайны. Неужели вы всерьез думаете, что доктор, который Стьюдентом уже все порешал, будет сейчас R изучать, модель на защите демонстрировать или использовать какие то магические слова для ответа рецензенту.


1. Очень часто эксперимент не управляем, а является всего навсего наблюдением. И "другого дизайна у меня для вас нет" (С) Природа-мать-ваша smile.gif (nb. насчет конкретно этого случая я сразу писал в начале треда). Кроме того, наши потуги при планировании дизайна тоже нуждаются в проверке, и данный метод хорош и массово востребован.

2. Насчет "однозначно излагать" не согласен, поскольку если поступить по моему то хоть желание потроллить у собеседников отпадает. Ну и метрологические проблемы как то сами собой переходят из разряда пенисометрии в область метрологии smile.gif.

3. Ну после где то 4 итерации вероятность уже упала до весьма низкой (хотя шансы есть, в конце концов я никого не сужу за глаза, всегда можно ошибиться). четкий план как поступить я предлагал сразу.

да, модель если там с десяток предикторов даст длинный листинг, его надо думать-сокращать... можно и не успеть. frown.gif

но я лично никогда не сдаюсь в стремлении помогать людям smile.gif кроме того все это по любому полезно. :-|

PS а вообще во многом думаю из-за такого отношения к статистике (не обязательно и не столько этот тред, здесь хоть вменяемый человек, виновата среда...) сложилось положение со ссылками на медицинские работы из региона бСССР frown.gif

Сообщение отредактировал p2004r - 21.11.2011 - 20:09


Signature
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

2 страниц V  < 1 2
Добавить ответ в эту темуОткрыть тему