Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Как установить значимость фактора?
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
kaa707
Здравствуйте! Подскажите как выявить значимость фактора (пол, возраст, характер перитонита и тд.) в смерти пациентов. Например: из 498 мужчин умерло 12, а из 107 женщин - 20. И такие данные по другим факторам. Мне сказали, что надо решать через формулу Байеса, но я так и не понял как.
nokh
Если у вас только данные о количестве летальных исходов, то ответы здесь: http://forum.disser.ru/index.php?showtopic=1911. Если есть также данные о времени жизни после операции (как живых, так и умерших пациентов) - используйте методы анализа выживаемости (подойдет модель пропорциональных рисков Кокса, ей на этом форуме уделено много внимания).
DrgLena
Возможно, в какой то степени nokh прав, OR можно рассматривать, как следствие из теоремы Байеса. И сегодня, описанная задача традиционно решается в основном с использованием логистической регрессии.
Но, автор поста имеет установку использовать метод Байеса. Метод имеет и свои преимущества и свои недостатки перед частотным подходом к вероятности. Частотный подход использует только ту информацию, которая получается от непосредственного исследования, и не использует другой, например ранее полученной. Байесовский подход является альтернативным, он использует уже имеющуюся информацию, которой исследователь доверяет. При этом поступающая новая информация может повышать доверие к гипотезе автора. В основе байесовского анализа лежит понятие условной вероятности. Но если коротко, то теорема Б. утверждает, что апостериорная вероятность пропорциональна априорной, умноженной на величину, называемую отношением правдоподобия (LR).
По вашим данным kaa707 смертность от перитонита =32*100/605=5,3%, тогда, априорная вероятность составит 0,053, априорные шансы=0,053/0,947=0,056. А теперь считайте апостериорные шансы=0,056*4,33 (LR)=0,24, А теперь, апостериорную вероятность =0,24/(1+0,24)=0,196. Если больной женского пола вероятность смерти от перитонита возрастает до 19,6%, если мы допускаем априорную вероятность 5,3%, но мы можем принять априорную вероятность другую, например 7%, если больше доверяем этой цифре. И все пересчитать.
Расчеты довольно сложны и требуют специальных пакетов. Но, логически и интуитивно просты.
nokh
Да, теорему Байеса я проигнорировал. Если действительно есть установка на ее использование - нужно действовать в направлении, указанном DrgLen'ой. Но из поста автора непонятно кто ему сказал использовать байесовский подход. Если научный руководитель - одно дело, если посоветовал кто-то из коллег - совсем другое. Все-таки небайесовский частотный (frequentistic) подход к решению таких задач традиционен.
kaa707
Спасибо за ответы! Да, установка на формулу есть. Только, к сожалению, не совсем понятно откуда берутся цифры в примере! апостериорные шансы=0,056*4,33 (LR)=0,24. Откуда 4,33? Также не понятно: апостериорные шансы=0,056*4,33 (LR)=0,24 а апостериорная вероятность =0,24/(1+0,24)=0,196 --- получается шансы выжить 24%, а вероятность смерти 19,6%? а где же остальные%? Или шансы это другое?
Игорь
Цитата(kaa707 @ 27.01.2009 - 09:57) *
Спасибо за ответы! Да, установка на формулу есть. Только, к сожалению, не совсем понятно откуда берутся цифры в примере! апостериорные шансы=0,056*4,33 (LR)=0,24. Откуда 4,33? Также не понятно: апостериорные шансы=0,056*4,33 (LR)=0,24 а апостериорная вероятность =0,24/(1+0,24)=0,196 --- получается шансы выжить 24%, а вероятность смерти 19,6%? а где же остальные%? Или шансы это другое?

К "установке" наверняка прилагался источник[и]. Если не затруднит, сообщите их названия, чтобы понять, о чем речь.
DrgLena
Цитата(kaa707 @ 27.01.2009 - 08:57) *
Откуда 4,33?

LR=чувств./(1-специф.). Чувствительность - вероятность умереть у ж., специфичность - вероятность выжить у мужчин. Пересчитайте, может я ошиблась, руками считала, и будет 4,17. ч.=20/32=0,625 (тут была ошибка 0,65); сп.=12/486
Программа тоже есть, но на домашней машине.
Я пока на работе, ссылки дам из дома.
Но можно начать с http://en.wikipedia.org/wiki/Bayesian_statistics
DrgLena
Цитата(kaa707 @ 27.01.2009 - 08:57) *
Также не понятно: апостериорные шансы=0,056*4,33 (LR)=0,24 а апостериорная вероятность =0,24/(1+0,24)=0,196 --- получается шансы выжить 24%, а вероятность смерти 19,6%? а где же остальные%? Или шансы это другое?

Шанс это шанс, а вероятность это вероятность, и в данном случае я считала шанс и вероятность одного события "смерть". Например шанс 1:3, а вероятность 1:4. Простая формула их связывает: p=odds/(1+odds).

плав
Цитата(DrgLena @ 27.01.2009 - 17:46) *
Шанс это шанс, а вероятность это вероятность, и в данном случае я считала шанс и вероятность одного события "смерть". Например шанс 1:3, а вероятность 1:4. Простая формула их связывает: p=odds/(1+odds).

А я вот не понял, как это можно из одного и того же эксперимента получить и LR и априорные вероятности... Байсовский подход в том и заключается, что использую априорную вероятность, т.е. ту, что была до проведения опыта...
DrgLena
Цитата(DrgLena @ 27.01.2009 - 02:23) *
если мы допускаем априорную вероятность 5,3%, но мы можем принять априорную вероятность другую, например 7%, если больше доверяем этой цифре. И все пересчитать.

В качестве примера расчета приведена 5,3%, априорная может быть любая. Например, по данным литературы, смертность от перитонита от 3% до 8%, но больше вы, все таки, доверяете собственным данным (5,3%) и это будет априорная вероятность. А дальше, появляется ваша информация, что больные у которых вирусная нагрузка выше точки разделения, то LR+=2,4, или это женщина, LR+=3,14 то апостериорная вероятность изменится, и я показала, как ее посчитать. Программа, которая проводит эти расчеты на входе требует Prevalence (вы ее задаете из ваших предыдущих знаний) и значение чувтвительности и специфичности для положительного теста тестируемой переменной. При анализе влияния слудующего фактора, вы изменяете prevalence на полученные ранее значения. Нудно, конечно, после полетов логистической регрессии, но приложенный рисунок впечатляет!
А пример отношений 1/3 и 1/4 просто позволяет понять, как связаны шансы и веротяность, чтобы руками посчитать. Если интересно, возьмем пример из учебника.
kaa707
Спасибо большое! Буду разбираться!
kaa707
[quote name='DrgLena' date='27.01.2009 - 15:53' post='6901']
LR=чувств./(1-специф.). Чувствительность - вероятность умереть у ж., специфичность - вероятность выжить у мужчин. Пересчитайте, может я ошиблась, руками считала, и будет 4,17. ч.=20/32=0,625 (тут была ошибка 0,65); сп.=12/486


Что-то не так. У меня LR совсем другое получается: 0,64. И в итоге апостериорная вероятность 3,5% у женщин и 3,3% у мужчин. Наверное ошибка в LR! На вашем примере ("LR=чувств./(1-специф.). Чувствительность - вероятность умереть у ж., специфичность - вероятность выжить у мужчин.") у меня получилось = Чувствительность 20/32=0,625. Специфичность 12/498=0,024. LR = 0,64!. В итоге апостериорные шансы=0,036, а апостериорная вероятность=0,035. Помогите пожалуйста разобраться до конца! Очень нужно!
DrgLena
Цитата(DrgLena @ 27.01.2009 - 14:53) *
специфичность - вероятность выжить у мужчин. Пересчитайте, может я ошиблась

Да, ошиблась 486/573=0,85
У меня явно что то не то с арифметикой.
kaa707
Посчитал! Наконец-то! Вроде-бы получилось. Шансы смерти у ж=23%, вероятность смерти у ж=18,7%. У м-шансы=2,4%, вероятность=2,3%. Очень соответствует элементарной их же смертности! Это настораживает.
А если других факторов у меня не 2 а 4. Тогда как? Например по времени от начала за болевания (до 6ч, 7-12ч, 13-24ч и более 24ч). Специфичность будет для каждой из групп своя. Например: специф-ть для группы до 6ч=живые во всех других временных промежутках / все живые? А чувствительность=смерть в группе до 6ч / все смерти? Спасибо!
DrgLena
20/32=0.625(ч.), 486/573=0.85(сп.) LR=0.625/(1-0.85)=4.17
18.9% вероятность смерти у женщин! Если госпитальная летальность, которую вы задаете 5,3%. Дальше, если у вас серьезные намерения, пусть считает программа, а то при расчете ручками много ошибок.
kaa707
А какую программу используете?
kaa707
Посчитал! Наконец-то! Вроде-бы получилось. Шансы смерти у ж=23%, вероятность смерти у ж=18,7%. У м-шансы=2,4%, вероятность=2,3%. Очень соответствует элементарной их же смертности! Это настораживает.
А если других факторов у меня не 2 а 4. Тогда как? Например по времени от начала за болевания (до 6ч, 7-12ч, 13-24ч и более 24ч). Специфичность будет для каждой из групп своя. Например: специф-ть для группы до 6ч=живые во всех других временных промежутках / все живые? А чувствительность=смерть в группе до 6ч / все смерти? Спасибо!
DrgLena
Цитата(kaa707 @ 29.01.2009 - 22:32) *
Посчитал! .... вероятность смерти у ж=18,7%.

Не точно, у меня и у программы все же 18,9. Но дело не в этом. Идею вы поняли. А теперь подумайте, какой трудный путь вам предстоит. И какие преимущества вам это даст. Я так поняла, что априорную вероятность вы будете брать свою же, полученную на этих же данных. Не лучше ли все же использовать для оценки вероятности летального исхода логистическую регрессию. Вы получите независимый вклад каждого предиктора (бинарного, рангового или количественного) в виде их количественной оценки (OR) и получить прогноз для каждого больного c учетом значимых факторов. Сегодня, это не просто распространенный метод оценки факторов риска, но и международный стандарт публикаций, позволяющий сравнивать свои результаты с результатами других авторов.
Преимущества для вас при использовании байесовского подхода могут быть в том случае, если у вас нет полных данных ко всем больным в базе. Например, данные по вирусной нагрузке или по иммунологии, маркеры и т.д. сделаны не у всех больных или у других больных, но данные о смертности у них есть, тогда вы можете использовать эти данные.
А при создании регрессионной модели прогноза нужно, чтобы у каждого больного были все исследования. Но возможно, я ошибаюсь, у меня не достаточно знаний байесовских методов, я лично его не использую, но почитала из спортивного интереса, поскольку как то на форуме этот вопрос поднимался.
DoctorStat
Цитата(DrgLena @ 29.01.2009 - 23:59) *
Я так поняла, что априорную вероятность вы будете брать свою же, полученную на этих же данных.
Априорная вероятность берется из посторонних источников. Она используеся в качестве дополнительной информации для уточнения вероятностей и проверки гипотез. Если Вы используете только данные своего опыта, то это не априорная вероятность и не Байесовский подход.
DrgLena
Цитата(DoctorStat @ 30.01.2009 - 12:52) *
Если Вы используете только данные своего опыта, то это не априорная вероятность и не Байесовский подход.

Абсолютно согласна! Но это дает возможность объединить данные разных исследований, т.е. и свои и чужие.
kaa707
[quote name='DrgLena' date='30.01.2009 - 00:59' post='6934']
Не точно, у меня и у программы все же 18,9.



Подскажите какой программой вы пользуетесь для этого?
DrgLena
Я руками считала, а вы получили тот же результат по вашим данным?
Что на входе - prevalence 0,053; sensitiv.=0,625; specif.=0,85. Так? На выходе, что вы хотите получить ? Программа считает 16 показателей, я пометила в пришпиленной картинке то, что, наверное, вам нужно Pos Pred Value 18,9%. Эта программа лицензионная стоит 29,95$ на год, но есть и самоделка на экселе, не моего изготовления. Интерес к этой теме есть только у вас, поэтому, все дальшейшие вопросы задавайте в личную почту и смотрите также свою на этом сайте.
Игорь
Цитата(DrgLena @ 30.01.2009 - 17:43) *
... есть и самоделка на экселе, не моего изготовления ... на этом сайте.

Видимо, на ЭТОМ сайте запрещено упоминать (рекламировать? - в том числе бесплатные русские) программы, если только это не американские SPSS, SAS и STATISTICA?
DrgLena
Если у вас есть что предложить для рекламы или для ознакомления по обсуждаемой теме, пожалуйста, выкладывайте, я выложу самоделку, опять таки американскую бесплатную. Аналог сделать легко.
Игорь
Цитата(DrgLena @ 31.01.2009 - 20:55) *
Если у вас есть что предложить для рекламы или для ознакомления по обсуждаемой теме, пожалуйста, выкладывайте, я выложу самоделку, опять таки американскую бесплатную. Аналог сделать легко.

Для рекламы предложить нечего, т.к. программами не торгую (а зачем реклама без торговли). Для ознакомления - AtteStat, модуль "Непараметрическая ... и анализ качественных ...".
«Укажите, какие компьютерные программы, доступные для широкого пользователя, применялись в Вашей работе». Это из рекомендация WAME.
А есть ли право распространять чужую бесплатную программу. Например, для AtteStat такое право зарезервировано за автором.
DrgLena
Обсуждаемая тема это байесовская статистика, она есть в AtteStat? Вы эту программу рекламируете, но не продаете. А я не рекламирую и не продаю никаких программ, а авторы американской самоделки сами ее вывлжили в интернет (университет Оклахомы) и в моей рекламе не нуждаются.
Игорь
Цитата(DrgLena @ 1.02.2009 - 12:21) *
Обсуждаемая тема это байесовская статистика, она есть в AtteStat?

Задаете претестовую преваленсу - вот и Байесовкий подход (в данном случае, естественно). В упомянутой программе такая возможность есть.

А ведь и правильно - не надо AtteStat (кстати, проект по аналогичным просьбам с 10 февраля закрывается). Купите американские STATISTICA или SPSS (всего-то 100 тысяч рублей, для медиков, видимо, мелочь). Беда в том, что в каждой теме форума эти программы рекламируются, но вряд ли кто из уважаемых диссертантов их купил (оказывается - не мелочь). Вот и получается, что в форуме такой рекламой пропагандируется не то чтобы воровство, но приемлемое отношение к воровству. За уголовщину реально сажать надо, а не пускаться в научные пояснения. Очень надеюсь на это.
DoctorStat
Цитата(Игорь @ 1.02.2009 - 13:11) *
Вот и получается, что в форуме такой рекламой пропагандируется не то чтобы воровство, но приемлемое отношение к воровству.
На этом форуме не пропагандируется воровство коммерческих программ. Здесь объясняется, как применить требуемую программу для решения насущных задач. Вопрос: «Где пользователь приобрел платную программу, и есть ли у него лицензия на ее использование?» должны задавать сотрудники министерства внутренних дел и прокуратуры, а не врачи. Воровство - это юридический, а не медицинский термин.
DrgLena
Цитата(kaa707 @ 29.01.2009 - 22:20) *
А какую программу используете?

Вы могли объяснить, как это сделать в вашей программе
Цитата(Игорь @ 1.02.2009 - 13:11) *
А ведь и правильно - не надо AtteStat (кстати, проект по аналогичным просьбам с 10 февраля закрывается).

По каким просьбам закрывается проект, я не поняла
Цитата(Игорь @ 1.02.2009 - 13:11) *
Вот и получается, что в форуме такой рекламой пропагандируется не то чтобы воровство, но приемлемое отношение к воровству. За уголовщину реально сажать надо, а не пускаться в научные пояснения.

У меня есть лицензионная программа, реально купленная за ту цену, которую я указала, причем я ее не назвала, чтобы рекламу не делать и самоделку не привела, так, что меня зря в уголовщине обвиняете.
Покажате лучше решение примера, который обсуждался и посчитан руками, в вашей программе. Это будет лучшая реклама, а я первый покупатель вашего продукта, опыт покупать программы у меня есть.
Игорь
Цитата(DrgLena @ 1.02.2009 - 14:17) *
У меня есть лицензионная программа, реально купленная за ту цену, которую я указала, причем я ее не назвала, чтобы рекламу не делать и самоделку не привела, так, что меня зря в уголовщине обвиняете.
Покажате лучше решение примера, который обсуждался и посчитан руками, в вашей программе. Это будет лучшая реклама, а я первый покупатель вашего продукта, опыт покупать программы у меня есть.

Я Вас не обвинял ни в чем. Боже упаси. А вот лица, которые спрашивают: "Я тут загрузил программу SPSS. Подскажите, как в ней работать" - потенциальные преступники. Кстати, ко всем программа прилагаются прекрасные руководства. Легко понять, что с ворованными программами они не поставляются. А если бы кто написал: "Я тут угнал автомобиль Мерседес. Подскажите, как отключить сигнализацию, перебить номера и подделать техпаспорт." Помогли бы мы им?

Программа AtteStat не продается.

Кстати, чувствую, что для меня форум исчерпан. Впрочем, как и для ряда других специалистов. Так что одиноким себя не ощущаю.
DrgLena
Цитата(Игорь @ 1.02.2009 - 16:59) *
Кстати, чувствую, что для меня форум исчерпан. Впрочем, как и для ряда других специалистов. Так что одиноким себя не ощущаю.

Вы правы, частично, последний мой вопрос по теории информации, остался без ответа. Но многие полезные вещи, о которых есть след в русскоязычном интернете, есть только на этом форуме. И есть ссылки с других форумов на этот. Все аналогичные форумы, опять таки американские университетские, которые меня подпитывали профессинально, закрылись, их сменили коммерческие, 0,50 центов минута консультации. А у нас тут коммунизм процветает, человек человеку - друг товарищ и брат. Так, что товарищ, не покидайте нас, нас и так мало.
DoctorStat
Цитата(DrgLena @ 1.02.2009 - 19:46) *
Так, что товарищ, не покидайте нас, нас и так мало.
Предлагаю всех участников форума занести в «красную книгу» исчезающих видов, выдать пожизненный «продовольственный паек», служебную машину с «мигалкой» и личным шофером и наградить медалью «За разъяснение политики партии и правительства в сфере медицинских технологий» smile.gif
nokh
Цитата(Игорь @ 1.02.2009 - 15:11) *
А ведь и правильно - не надо AtteStat (кстати, проект по аналогичным просьбам с 10 февраля закрывается). Купите американские STATISTICA или SPSS (всего-то 100 тысяч рублей, для медиков, видимо, мелочь). Беда в том, что в каждой теме форума эти программы рекламируются, но вряд ли кто из уважаемых диссертантов их купил (оказывается - не мелочь). Вот и получается, что в форуме такой рекламой пропагандируется не то чтобы воровство, но приемлемое отношение к воровству. За уголовщину реально сажать надо, а не пускаться в научные пояснения. Очень надеюсь на это.

Игорь, Вы слишком болезненно реагируете на происходящее. Все, что Вы так отстаиваете - будет, но на это нужно время. Сколько лет развиваются коммерческие пакеты типа SAS и SPSS? И сколько развивался Ваш AtteStat - год? полтора? Ожидание, что все разом откажутся от многолетних традиций (в т.ч. пиратских) и набросятся на долгожданный русскоязычный бесплатный пакет - это нереальное ожидание. Уже года 3 как вышел русскоязычный OpenOffice лишь в деталях уступающий по удобству MS Office, соотечественники им пользуются, но многие ли? Существуют целые научные школы, в которых секреты статистического мастерства передаются по наследству от учителя ученику в виде последовательности действий в конкретной программе - как правило пиратской, например в той же Statistic'e. Неужели вы хотели разорвать эту цепь преемственности одним проектом! Думаю, что даже если обяжут указывать № лицензии на ПО в диссертациях и публикациях, то народ просто станет писать, что делали все в R и других бесплатных пакетах, и еще долго будет делать по старинке. Но ситуация меняется. Я сужу хотя бы по своему рабочему компьютеру в котором 8 лет назад весь софт был пиратский (сомневаюсь, что у Вас дела обстояли принципиально иначе), а сейчас - лицензионная ОС, 3 коммерческие программы, куча свободного софта и только пара-тройка пиратских программ, которые нужны нерегулярно. И когда я найду им замену - я откажусь и от них, нужно еще немного времени. И еще. У меня в разделе статистического софта более 50 бесплатных программ и программок по статистике в экологии, генетике, медицине, по геостатистике, визуализации и Data mining. Некоторые еще ДОСовские, им по 10 и более лет. И все эти годы они преспокойно, безо всяких демаршей, лежат на сайтах авторов, проектов, университетов. Качественные нишевые продукты. Некоторые обновлялись, некоторые нет. И пусть через годы, но они находят своего пользователя. Зачем же закрывать проект в который столько вложено в самом его начале?, причем с удалением софта? Мысли вслух: Можно перевести его на бесплатный хостинг. Если он не окупается удовлетворенным самолюбием - можно установить счетчик закачек и обязать пользователей ссылаться на программу, а выходные данные опубликованных статей присылать автору - так делают. Поскольку серьезные журналы требуют ссылок не на сайты, а на публикации - сделать обзорную публикацию по возможностям программы, а то и брошюру с примерами. Также сделать гостевую книгу с замечаниями и пожеланиями - без обратной связи проект костенеет и начинает отображать представления автора о том, что нужно, а не то, что нужно реально. Рискну спрогнозировать, что и при этом на раскрутку потребуется не менее 3 лет. А то, что AtteStat не рекламируется на форуме - неправда. И на этом, и на других ( http://molbiol.ru/forums/index.php?showtopic=201368 , url # 7). Но нужно (было?) больше времени.
плав
Проблема в том, что одним форумом ситуацию не изменить. Сами товарищи из Statsoft, например, своими книгами, которые заменяют руководства приложили руку к тому, чтобы под словом "статистическая программа" понимали Statistica. Работая (с довольно большим) количеством аспирантов и соискателей могу сказать, что плетью обуха не перешибешь и если просто игнорировать запросы на вопросы "а как сделать это в Statistica" люди просто уйдут в другое место. В Statistica легко делать плохую статистику, но за счет простоты это можно. Но плохую статистику можно делать и в других программах, создатели не виноваты. Что же касается программ - то они должны быть разными. Кому-то нравится R и SAS, кому-то SPSS, кому-то российская Stadia, кому-то нужен модуль в Excel, кто-то тащится от S-plus. А мои коллеги например, после моих введений с использованием R начинают предлагать использовать небольшой, но удобный "калькулятор" WinPepi.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.