Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

3 страниц V   1 2 3 >

paravoz
Отправлено: 30.11.2018 - 03:06





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(p2004r @ 29.11.2018 - 22:34) *
не отчаивайтесь, может через пять дет очередной заход даст больше жира


Хорошо, заведу такую традицию - раз в 5 лет ходить в на форум с вопросом о доверительных интервалах для смертности. smile.gif Лет через 70-80 может быть опубликую статью о динамике мнений относительного данного вопроса!
  Форум: Медицинская статистика · Просмотр сообщения: #23551 · Ответов: 24 · Просмотров: 23043

paravoz
Отправлено: 29.11.2018 - 15:18





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Ок. Коллеги, сдаюсь!!! Раз уж медико-статистическая элита считает, что ДИ можно и нужно считать и только я единственный кто считает иначе, то буду считать. smile.gif smile.gif smile.gif
Спасибо всем за терпение, комментарии и глубокий мыслительный процесс!
  Форум: Медицинская статистика · Просмотр сообщения: #23544 · Ответов: 24 · Просмотров: 23043

paravoz
Отправлено: 28.11.2018 - 09:19





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Да, этот вопрос я уже поднимал 5 лет назад, но к какой-то внятной общей позиции тогда, насколько я помню, мы не пришли.
Посмотрел в Гугле confidence interval for prevalence, но во всех найденных материалах либо напрямую указывается на выборочные исследования, либо о том в каком (сплошном или выборочном) исследовании рассчитывается ДИ для prevalence не указано.
Несколько убеждает приведение ДИ для заболеваемости ВОЗ, но дело в том, что ВОЗ по разным странам использует лишь выборочные данные. В большинстве стран мира не ведется такого стат.учета как в России. Поэтому для оценки смертности, заболеваемости и т.д. ВОЗ использует выборочные исследования, в которых ДИ вполне оправдан. Не разбирался, что за данные (выборочные или по данным сплошного наблюдения) приведены по Вашим ссылкам, но даже готов предположить, что там приведены данные по результатам сплошного наблюдения и вполне правомочно рассчитаны ДИ.

Коллеги, с расчетами ДИ для роста или возраста всего населения (то есть вроде как генеральной совокупности) все понятно. Хотя не понятно, что этот интервал показывает. Упростим задачу. Есть два дома. В одном доме проживает 10 человек и в другом доме проживает 10 человек. Стоит задача определить в каком из этих домов люди в среднем старше. Не знаю зачем это может быть необходимо, но допустим это необходимо управляющей компании зачем-то. Предположим, что распределение возрастов подчиняется закону нормального распределения. Посчитав средний возраст в 1 доме, получили 35,2 года, во 2 доме - 54,8 года. Даже посчитали стандартное отклонение. В первом доме 8,3 года, во втором - пусть тоже 8,3. Как мне кажется, задача решена. Даже без учета стандартного отклонения и дальнейшего расчета критерия Стьюдента, можно сказать, что во втором доме жители в среднем старше, чем в первом.

Предположим, что я задачу решил неправильно. И каким-нибудь методом (бутстрепом или простым расчетным путем через ошибку среднего) посчитаем доверительные интервалы, которые показывают вероятный интервал среднего возраста в какой-то совокупности. Вот непонятно в какой. В районе? Так управляющей компании не надо знать средний возраст в районе. Ей надо знать в этих конкретных двух домах. Может этой совокупностью является другие моменты времени, в которые не проводилось исследование возраста? То есть интервалы среднего возраста, который может оказаться завтра или послезавтра? Но это тоже не интересует управляющую компанию. Грубо говоря выводы и действия, которые управляющая компания совершает на основании среднего возраста, необходимо совершить сегодня, а не завтра или послезавтра. Завтра или послезавтра УК снова проведет по данным прописанного в домах населения это небольшое исследование. Я вот к чему. В данном очень упрощенном примере зачем этот самый ДИ, на какую совокупность экстраполируется средний возраст и зачем он вообще в данном случае для принятия решения управляющей компанией?

Вернусь к смертности. Если бы мы имели какое-то распределение смертности, например за 10 лет или за 1 год, но по разным регионам, то можно было бы посчитать ДИ опять же бутстрепом или расчетным путем. Но мы имеем данные только за 1 год по одному региону. Например, умерло 1000 человек, среднегодовая численность за этот год составила 100000 человек. Посчитали смертность получилось 1000 на 100000 населения. Считаем ДИ. Например, получили ДИ равное 100. Бутстрепом же мы его посчитать не можем? Из чего извлекать подвыборки, если мы имеем только два числа 1000 умерших и 100000 населения? Не можем мы генерировать случайные числа от 0 до 1000? Если можем, то почему до 1000, а не до 2000 или 10000? Хорошо. Посчитали ДИ расчетным путем по формулам, которые приводятся в различных руководствах. Получается интервал от 900 до 1100 на 100000 населения.

Самый главный вопрос ради которого я так много написал вот в чем. Что показывает данный интервал?
Он показывает вероятные значения смертности в предыдущие или в последующие периоды в этом же регионе? Предыдущие мы знаем и так, а последующие нам пока не нужны.
Или вероятные значения смертности в изучаемый период в других регионах? Это думаю в принципе невозможно.
Или вероятные значения смертности в изучаемый период в более крупном территориальном образовании - в федеральном округе? Это тоже думаю не возможно, так как один регион не является репрезентативной выборкой для федерального округа.
Или вероятные значения смертности в течение года в изучаемом регионе? Но это тоже невозможно, так как методика расчета ДИ, учитывающая только значения числа умерших (1000) и среднегодовой численности населения (100000) не может учитывать внутригодовые колебания. То есть какие бы небыли внутригодовые колебания умирающих в каждый отдельный день ДИ всегда будет одним и тем же, так как при расчете учитываются только число умерших и численность населения. Соответственно такой ДИ не может отражать внутригодовые колебания.
У меня закончились варианты того, что может отражать ДИ для смертности. Давайте этот список продолжим, может в нем появится истина. smile.gif smile.gif smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23540 · Ответов: 24 · Просмотров: 23043

paravoz
Отправлено: 27.11.2018 - 14:58





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(passant @ 27.11.2018 - 16:57) *
4. Вывод. "Количество заболевших" - никаких ДИ, достаточно непосредственно измеренных абсолютных данных. Но ограниченные возможности анализа и интерпретации. А вот "уровень заболеваемости" - статистическая величина с необходимым интервальным представлением параметров. Зато полная свобода для дальнейшего анализа.

Вот как-то так. Не знаю, удалось-ли мне хоть немного "популяризировать" математику, но я старался rolleyes.gif


Интересная позиция, даже вполне понятная. Я пока пытаюсь дальше поразмышлять на предмет того, может ли среднегодовая численность населения рассматриваться с той позиции, которую Вы описываете.

Даже если предположить, что такие умозаключения верны, то как быть например с таким коэффициентом. Уж простите, но это первое что пришло в голову. Коэффициент младенческой смертности = число детей, умерших в течение года на 1 году жизни / число родившихся живыми в данном году * 1000. В данном случае и числитель и знаменатель точные абсолютные величины, которые определяются на конец года. Получается ли, что для данного показателя нельзя считать ДИ.

И второе. Если действительно можно для заболеваемости рассчитать ДИ, то что это за интервал? Ну то есть вероятное значение заболеваемости в какой совокупности он показывает? По логике вещей в генеральной. Но что, в данном случае, будет являться генеральной совокупностью?
Я к чему. Пусть с математической точки зрения ДИ для заболеваемости использовать можно. Допустим (хоть я пока не совсем с этим согласен smile.gif ). Но какой в этом ДИ "физический смысл". Если у выборки из населения города посчитать средний рост и для него построить ДИ, то можно сказать, что ДИ это вероятный интервал среднего роста всего населения города. А в данном случае что будет являться этой самой генеральной совокупностью?

PS. Вами действительно высказана интересная позиция, но, правда, пока не могу понять как ее принять. smile.gif smile.gif
  Форум: Медицинская статистика · Просмотр сообщения: #23535 · Ответов: 24 · Просмотров: 23043

paravoz
Отправлено: 27.11.2018 - 03:53





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(nokh @ 26.11.2018 - 16:34) *
Для меня это тоже был мучительный вопрос, хорошо что больше "играю на другом поле":) Но недавно участвовал в статье по генетическим нарушениям (ещё не закончили) и решил таки считать ДИ. Помимо отмеченного р2004r хронологического аспекта, есть ещё и хорологический аспект. Такие работы делаются как правило не для того, чтобы только охарактеризовать интересующую совокупность сейчас и здесь, но и чтобы сравнить её с другими совокупностями: городами, областями, странами. Допустим, что в одном населённом пункте из 10,0 тыс человек было 2 больных, а в другом - из 10,1 тыс человек - 3 больных. Можем ли мы руководствуясь тем, что имеем дело с конечными совокупностями, просто и безо всякой статистики констатировать более высокую заболеваемость во втором н.п.? Размышления привели меня к тому, что скорее не можем, что правильнее думать о неких условиях или факторах, лежащих в основе заболеваемости / смертности и реализующихся конкретными дискретными числами. И что если бы в н.п. жило в 5 раз больше жителей, то мы могли бы с большей надёжностью оценить уровень заболеваемости. А раз речь заходит о надёжности оценки, то это прямой путь к ДИ. Получается, что время и пространство размывают границы конечной ГС, наделяя её свойствами бесконечной домысливаемой... Тема важная, прошу поделиться потом тем, что ещё найдёте и к чему пришли.


Меня все-таки мои размышления приводят к выводу о том, что мы можем сравнивать эти два населенных пункта без всякой статистики (конечно имею ввиду, что без всякой математической статистики, а не санитарной). Давайте попробуем их сравнить.
Очевидно, что численность населения во втором населенном пункте больше (10 100 человек это больше, чем 10 000). Очевидно? Вроде очевидно.
Очевидно, что абсолютная численность больных во втором населенном пункте тоже больше (3 больных больше, чем 2). Очевидно? Да вроде тоже очевидно.
Рассчитаем показатели заболеваемости - 2/10000*100000=20,0 на 100000 населения, 3/10100*100000=29,7 на 100000 населения.
Очевидно, что заболеваемость во втором населенном пункте тоже больше (29,7 больше, чем 20,0). Очевидно? По моему тоже очевидно.
Ну если заболеваемость среди всего населения второго населенного пункта больше, чем среди всего населения первого, то она больше. Как тут может быть по-другому? Неужели без дополнительных математических расчетов (ДИ или стат. критерии) я не могу сделать вывод о том, что в каком-то конкретном году заболеваемость в конкретном населенном пункте 2 больше, чем заболеваемость в населенном пункте 1?! Мне кажется в таких исследованиях любое даже минимальное отклонение априори является "статистически значимым на уровне p=0", то есть даже не статистически значимо, а достоверно.

Честно говоря про надежность не совсем понял. Попытаюсь изложить мысли и по этому поводу, но могу попасть не туда. Да, если бы совокупности были бы больше (и численность населения была бы больше и число заболевших было бы больше) можно было бы быть более уверенным в том, что различия выявленные между населенными пунктами, как бы это правильнее сказать, будут повторяться и в последующие периоды (наверное так). Но в подобных исследованиях, как правило, происходит просто констатация того, что в определенный период в одном населенном пункте заболеваемость больше или меньше, чем в другом.

Вот как-то так. Хотелось бы побольше рассуждений на этот счет. Так как задача довольно актуальная, во всяком случае в организации здравоохранения, но какой-то единой тактики или методологии анализа я так понимаю до сих пор нет.
  Форум: Медицинская статистика · Просмотр сообщения: #23533 · Ответов: 24 · Просмотров: 23043

paravoz
Отправлено: 27.11.2018 - 03:34





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(100$ @ 26.11.2018 - 15:57) *
Рецензенту надо тактично объяснить, что доверительные интервалы строятся к параметрам распределения, но никак не к индексным величинам. Особливо, если индекс представляет собой отношение мертвых к живым, причем мертвые не являются репрезентативной выборкой из ген. совокупности живых.


Вот это и является самым сложным. Например, методика расчета доверительного интервала для показателя смертности приведена в методических материалах которые я нашел на сайте центрального НИИ организации и информатизации здравоохранения. Также в своих методических материалах представляет такую методику НИИ онклогии им. Герцена. Рецензенты ссылаясь на эти материалы и требуют чтобы мы их посчитали.

Также вы написали, что доверительные интервалы строятся к параметрам распределения, но никак не к индексным величинам. Про индексные совершенно согласен - они не представляют распределение. Но даже если у нас будет какое-то распределение. Например, при расчете смертности у нас число умерших составило 18 000 человек. У нас есть данные о возрасте смерти каждого из этих 18 000 (например, по базам смертности Росстата или по реестрам ОМС). Если мы говорим о возрасте смерти 18 000 человек, то это уже будет распределение возраста смерти. Рассчитав средний возраст смерти насколько корректно/возможно в данном случае посчитать доверительный интервал для среднего возраста смерти? Естественно в таком исследовании нами изучается только лишь регион и мы не пытаемся изучать возраст смерти населения Российской Федерации только по данным одного региона (данные о смертности по одному региону явно не могут рассматриваться как выборка из смертности по России - такая выборка не репрезентативна).
Как мне кажется, в данном случае доверительный интервал рассчитывать некорректно. Если средний возраст умерших в 2017 году составил 46,5 лет, то о каком интервале может идти речь, ведь я точно знаю, что он составил 46,5 лет. Пусть даже я ДИ посчитаю для среднего. Тогда что это будет за интервал. Интервал наиболее вероятного среднего возраста умерших где? в генеральной совокупности? что это за генеральная совокупность? (это больше даже вопросы не Вам, а просто ход моих рассуждений).

В общем мои рассуждения приводят меня к тому, что никакие доверительные интервалы в данном случае не нужны и даже более того их расчет и представление в работе является некорректным.
  Форум: Медицинская статистика · Просмотр сообщения: #23532 · Ответов: 24 · Просмотров: 23043

paravoz
Отправлено: 27.11.2018 - 03:17





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(p2004r @ 26.11.2018 - 14:01) *
Если можно извлечь выборку несколько раз, то генеральная совокупность таки есть. А число интервалов отчетных в прошлое и будущее как бы простирается бесконечно (или если ближе теория мультиверса, то генсовокупность исходов всегда бесконечная получается). smile.gif


В том то и дело, что несколько раз извлечь выборку (даже не знаю можно ли ее назвать выборкой) нельзя. Если число умерших в 2017 году составило 18 000 человек, то их умерло 18 000. Хоть как извлекай и хоть сколько раз, все равно число умерших составит 18 000 человек и всегда это будут одни и те же лица.
  Форум: Медицинская статистика · Просмотр сообщения: #23531 · Ответов: 24 · Просмотров: 23043

paravoz
Отправлено: 26.11.2018 - 04:37





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Уважаемые коллеги!

Уже неоднократно сталкиваюсь с тем, что в статьях, посвященных изучению каких-либо эпидемиологических показателей (заболеваемость, смертность и т.д.), помимо самих показателей приведены какие-то значения после знаков плюс/минус. Например, смертность населения составила 20,2?0,8 на 1000 населения.
Зачастую из статьи не понятно, что это за значение, но в некоторых указывается, что это либо стандартная ошибка, либо доверительный интервал.
Честно говоря всегда считал, что:
1. Доверительный интервал - интервал, который показывает диапазон наиболее вероятных значений показателя в генеральной совокупности.
2. Если рассчитывается показатель смертности, например по региону, то этот показатель учитывает всю генеральную совокупность.

Смертность - число умерших/среднегодовая численность населения. Если считать всех умерших выборкой, то тогда что же будет генеральной совокупностью?!
В общем мне всегда казалось, что при расчете популяционных эпидемиологических показателей доверительный интервал рассчитывать не нужно. Не то чтобы не нужно, а даже некорректно. Обычно я на такие интервалы особого внимания не обращал, но сегодня рецензент на мою статью сделал замечание и предложил мне представить к показателям еще и доверительный интервал.

Подскажите, действительно ли необходимо/корректно рассчитывать доверительные интервалы в таких ситуациях? Если нет, то подскажите как грамотно обосновать рецензенту это или на какую литературу сослаться? Сам я нигде прямого запрета на это не нашел. Заранее всем спасибо!
  Форум: Медицинская статистика · Просмотр сообщения: #23524 · Ответов: 24 · Просмотров: 23043

paravoz
Отправлено: 2.11.2016 - 17:05





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Строю логистическую регрессиию для бинарной классификации в SPSS. Если выбираю пошаговое включение параметров в модель, то получаю уравнение с не очень хорошими параметрами верной классификации (верная классификация первого класса - 80%, верная классификация второго класса - 85%). При этом само уравнение статистически значимо и все коэффициенты статистически значимы.
Пробую по другому. Включаю все параметры в модель и получаю 100% классификацию, но все коэффициенты статистически НЕ значимы (значимость 0,995-1,000). Начинаю по одному удалять параметры из модели. После ручного удаления нескольких параметров получаю 99,8% классификацию и все НЕ значимые коэффициенты уравнения. После удаления любого одного из параметров доля верной классификации существенно снижается до 80-85%. Если все-таки удалять вручную самые НЕ значимые коэффициенты, то в итоге получается практически то же уравнение, что и было получено при пошаговом построении с не очень хорошими параметрами верной классификации, но со значимыми коэффициентами.

Подскажите, пожалуйста, все-таки какое уравнение логистической регрессии выбрать? С 99,8% классификацией, но НЕ значимыми коэффициентами уравнения, или со значимыми коэффициентами регрессии, но 80% долей верной классификации? И как в принципе можно интерпретировать результат, когда доля верной классификации практически 100%, коэффициент детерминации практически единица, само уравнение регрессии статистически значимо, но все коэффициенты уравнения статистически НЕ значимы?
  Форум: Медицинская статистика · Просмотр сообщения: #20381 · Ответов: 2 · Просмотров: 4498

paravoz
Отправлено: 10.02.2016 - 13:55





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(100$ @ 10.02.2016 - 17:32) *
А обколотых мышей не забудьте вернуть в бесконечную (Sic!) генеральную совокупность...


Хорошо! Напишем 20 диссертаций на одних и тех же мышах.
  Форум: Медицинская статистика · Просмотр сообщения: #19218 · Ответов: 12 · Просмотров: 11989

paravoz
Отправлено: 10.02.2016 - 12:53





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(p2004r @ 10.02.2016 - 16:47) *
ну вот все сошлись, что если мышей не убивают при измерении, то повторные замеры спасут бюджет smile.gif


Всем огромное спасибо за ответы!
Правильно ли я понимаю, что если измерить эффект можно не убивая мышей, то измеряем показатели до введения препарата, вводим препарат и через месяц измеряем эти же показатели. В таком случае используем критерии для повторных измерений, которые более мощные чем двухвыборочные. И в таком случае можно исследовать одну группу мышей, что будет в 2 раза меньше (ну или около того) чем в 2 группах.

Если я понял правильно, то так и сделаю.
  Форум: Медицинская статистика · Просмотр сообщения: #19214 · Ответов: 12 · Просмотров: 11989

paravoz
Отправлено: 9.02.2016 - 19:27





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(ogurtsov @ 9.02.2016 - 23:17) *
Для каждой конкретной цели он будет свой в зависимости от ожидаемой величины эффекта, вариации показателя (для количественных переменных), уровня значимости и желаемой мощности.


Такой подход мне знаком и действительно существует масса различных формул и всяких номограмм.
Но вот, честно говоря, про доверительные интервалы не совсем согласен, но спорить не готов, так как надеюсь на большой опыт форумчан.
  Форум: Медицинская статистика · Просмотр сообщения: #19206 · Ответов: 12 · Просмотров: 11989

paravoz
Отправлено: 9.02.2016 - 17:06





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Подскажите, пожалуйста. Сколько необходимо животных для проведения исследования?
Дизайн простой. Одной группе мышей вводится препарат, другой не вводится. Через меся оценивается эффект такого введения. Если использовать стандартные формулы расчета объема выборки, то получается довольно много. Но если посмотреть публикации, в том числе зарубежные в авторитетных журналах, то там описываются исследования проведенные на 15-30 мышах. При этом если исследование проводится на определенной линии мышей, то это довольно однородная выборка, что, как я полагаю, должно повлиять на ответ на мой вопрос.

Еще один вопрос. Насколько целесообразно для результатов полученных на экспериментальных животных рассчитывать доверительные интервалы? С одной стороны, мы же изучаем часть генеральной совокупности, что наталкивает нас на определение границ, в которых находится истинное значение показателя. Но с другой стороны, раз мы работаем с лабораторными животными, то генеральная совокупность теоретически может быть бесконечной, что не гарантирует, что в рассчитанном доверительном интервале будет находится истинное значение показателя.

В общем, своей противоречивой логикой дойти до верных ответов не могу. Подскажите кто знает или кто что думает.
  Форум: Медицинская статистика · Просмотр сообщения: #19204 · Ответов: 12 · Просмотров: 11989

paravoz
Отправлено: 13.04.2014 - 20:00





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(p2004r @ 14.04.2014 - 00:11) *
1) "доля верной классификации" немного странно звучит в теме про применение ROC, это AUC так обозначена? smile.gif


Ничего странного. Для того чтобы пациент был классифицирован в качестве больного туберкулезом или здорового на выходе нейроной сети должны получится значения которые больше или меньше граничного значения. На сколько я понимаю тема именно об этом. По результатам работы нейросети также можно построить ROC-кривую для того чтобы определить это граничное значение с нужной для конкретной задачи чувствительностью и специфичностью.

Цитата(p2004r @ 14.04.2014 - 00:11) *
2) если эта "доля" результат верификации модели, то хотя бы каким способом она осуществлялась? проводилась кроссвалидация? или это результат применения просто к тестовой выборке? или и то и другое одновременно?


Это результат полученный на тестовой выборке.
  Форум: Медицинская статистика · Просмотр сообщения: #16883 · Ответов: 50 · Просмотров: 58746

paravoz
Отправлено: 13.04.2014 - 17:37





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(anserovtv @ 13.04.2014 - 01:58) *
Общеизвестен факт улучшения диагностики туберкулеза с применением НС на 10% . (Галушкин А.И. авторское свидетельство)


Могу подтвердить хорошие результаты по классификации больных туберкулезом и здоровых с помощью нейронных сетей. В моей работе доля верной классификации составляет 95% с использованием обычной многослойной нейронной сети.
  Форум: Медицинская статистика · Просмотр сообщения: #16880 · Ответов: 50 · Просмотров: 58746

paravoz
Отправлено: 7.03.2014 - 03:39





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(aura_69 @ 6.03.2014 - 18:09) *
это промежуток между, например, 11 июля (дата рождения) и 11 августа


И не важно сколько дней в месяце. Конечно будет небольшое расхождение между реальным количеством дней жизни у детей рожденных в разные месяцы, но как правило изучается не один ребенок, а какая-то выборка, где эти различия усредняются.

Еще один довод в защиту этой точки зрения. Ребенку исполняется один год в день его рождения, не важно високосный год прошел или обычный. Хотя реальное количество дней различное.

Источник привести не могу, но кажется, что его довольно сложно найти, так как это общепринятое правило определение возраста, а не является научной задачей решение которой требует публикования.

Если же в вашей работе имеет важное значение количество дней, которое прошло с момента рождения, то считайте возраст ребенка в днях.

Думаю так.
  Форум: Медицинская статистика · Просмотр сообщения: #16613 · Ответов: 2 · Просмотров: 4395

paravoz
Отправлено: 21.02.2014 - 01:12





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(anserovtv @ 20.02.2014 - 21:46) *
Одновыборочные z-тест и t-тест с формулами, критическими областями. вычислениями в Excel
с применением статистических функций и примерами хорошо изложены в учебнике Р. Вадзинского
Статистические вычисления в среде Excel. Питер 2008 стр.256 -264.


Отличная книжка, спасибо.
  Форум: Медицинская статистика · Просмотр сообщения: #16525 · Ответов: 26 · Просмотров: 38941

paravoz
Отправлено: 3.02.2014 - 20:15





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(Liz @ 3.02.2014 - 20:45) *
Да нет же! Была искренне признательна за ЯСНЫЙ ответ!


Рад слышать.
  Форум: Медицинская статистика · Просмотр сообщения: #16445 · Ответов: 11 · Просмотров: 14483

paravoz
Отправлено: 3.02.2014 - 08:07





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(Liz @ 2.02.2014 - 18:43) *
Это объяснение-шедевр! Спасибо!!!


Очень похоже на сарказм.
Если я что-то не так понял и написал ерунду, то искренне прошу меня простить. Действительно искренне, без всяких подколок. В таком случае опишите подробнее вопрос, может смогу помочь.
  Форум: Медицинская статистика · Просмотр сообщения: #16441 · Ответов: 11 · Просмотров: 14483

paravoz
Отправлено: 2.02.2014 - 06:18





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(Liz @ 2.02.2014 - 09:34) *
Как исключить в окне выбора переменных из 10 выбранных независимых переменных одну, напр., 5-ую. Или, что то же: выбрать от 1 по 4 и от 6 по 10 т.е. без 5-ой (она зависимая)?


1. В окне выбора переменных выбираете 1-ю переменную.
2. Нажимаете shift и не отпускаете.
3. При нажатом shift'e выбираете 10-ю переменную. Таким образом у вас будут выбраны все переменные с 1-й по 10-ю.
4. Отпускаете shift.
5. Нажимаете ctrl и не отпускаете.
6. При нажатом ctrl'e выбираете 5-ю переменную. Она стенет не выбранной.

После таких манипуляций, останутся выбранными переменные с 1 по 4 и от 6 по 10.
  Форум: Медицинская статистика · Просмотр сообщения: #16439 · Ответов: 11 · Просмотров: 14483

paravoz
Отправлено: 22.01.2014 - 13:41





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(Homer62 @ 22.01.2014 - 01:20) *
До операции были одни медианы, после операции они приросли.


Цитата(100$ @ 22.01.2014 - 18:18) *
Ну, и как простому читателю разобраться, с какими же все-таки группами работает автор?


Думаю все-таки группы связанные.
  Форум: Медицинская статистика · Просмотр сообщения: #16401 · Ответов: 14 · Просмотров: 19178

paravoz
Отправлено: 22.01.2014 - 13:04





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(Homer62 @ 22.01.2014 - 17:53) *
Уважаемый paravoz!
Огромное спасибо за помощь!
Скачал программу "Довинт", использовал ее для подсчета разности медиан своих двух связанных групп. Однако, по всем восьми шкалам sf-36 саму разность программа подсчитывает равной 0,00. Хотя, очевидно, что она таковой быть не должна. Тем более достоверность прироста была подтверждена вычислением критерия Уилкоксона. В ближайшее время попробую вручную пересчитать пользуясь руководством из Вашей статьи.


Попробуйте вручную. Если результаты не сойдутся. Отпишитесь. Будем программу переделывать, раз она неправильно считает.
  Форум: Медицинская статистика · Просмотр сообщения: #16398 · Ответов: 14 · Просмотров: 19178

paravoz
Отправлено: 22.01.2014 - 12:22





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(nokh @ 22.01.2014 - 17:04) *
Сомневаюсь, похоже на какую-то терминологическую путаницу. По-английски и "разность", и "различие" - "difference". Что же мы ищем: (1) разность медиан или (2) медиану различий?
Если (1), то разность чего бы то ни было рассчитывается именно как разность, т.е. (Ме1 - Ме2). Полез смотреть в и-нет и сразу наткнулся на расчётную таблицу Excel, позволяющую рассчитать (1) с доверительным интервалом: http://www.gmw.rug.nl/~huisman/spssmanual/medians.xls
Автор пишет, что использовал алгоритм из Price, R.M. & Bonnet, D.G. 2002. К сожалению пока статью не нашёл и проверить автора не получилось.
Если (2), то встречал такую технику + расчётный пример, но без ДИ. Может, если копнуть, и расчёт ДИ найдётся.
Вопрос - что нам использовать в качестве показателя величины эффекта (effect size)? Я пока на него не ответил... Для зависимых выборок - однозначно (2), а для независимых - почему бы не (1)?


Мы пользовались алгоритмом Altman D.G. Statistics with confidence, 2002. Эта книга есть интернете. В ней описаны расчеты разности медиан, а также ДИ для медиан и разности медиан. Посмотрите. Может действительно имеет место ошибка перевода. А то английский у нас не идеальный.
  Форум: Медицинская статистика · Просмотр сообщения: #16396 · Ответов: 14 · Просмотров: 19178

paravoz
Отправлено: 22.01.2014 - 04:52





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(Stefa @ 22.01.2014 - 09:07) *
Добрый день! Не могли бы Вы и мне отправить статью в личку? Буду очень признательна.


В личке.
  Форум: Медицинская статистика · Просмотр сообщения: #16392 · Ответов: 14 · Просмотров: 19178

paravoz
Отправлено: 22.01.2014 - 01:25





Группа: Пользователи
Сообщений: 79
Регистрация: 22.08.2013
Из: г. Красноярск
Пользователь №: 25146


Цитата(Homer62 @ 22.01.2014 - 01:20) *
Разностью медиан является не медиана одной выборки минус медиана другой, а медиана выборки, составленной из попарных разностей всех элементов одной выборки и всех элементов другой.


Да, это дейтвительно так. Но расчитав разность медиан и указав ее в статье будьте готовы к сопротивлению рецензентов. Потому что скорее всего возникнет ситуация, когда 1-я медиана - 5, 2-я медиана - 10, а их разность будет равна 3. Или, 1-я медиана - 5, 2-я медиана - 10, а разность равна 0, причем критерий Манна-Уитни даст p<0,05.

Вот здесь есть полное описание расчета разности медиан - Интервальная оценка медианы и ее автоматизация // Врач и информационные технологии. - 2013. - ? 4. - С. 40-49.

Чуть позже отправлю в личку статью.
  Форум: Медицинская статистика · Просмотр сообщения: #16390 · Ответов: 14 · Просмотров: 19178

3 страниц V   1 2 3 >

Открытая тема (есть новые ответы)  Открытая тема (есть новые ответы)
Открытая тема (нет новых ответов)  Открытая тема (нет новых ответов)
Горячая тема (есть новые ответы)  Горячая тема (есть новые ответы)
Горячая тема (нет новых ответов)  Горячая тема (нет новых ответов)
Опрос (есть новые голоса)  Опрос (есть новые голоса)
Опрос (нет новых голосов)  Опрос (нет новых голосов)
Закрытая тема  Закрытая тема
Тема перемещена  Тема перемещена