Здравствуйте, гость ( Вход | Регистрация )
Отправлено: 19.08.2020 - 04:00 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
С русскоязычными источниками не помогу, а тест обобщающий location и scale (JLS Test) описан Дэвидом Соаве только в 2015 просто WF = −2(log(pL) + log(pS)). https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4572492/ |
Форум: Медицинская статистика · Просмотр сообщения: #25993 · Ответов: 7 · Просмотров: 10345 |
Отправлено: 21.05.2019 - 10:16 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Если интересно - могу выложить данные, Да, интересно, но не ясно какая задача решается. Есть 400 проб (больных) и у каждого больного только два типа инфецирования? Или вы наборы инфекций у двух больных сравниваете. Т.е. просьба подробней про поставновку задачи. PAST считает много подобных индексов, в том числе и jaccard, с вашим тестовым примером сходится (0,714), но у меня старая версия, р нет. И, большое спасибо за готовое решение в R. |
Форум: Медицинская статистика · Просмотр сообщения: #23973 · Ответов: 13 · Просмотров: 13993 |
Отправлено: 5.03.2019 - 11:38 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Кластерный анализ |
Форум: Медицинская статистика · Просмотр сообщения: #23777 · Ответов: 7 · Просмотров: 8503 |
Отправлено: 5.03.2019 - 03:03 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
За последние 5 лет утвердили примерно 100 диссертаций, в которых как раз и есть результаты сложных многомерных методов, полученных в коллективе, руководимом Леоновым. Несколько таких диссертаций выложены у него на сайте БИОМЕТРИКА. Обратитесь к нему, он Вам и расскажет возможности такого анализа. Не ответил он Вам видимо потому, что по нашей просьбе уже второй год занят большой работой по анализу диссертаций и статей по 100 журналам. В том числе и по статьям журнала "Врач-асп ирант", в котором очень много ошибок по статистике. Б_Т_Г, с этого вашего поста не понятно, вы врач, аспирант, специалист по статистике и член коллектива (leo_biostat, Leonov, Med_Elena, A_Suvorov) или вы представляете контору по контролю качества отечественной науки, а потому заказали анализ диссертаций коллективу Леонова? Вопрос очень простой, как для аспиранта медика, по результатам прочтения двух статей, ответьте пожалуйста на вопрос, что лучше для прогноза положительного исхода эко иметь 4 или 5 эмбрионов хорошего качества, исключительно по результатам логистической регрессии, приводимой в этих статьях https://www.science-education.ru/ru/article/view?id=18768 https://www.fundamental-research.ru/ru/article/view?id=37492 |
Форум: Медицинская статистика · Просмотр сообщения: #23775 · Ответов: 10 · Просмотров: 10871 |
Отправлено: 4.03.2019 - 23:54 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
За прошедшие 2 года ВАК не утвердил диссертации 8 нашим аспирантам и 3 докторантам. Одна из причин этих отказов некорректные их результаты статистического анализа. Ув. Med_Elena! Уточните, что значит нашим аспирантам. Если вы руководили этими работами, то должны обладать знаниями курса статистического анализа, которые преподаются сегодня и в мед. институте и в аспирантуре на базе учреждения, где выполняется работа. На дворе не сороковые годы. Если руководитель учился в те годы, то он должен самостоятельно поднять свой уровень в статистике, а также в области доказательной медицины. Это очень важно на этапе планирования, в котором как раз и участвует руководитель. Хочу также знать и о том, кто из рекомендуемых может производить анализ больших баз данных (по несколько тысяч наблюдений и 2-3 сотни признаков) с помощью сложных многомерных методов. Поскольку ВАК утверждает все диссертации с такими результатами. По поводу больших баз данных и сотней признаков. Современным статистическим программам и компьютерам все равно, сколько наблюдений, несколько десятков или несколько тысяч. Редко можно встретить квалификационные работы с таким большим числом наблюдений, что необходимы экзотические программы. Планирование научного исследования как раз и заключается в том, чтобы объем исследования был научно обоснован, при этом также помогают знания статистического анализа. Относительно числа анализируемых признаков, их количество также не свидетельствует о качестве медицинского исследования. Суррогатные исходы в бесконечном количестве не могут заменить истинные исходы. Можно анализировать кучу показателей биохимии и иммунологии и т.д. и т.п до и в динамике лечения, но их сдвиги могут не быть связаны с истинными исходами. Утверждение, что ВАК утверждает ВСЕ диссертации с тысячами наблюдений, сотнями признаков и непременно со сложными методами анализа, является сомнительным. |
Форум: Медицинская статистика · Просмотр сообщения: #23774 · Ответов: 10 · Просмотров: 10871 |
Отправлено: 29.01.2019 - 23:39 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Факторы риска чего вы хотите изучить? Толщина КИМ ОСА является одним из независимых факторов риска развития транзиторных ишемических атак и инсульта. Это возраст зависимая величина и ее значения (медианы, квартили) для возрастных категорий известны. Вы хотите проверить так ли это у диабетиков? Или вас интересуют факторы, влияющие на эту толщину непременно у диабетиков 2 типа? |
Форум: Медицинская статистика · Просмотр сообщения: #23710 · Ответов: 6 · Просмотров: 6508 |
Отправлено: 28.11.2018 - 01:00 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Пять лет назад, paravoz, вы уже поднимали этот вопрос на форуме и получили ответы. В клинической эпидемиологии (к эпидемиям не имеет отношения) есть определения некоторый понятий. Например, имеется понятие prevalence (prevalence rate), или incidence, которые принято приводить с интервалами. Технически это ДИ, которые, действительно, являются интервальной оценкой параметра, возможно, поэтому интервалы к распространенности стали называть интервалы неопределенности, uncertainty interval , что является белее предпочтительно, но только с философской точки зрения. Посмотрите в Гугле, confidence interval for prevalence Данные ВОЗ по распространенности туберкулеза в различный странах : https://extranet.who.int/sree/Reports?op=Re...mp;outtype=html https://extranet.who.int/sree/Reports?op=Re...mp;outtype=html |
Форум: Медицинская статистика · Просмотр сообщения: #23538 · Ответов: 24 · Просмотров: 24409 |
Отправлено: 8.08.2018 - 11:07 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Вы должны спрашивать не какие кнопки нажимать, а какой метод использовать для сравнения средних в 4-х группах. Почитайте о дисперсионном анализе. |
Форум: Медицинская статистика · Просмотр сообщения: #23224 · Ответов: 12 · Просмотров: 13260 |
Отправлено: 5.08.2018 - 18:51 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
|
Форум: Медицинская статистика · Просмотр сообщения: #23215 · Ответов: 12 · Просмотров: 13260 |
Отправлено: 5.08.2018 - 11:35 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Первая таблица и есть массив данных |
Форум: Медицинская статистика · Просмотр сообщения: #23213 · Ответов: 12 · Просмотров: 13260 |
Отправлено: 31.07.2018 - 20:57 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
СatenaR, вам провели 9 сравнений долей представленных в таблице, по 3 сравнения на каждую строку. Доли рассчитаны по группам 1,2 и 3, т.е. из 98, 481 и 381. Первое сравнение 72,4% и 47,8% приведены хи-кв для сравнения долей без поправок на множественность подобных сравнений. Поскольку спросить про корректность такого подхода теперь уже не у кого, то можно и не комментировать. |
Форум: Медицинская статистика · Просмотр сообщения: #23199 · Ответов: 15 · Просмотров: 17656 |
Отправлено: 30.06.2018 - 15:37 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Да, почитайте про регрессионные модели Кокса. |
Форум: Медицинская статистика · Просмотр сообщения: #23134 · Ответов: 7 · Просмотров: 9171 |
Отправлено: 30.06.2018 - 07:08 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
А как вы изучаете влияние других факторов, например, возраста? |
Форум: Медицинская статистика · Просмотр сообщения: #23131 · Ответов: 7 · Просмотров: 9171 |
Отправлено: 29.06.2018 - 15:26 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Метод анализа так и называется - анализ выживаемости в основе этого анализв - функция выживаемости, заивсящая от времени. А время реабилитации больше или меньше 6 месяцев можно рассматривать как фактор, влияющий или не влияющий на выживаемость. Но зачем вам проводить анализ, если у вас уже есть ответ " достоверно" лучше, если долгая реабилитация не проводилась. |
Форум: Медицинская статистика · Просмотр сообщения: #23129 · Ответов: 7 · Просмотров: 9171 |
Отправлено: 26.06.2018 - 19:42 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Как вы считаете, уважаемые участники форума, мог бы я использовать дисперсионный анализ (с неравномерной численностью групп) в качестве способа выявить различия между тем, сколько FA было у одной транспортной компании, и сколько у другой? Нет, не можете. У вас есть только FA(False Analysis) и TA (True Analysis) и считать между ними среднее и дисперсию все равно что искать среднее между М и Ж 100$ дал ответ, как проанализировать различия. Если не поняли, читайте Гланца про зеленых и розовых марсиан, стр. примерно 130, сравнение долей. |
Форум: Медицинская статистика · Просмотр сообщения: #23113 · Ответов: 30 · Просмотров: 30897 |
Отправлено: 30.05.2018 - 13:52 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
https://stat.ethz.ch/pipermail/r-help/2012-...ary/303977.html Тут все ответы, Разность медиан (median(A)-median(B)) и ДИ к разности медиан - раньше я использовала package pairwiceCI, а сейчас пакeт iNZightVIT (R должен быть на машине), который рисует график после мультика, сопровождающего bootstrap распределение медианы. Пришпиленную картинку я сделала по тестовому примеру, который дан в ссылке. Вы можете также взять этот же пример и проверить результат своего кода. ДИ median(A-B ) дает wilcox.test: > I=wilcox.test(A,B,conf.lev=0.95,conf.int=TRUE,exact=F,correct=T) > inf=I$conf.int[1] > sup=I$conf.int[2] > C<-(I) > C Тут все однозначно и сходится с ручным расчетом по методу Altman, который также описан в русскоязычной статье ИНТЕРВАЛЬНАЯ ОЦЕНКА МЕДИАНЫ И ЕЕ АВТОМАТИЗАЦИЯ |
Форум: Медицинская статистика · Просмотр сообщения: #23032 · Ответов: 11 · Просмотров: 19603 |
Отправлено: 7.04.2018 - 22:33 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
|
Форум: Медицинская статистика · Просмотр сообщения: #22894 · Ответов: 18 · Просмотров: 22167 |
Отправлено: 7.04.2018 - 11:17 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
В процессе работы возник вот такой вот вопрос ?. А какой работой вы занимаетесь? Вы хотите посчитать свои (не свои) три группы, для статьи, диссертации, причем, судя по вашим вопросам, вы не очень представляете себе, что и зачем вам нужно посчитать, т.е. одноразовая работа. Другой вариант работы ? у вас есть программа (поделитесь, какая, поскольку мне понравились графики разностей с ДИ) и, вы хотите узнать, нажимая на все кнопки, что же она вам выдает. Хотелось бы получить привычные столбики. Или, еще вариант работы ? вы решили изучить статистику и стать статистицианом или уже подвязались на эту работу. DrgLena, если я правильно понял, то я должен обращать внимание на то, пересекают ли ДИ (усы) центральную нулевую отметку или нет. Если не пересекают, то различия достоверны. Если да - то нет. А есть ли какой-то смысл в том, совпадают ли визуально расположение ДИ для каждого сравнения на графике? Т.е., проще говоря, пара А-В лежит слева от нуля, а В-С справа. А если бы они обе лежали бы в левой или правой полуплоскости? Это вообще что-то значит важное? В курсе арифметики для младших классов это было важно, почему отнимая от меньшего числа большее, появляется знак минус и разница будет слева от нуля. Плав написал, что преимущество графика с ДИ по различиям, а не ДИ для средних/медианы по группам, в том, что даёт избежать ошибки первого рода, т.е. ложнопозитивных результатов там, где различий на самом деле нет. Ладно. Тогда возникает такой вопрос - а что бывает так, что пост-хок тест говорит о достоверности, а на графике видно, что ДИ перекрывает нулевую отметку? Мне кажется, что такое возможно только, если брать пост-хок, что изначально не считает ДИ, типа Ньюмана-Кеулса. А если брать Тьюки, то разве не очевидно, что график, будет идентичен числовым результатам? Я это к вопросу о том, почему такой график считается крутым, если по числовым результатам анализа и так всё ясно? Почему выбирают такой тип визуализации, хотя привычнее и понятнее будут классические "столбики" или "Бокса-Вискера", на результат анализа это же никак не влияет. Стиль изложения тяжел для восприятия, много слов не по существу. И справьте "Бокса-Вискера". Есть много критериев и много методов для расчета ДИ и к среднему и к разности средних. Плав на этом форуме приводил свою программку в экселе для расчета ДИ средних различными методами. Достаточно выбрать конкретный стиль работы и ограничиться доказательством либо с помощью критериев, либо приводя ДИ. И то и другое ? я считаю перебором (чтобы толще была работа). Относительно анализа разностей средних путем сравнения ДИ к этим разностям ? это весьма полезный метод, если нужно сравнить несколько групп по величине различий. Например, один и другой препарат или различные дозировки одного статистически значимо снижают какой- то показатель, но один на 50 единиц, а другой на 30 относительно контроля. Сравнить эффекты нескольких групп посредством сравнения ДИ очень просто и наглядно. |
Форум: Медицинская статистика · Просмотр сообщения: #22888 · Ответов: 12 · Просмотров: 13753 |
Отправлено: 7.04.2018 - 03:10 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
. В классическом варианте всё понятно - группа А отличается от группы В, В от С, А не отличается от С. Но как сравнивать различия по парам А-В и А-С? Это сравнивать сравнения. Опять тавтология. Прилагаю сам график. Вот мне понять на конкретном примере, какие выводы можно сделать из этого графика? Это значит сравнить не сравнения, а разницу. Средние значения в группе В больше чем в группе А и в группе С на 50 каких то единиц. А между группами А и С нулевая разница. ДИ на рисунке относятся к этой самой разнице. Если ДИ разницы не пересекает нуль, то разница между группами статистически значима. |
Форум: Медицинская статистика · Просмотр сообщения: #22884 · Ответов: 12 · Просмотров: 13753 |
Отправлено: 7.04.2018 - 00:50 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Такие ДИ получаются одинаковыми по величине, поскольку ошибка комплекса данных едина для всего комплекса. Не совсем.Чтобы из MS (error), которую выдают программы, получить среднеквадратическую ошибку, нужно извлечь корень, получив SD, а потом разделить на корень из n. Так что ДИ будут одинаковы только в том случае, если число наблюдений на каждом уровне фактора будет одинаковым. |
Форум: Медицинская статистика · Просмотр сообщения: #22883 · Ответов: 12 · Просмотров: 13753 |
Отправлено: 6.04.2018 - 23:56 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
|
Форум: Медицинская статистика · Просмотр сообщения: #22882 · Ответов: 12 · Просмотров: 13753 |
Отправлено: 21.03.2018 - 11:49 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Вы не поняли. Я разделила на 2 не потому, что у вас было две группы, а чтобы показать, что между двумя числами имеется середина. Любое расчетное число для нового объекта вы сравниваете с этой срединой. Если вы получили расчетное число большее чем 0,423, то объект классифицируется во вторую группу, потому, что оно будет ближе к центроиду второго класса, чем первого. Если у вас 3 группы, все для вас будет еще сложнее. Центроиды у вас расположены не на линии, а на плоскости и имеют по две координаты (первые две канонические функции), реже больше. Вы можете получить график всех объектов выборки и нанести значения центроидов трех ваших групп. Расстояние между центроидами будут выражаться разностью координат. Стандартизация - это базовое понятие и стандартная процедура в любом стат пакете. |
Форум: Медицинская статистика · Просмотр сообщения: #22790 · Ответов: 7 · Просмотров: 9239 |
Отправлено: 14.03.2018 - 00:47 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Именно логика в подаче данных с единых позиций (в данном случае - с позиций порядковой статистики) и должна преобладать над соблазном приводить средние, и не важно, каким образом они получены они остаются параметрами распределения. Для медицины есть руководство именно о том, как описывать результаты статистического анализа, оно так и называется. Долгое время я использовала первоисточник на английском ( в сети был свободно). How to Report Statistics in Medicine: Annotated Guidelines for Authors, Editors, and Reviewers. Thomas A. Lang and Michelle Secic Сейчас книга переведена leo_biostat https://www.ozon.ru/context/detail/id/5633322/ Аналогичные рекомендации описания результатов в зависимости от использования методов статистики имеются в книге Наглядная статистика в медицине - Петри А., Сэбин К. - 2003 год . Оба источника рекомендуют при использовании непараметрических (ранговых критериев) приводить медианы, ДИ медианы и ДИразности медиан. И это вполне логично. Интерпретация медиан не представляет никакой трудности для медиков, гораздо труднее получить и оценить разность медиан (для несвязанных выборок) или медиану разности парных выборок посредством ДИ. Если нет возможности посчитать ДИ разности медиан можно привести медианы и ДИ к ним в каждой из двух групп (Петри). SPSS начиная с 18 версии рассчитывает доверительный интервал Ходжеса-Лемана для медианы разности парных выборок и разности медиан двух независимых выборок. Но у меня только 17. При ассиметричных выборках среднее не характеризует выборку, а потому, медиана и квартили дают представление о данных, а разность медиан или медиана разности характеризует различия. На форуме уже обсуждался вопрос разности медиан и предлагалась программа Довинт, но там были какие то проблемы. Проблемы были и в понимании или в переводе, они и сейчас есть. Но, за эти 4 года R уверенно рулит. Предлагаю обсудить, кто что использует для удовлетворения ?руководства?. Особенно интересует мнение leo_biostat и продвинутых в R. Чтобы не было проблем с переводом, вопрос такой, как получить CI for the difference in medians, а также CI for the median of the differences. |
Форум: Медицинская статистика · Просмотр сообщения: #22763 · Ответов: 11 · Просмотров: 19603 |
Отправлено: 7.03.2018 - 23:51 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
ого как много интересного. а зачем эти 5 групп нужны? я новичок-любитель и не всегда понимаю, что к чему) А, действительно, зачем эти 5 групп нужны?. Какая исследовательская задача стояла при создании этих 5 групп. Нет ли упорядоченности в категории 1 - 5. Например, студенты 1 курса - 5 курса соответствуют 1 - 5 группам. Например, ответ "не знаю" чаще отмечается у первокурсников, а более уверенно отвечают 5- курсники. Если между ответом "да" и "нет" поставить "не знаю", то этот ответ также можно рассматривать как упорядоченную категорию (о, nokh уже добавил эту мысль). Sanabat, вы задаете вопрос, нужны ли вам попарные сравнения. Но это вопрос к вам. Если вас интересует, чаще ли ответ "не знаю" у первокурсников, чем у пятикурсников, то вы должны провести такое сравнение. Nokh советует начать с анализа соответствий (Correspondence analysis), с чем я полностью согласна. Метод дает наглядную картину сопряженности признаков, которая хорошо иллюстрируется графически. Вместо выборочных подтверждений с помощью статистических тестов, я бы рекомендовала посчитать 95% ДИ к долям ( % ) и изобразить их графически. |
Форум: Медицинская статистика · Просмотр сообщения: #22738 · Ответов: 18 · Просмотров: 22167 |
Отправлено: 1.03.2018 - 00:42 | |
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
Каким образом можно определить порог, от которого отталкиваться? В каноническом дискриминантном анализе: Центроид - среднее значение дискримирующей функции в исследуемых группах. По вашим данным, если вы верно нашли: Центроид 1 группы -0,547 Центроид 2 группы 1,393 Объект классифицируется в ту группу, к которой ближе расчетное значение функции. (-0,547+1,393)/2=0,423 Это число и есть граница раздела. Полезно получить значения центроидов самостоятельно, сохранив значения дискриминирующих функций для каждого объекта выборки и сравнить их средние значения. Не забудьте только о стандартизации исходных переменных и использовании для расчета функций соответствующих коэффициентов. Качество дискриминации ( % ) посмотрите в таблице. Тогда поймете, что не всегда расчетная и реальная принадлежность к группе совпадает. Но, если вы психолог и работаете с различными тестами, шкалами оценок, то при классификации в два класса, лучше использовать логистическую регрессию. В этом случае вы получите вероятность принадлежности к конкретной группе и можете выделять промежуточные состояния, которые могут представлять интерес в плане коррекции этих состояний. Эта расчетная вероятность принадлежности к определенной группе может быть полезна также при оценке динамики изменения результатов тестирования (ваш вопрос в другой ветке). Например, вероятность быть успешным спасателем при заключении контракта была 95%, через 5 лет только 65%. |
Форум: Медицинская статистика · Просмотр сообщения: #22707 · Ответов: 7 · Просмотров: 9239 |
Открытая тема (есть новые ответы) Открытая тема (нет новых ответов) Горячая тема (есть новые ответы) Горячая тема (нет новых ответов) |
Опрос (есть новые голоса) Опрос (нет новых голосов) Закрытая тема Тема перемещена |