Непонятный вопрос по процентам и достоверности P |
Здравствуйте, гость ( Вход | Регистрация )
Непонятный вопрос по процентам и достоверности P |
26.03.2019 - 10:10
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 4 Регистрация: 26.03.2019 Пользователь №: 33494 |
День добрый! Периодически приходится консультировать аспирантов-медиков по статистическому анализу данных. Повторно возник вопрос совершенно непонятного для меня назначения.
Имеется группа больных общим числом например 100 человек (то бишь 100%). Вся эта группа делится на 3 патологии исследуемого заболевания: 1-я - 25 человек 2-я - 30 и 3-я - соответственно 100 - (25+30) = 45 Все это выражено в процентном соотношении по группам: 25%, 30% и 45%. Так вот в чем вопрос, руководитель человека, которого я консультирую требует сравнить эти процентные соотношения, а так же указать в виде р достоверность этих различий. Я бы еще понял, если бы это были три разные группы (как фактор) и тд для применения хи-квадрата и сопутствующих ему, а тут как бы одна группа.. Я чего -то не понимаю? Или мне что-то неправильно говорят? Руководитель человеку говорит, что у них какая-то особая специфика, а я подхожу с позиции математика. Сообщение отредактировал aknothing - 26.03.2019 - 10:10 |
|
26.03.2019 - 15:00
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
...Имеется группа больных общим числом например 100 человек (то бишь 100%). Вся эта группа делится на 3 патологии исследуемого заболевания: 1-я - 25 человек 2-я - 30 и 3-я - соответственно 100 - (25+30) = 45 Все это выражено в процентном соотношении по группам: 25%, 30% и 45%. Так вот в чем вопрос, руководитель человека, которого я консультирую требует сравнить эти процентные соотношения, а так же указать в виде р достоверность этих различий. Всё зависит от того как собирались данные и для какой нулевой гипотезы нужны р-значения. Вариантов вижу два. 1) Если группа делится на 3 патологии искусственно, то "особая специфика" в том, что руководитель - неадекват, аспиранту - не повезло, вам - опыт в копилку и отстраниться. 2) Но будем исходить из более правдоподобного и радостного варианта: данные собраны таким образом, что каждая из 3 патологий имела равные шансы попасть в выборку. В этом случае частоты патологий являются выборочными оценками вероятностей представленности этих патологий в генеральной совокупности, т.е. распространённости (преваленса) патологий в популяции. В этом случае всё что можно сравнить и обнаружить - это неодинаковую распространённость патологий. Другое дело: сколько в этом логики и медицины. Но, допустим, с медицинской точки зрения действительно важно доказать, что патологии представлены неравномерно. Тогда нулевая гипотеза: равномерная распространённость патологий. Т.е. для 100 случаев - 100/3=33,3(3) для каждой. Можно сравнить наблюдаемые частоты с этими ожидаемыми частотами критериями типа хи-квадрат. Поскольку гипотеза одна, то и проверок - одна. Но в случае обнаружения статистически значимой неоднородности можно дополнительно рассчитать р-значение для каждой ячейки, чтобы обнаружить те, которые неслучайно вложились в статистику критерия и обеспечили (преимущественно) статистическую значимость различий. Для этого для каждой ячейки нужно рассчитать либо (а) согласованные стандартизованные остатки (остатки Хабермана, statdardized adjusted residuals), либо (б) отклонения Фримана - Тьюки (Freeman-Tukey deviation). Считать придётся вручную по формулам. Для описательной статистики помимо абсолютных и относительных частот желательно привести 95%-ные доверительные интервалы. В случае если речь идёт именно о композиции ( в сумме - 100%), то их вроде можно рассчитать точнее, чем традиционными методами типа Клоппера - Пирсона (вроде бы в сопровождении MedCalc видел, но это не точно); может меня поправят/дополнят... |
|