![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
![]()
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 36 Регистрация: 19.10.2007 Из: Москва Пользователь №: 4460 ![]() |
Есть среднее +/- стандартное отклонение показателя до лечения, есть среднее +\- после лечения. Как расчитать разницу средних и стандартное отклонение? Прочитал. что можно по формуле (корень из суммы квадратов станд отклонений средних значений до и после), но когда использовал формулу имея реальные данные оказалось, что величины отклонений (реального и рассчитаного) сильно различаются. Например: уровень креатинина до 92+/-24, после 88+/-23, разница по реальным данным вышла -3,6+/-12,8. По формуле, соответственно, +/-33, 2. Подскажите, пожалуйста, что не так ...
|
|
![]() |
![]() |
![]() |
![]()
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 ![]() |
Игорь не против формы записи +-, но считает, что нужно почитать Тейлора, чтобы понять почему после +- должна быть именно ошибка, а не рассеяние. Я не большой знаток статистики, но ясно представляю, что означает m и SD, и есло n указано, легко могу получить то, что меня интересует - точность определения среднего или разброс показателя в популяции. Раньше, в докомпьютерный период в наших публикациях чаще приводили m, сегодня, используя программы чаще приводят SD, поскольку в отчете, например в пакете Statistica при сравнении средних приводится SD обеих групп, а в случае связанных выборок и SD разницы. Именно с этой оценки эта ветка и началась. Реброва О.Ю. рекомендует приводить именно SD.
|
|
![]() |
![]() |
![]()
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 ![]() |
Игорь не против формы записи +-, но считает, что нужно почитать Тейлора, чтобы понять почему после +- должна быть именно ошибка, а не рассеяние. Я не большой знаток статистики, но ясно представляю, что означает m и SD, и есло n указано, легко могу получить то, что меня интересует - точность определения среднего или разброс показателя в популяции. Раньше, в докомпьютерный период в наших публикациях чаще приводили m, сегодня, используя программы чаще приводят SD, поскольку в отчете, например в пакете Statistica при сравнении средних приводится SD обеих групп, а в случае связанных выборок и SD разницы. Именно с этой оценки эта ветка и началась. Реброва О.Ю. рекомендует приводить именно SD. Да? И какой процент популяции находится в пределах +/- SD? 68% (нормальное распределение) или меньший процент (отклонения от нормальности, могут быть и все 100%)? Если Вы делаете запись +/-2*SD, то, по крайней мере, можно утверждать, что как минимум 75% всех наблюдений находятся в этом диапазоне вне зависимости от типа распределения. В том же случае, если речь идет о стандартной ошибке среднего, то, согласно центральной предельной теореме, распределение выборочных средних является нормальным (вне зависимости от исходного распределения). Соответственно, в случае записи +/-m Вы можете утверждать, что можете оценить точность определения среднего (Вы указываете 68% доверительный интервал). В случае же записи +/-SD подобного утверждения делать нельзя, ибо по неравенству Чебышева за пределами этого интервала могут находиться до 100% всех значений (напомню, что согласно неравенству Чебышева, вне зависимости от распределения, за пределами интервала в k SD находится не более 1/k^2 значений (http://en.wikipedia.org/wiki/Chebyshev's_inequality)). Повторюсь, что в случае SEM центральная предельная теорема спасает ситуацию, иными словами, можно НЕ писать +/-, но если писать, то единственно возможным является эта запись для SEM. Если хочется продолжить спор, прошу не ссылки на О.Ю.Реброву (ее точка зрения - это всего лишь точка зрения), а обоснование возможности записи +/-SD с опрвержением моих рассуждений (обратите внимание, не точки зрения, а доказательств). Итак, что надо опровергнуть, чтобы доказать возможность записи +/-SD: - Подобная запись не позволяет определить степень рассеяния, поскольку рассеяние является распределение-зависимым. Соответственно, этот интервал имеет неизвестный размер и не имеет даже нижней границы - Для +/-SEM ввиду наличия центральной предельной теоремы, при достаточном количестве наблюдений, запись указывает на интервал известного "объема" (68%), поэтому данная запись является обоснованной |
|
![]() |
![]() |
![]() ![]() |