Цитата(DrgLena @ 19.05.2008 - 23:11)

Игорь не против формы записи +-, но считает, что нужно почитать Тейлора, чтобы понять почему после +- должна быть именно ошибка, а не рассеяние. Я не большой знаток статистики, но ясно представляю, что означает m и SD, и есло n указано, легко могу получить то, что меня интересует - точность определения среднего или разброс показателя в популяции. Раньше, в докомпьютерный период в наших публикациях чаще приводили m, сегодня, используя программы чаще приводят SD, поскольку в отчете, например в пакете Statistica при сравнении средних приводится SD обеих групп, а в случае связанных выборок и SD разницы. Именно с этой оценки эта ветка и началась. Реброва О.Ю. рекомендует приводить именно SD.
Да? И какой процент популяции находится в пределах +/- SD? 68% (нормальное распределение) или меньший процент (отклонения от нормальности, могут быть и все 100%)?
Если Вы делаете запись +/-2*SD, то, по крайней мере, можно утверждать, что как минимум 75% всех наблюдений находятся в этом диапазоне вне зависимости от типа распределения.
В том же случае, если речь идет о стандартной ошибке среднего, то, согласно центральной предельной теореме, распределение выборочных средних является нормальным (вне зависимости от исходного распределения). Соответственно, в случае записи +/-m Вы можете утверждать, что можете оценить точность определения среднего (Вы указываете 68% доверительный интервал). В случае же записи +/-SD подобного утверждения делать нельзя, ибо по неравенству Чебышева за пределами этого интервала могут находиться до 100% всех значений (напомню, что согласно неравенству Чебышева, вне зависимости от распределения, за пределами интервала в k SD находится не более 1/k^2 значений (http://en.wikipedia.org/wiki/Chebyshev's_inequality)).
Повторюсь, что в случае SEM центральная предельная теорема спасает ситуацию, иными словами, можно НЕ писать +/-, но если писать, то единственно возможным является эта запись для SEM.
Если хочется продолжить спор, прошу не ссылки на О.Ю.Реброву (ее точка зрения - это всего лишь точка зрения), а обоснование возможности записи +/-SD с опрвержением моих рассуждений (обратите внимание, не точки зрения, а доказательств). Итак, что надо опровергнуть, чтобы доказать возможность записи +/-SD:
- Подобная запись не позволяет определить степень рассеяния, поскольку рассеяние является распределение-зависимым. Соответственно, этот интервал имеет неизвестный размер и не имеет даже нижней границы
- Для +/-SEM ввиду наличия центральной предельной теоремы, при достаточном количестве наблюдений, запись указывает на интервал известного "объема" (68%), поэтому данная запись является обоснованной