Форум врачей-аспирантов > Стандартное отклонение разницы средних

sayrus

15.05.2008 - 05:55

Есть среднее +/- стандартное отклонение показателя до лечения, есть среднее +\- после лечения. Как расчитать разницу средних и стандартное отклонение? Прочитал. что можно по формуле (корень из суммы квадратов станд отклонений средних значений до и после), но когда использовал формулу имея реальные данные оказалось, что величины отклонений (реального и рассчитаного) сильно различаются. Например: уровень креатинина до 92+/-24, после 88+/-23, разница по реальным данным вышла -3,6+/-12,8. По формуле, соответственно, +/-33, 2. Подскажите, пожалуйста, что не так ...

Игорь

15.05.2008 - 06:45

А может, взять исходные выборки до и после лечения (очевидно, данные парные?)? Из них составить одну выборку разностей вариант. По полученной выборке рассчитать искомые статистические показатели.

sayrus

15.05.2008 - 10:29

Еще раз!

Анализирую материал из статьи. Есть 2 группы (активное лечение и плацебо). Известны исходные и итоговые средние значения некоего показателя +/- стандартное отклонение в обеих группах. Необходимо оценить среднее значение изменения показателя (отдельно для каждой группы) и определить стандартное отклонение этого изменения (опять же отдельно для каждой группы). Я думал все просто, считаешь стандартное отклонение разности средних и все ... Но когда проверил результат на реальных данных, различия реального стандартного отклонения разности средних (итоговое минус исходное) от расчитываемого, были существенными. Видимо не понимаю чего-то ну очень простого ...

DrgLena

15.05.2008 - 12:53

Вы используете не ту формулу SD для оценки средней разности между выборками с попарно связанными вариантами. Вы взяли просто формулу для оценки ошибки разности средних для равночисленных, но не связанных выборок, очевидно из Лакина стр 115. Но перелистнув 2 страницы, есть подробное описание с примером как оценить среднюю разность при связанных выборках и дана формула расчета ошибки средней разности. В формулу входит средняя разность и сумма квадратов разностей. Чтобы получить SD умножте результат на корень иp n. Пример из Лакина и решение с формулами - в пришпиленном файле, но формулы могут слететь, файлы с 2007 и 2003 wordom.

sayrus

15.05.2008 - 19:09

Правильно говорят, один дурак задаст вопрос и 100 мудрецов не ответят

Книгу уважаемого Лакина не встречал, к сожалению. Но все равно спасибо.
Еще раз, но уже совсем просто.

У больных с заболеванием А уровень креатинина до начала лечения 92,4 +/- 24,5 мкмоль/л, после лечения 88,9 +/- 23,3 мкмоль/л, объем выборки - 378 пациентов. Единственное чего нет, так это матрицы данных, чтобы посчитать изменение +/- стандартное отклонение. так вот, можно ли посчитать это самое отклонение без данных, имея только результат (исходно/после лечения)?

DrgLena

15.05.2008 - 21:16

На самом деле, вы задали очень важный вопрос. Очень часто, читая литературу, хочется сравнить свои результаты с результатами других методик, или сравнить несколько методов. Разность до и после лечения дает возможность сравнить несколько методик лечения посредством сравнения доверительных интервалов (ДИ) , но для расчета ДИ нужно знать SD или m. Все программы при сравнении средних значений связанных выборок предоставляют не только SD для каждого ряда, но и SD разницы средних, которые почему то в работах не приводят. К сожалению не имея рядов нельзя посчитать сумму квадратов разностей, которая входит в формулу расчета m.

плав

16.05.2008 - 09:35

Рассчитать по приведенным данным стандартное отклонение для разностей нельзя. Ибо формула расчета
SD^2=SD1^2+SD2^2-2*r*SD1*SD2, где r - корреляция между значениями первого и второго определений. Соответственно, не зная этого r SD суммарное не определяется (так что мудрецы-то могут ответить).
Да, и кстати запись +/- это запись не для стандартного отклонения, а для стандартной ошибки, которая значительно меньше стандартного отклонения (в корень из числа наблюдений раз). Так что надо аккуратнее с данными.
Для тех, кто еще будет читать эту ветку: обратите внимание, что из суммы квадратов вычитается произведение стандартных отклонений. Поэтому квадрат стандартного отклонения для парных случаев всегда меньше суммы квадратов стандартных отклонений и равен ему лишь в случае независимости наблюдений (что и наблюдается в случае непарных наблюдений).

DrgLena

16.05.2008 - 11:09

На всякого мудреца - довольно простоты
Автор постера ясно указал, что приводится среднее +-стандартное отклонение, что принято в качестве стандарта представления данных в зарубежных публикациях. Обратите внимание, что в отчетах, которые выдают обе программы, в пришпиленном файле, средняя разница приводится именно со значением SD, а не ошибки.
Соглашусь с Плавом только в том, что действительно, отсутствуют данные для расчет SD разницы. Но не соглашусь с тем, что по приведенной формуле можно рассчитать SD. Оно получается значительно выше, чем есть на самом деле.
Продолжение расчета по примеру из Лакина - в пришпиленном файле.
Интересно, а что SAS выдаст по рассматриваемому примеру?

плав

16.05.2008 - 12:51

Всегда приятно, когда есть люди, которые могут легко найти ошибку, правда не могут обнаружить где она скрыта. Для любителей все пересчитывать (формула не предназначалась для пересчетов, но это так) - пропущен множитель 2 перед произведениями SD. Добавьте и все получите с точностью до округления. Это метод не мой, это - вообще-то - основы анализа связанных переменных, так что вместо предложений по поводу считать в SAS (все программы дают одинаковые результаты) могли бы (если бы знали) просто указать на пропущенный множитель.
Что же касается +/- стандартное отклонение в зарубежных публикациях, попробуйте найти такое представление в зарубежных публикациях. Не надо смешивать французский с нижегородским. Стандартное представление M(SD), а не +/-, которое означает интервал, причем 68%.

DrgLena

16.05.2008 - 15:50

И мне приятно, что модератор легко ее может исправить. А насчет французского с нижегородским см. ссылку.

sayrus

16.05.2008 - 17:13

Коллеги, большое спасибо!

Открыли глаза еще на одну деталь.
А по поводу +/- ... В зарубежных публикациях указывают по разному, и +/- и (SD).
Основное правило - это подписать, что означает +/- или что находится в скобочках.
Хотя соглашусь, в последнее время доминирует (SD).

плав

18.05.2008 - 11:17

Цитата(DrgLena @ 16.05.2008 - 16:50)

И мне приятно, что модератор легко ее может исправить. А насчет французского с нижегородским см. ссылку.

Не хотел ввязываться в спор, но уж... Вы бы еще статью из континетального Китая прикрепили, а еще лучше из International Medical Journal, издаваемого в Москве. Не все "зарубежные" журналы созданы равными, при ссылках на то как надо делать следует смотреть на журналы с высоким воздействием impact, а не просто на то, что напечатано на английском.

DrgLena

18.05.2008 - 21:11

Dear Sir Плав, Вы не ввязались в спор, а Вы его затеяли.
А спорить не о чем, в нашей специальности IOVS - ведущий международный журнал и он не виноват, что китайцы, и не только из Тайваня, там чаще печатаются, чем нижегородцы.
Клинические испытания, результаты которых публикуются в этом журнале должны быть зарегистрированы по следующим ссылкам:
http://www.actr.org.au (Australia)
http://www.clinicaltrials.gov (US)
http://isrctn.org (UK)
http://www.umin.ac.jp/ctr/index/htm (Japan)
http://www.trialregister.nl/trialreg/index.asp (Netherlands)
Investigative Ophthalmology & Visual Science (IOVS), published monthly in print and online, is an official journal of the Association for Research in Vision and Ophthalmology (ARVO), an international organization whose purposes are to encourage and assist research, training, publication, and dissemination of knowledge in vision and ophthalmology. Included are original contributions that emphasize clinical and laboratory hypothesis-based research with statistically good results that clearly advance the fields of ophthalmic and vision research. IOVS de-emphasizes purely descriptive research.
Contact Information for IOVS Editorial Office Address: 12300 Twinbrook Parkway Suite 250
Email: iovs@arvo.org

Если у Вас есть международные правила оформления работ, то поделитесь первоисточником, пожалуйста.

DrgLena

19.05.2008 - 11:11

Издательство ELSEVIER не нуждается в представлении. У них во всех работах, которые мне встречались среднее +- SD. В постсоветстком пространстве, видимо, можно и то и другое, потому и возникают вопросы.

Игорь

19.05.2008 - 12:41

Цитата(DrgLena @ 19.05.2008 - 11:11)

В постсоветстком пространстве, видимо, можно и то и другое, потому и возникают вопросы.

Причем тут постсоветское пространство? Наука интернациональна. А национальная самоидентификация не должна идти далее культуры и языка, которые каждому следует беречь и хранить. Теперь по делу.

Уважаемый доктор, посмотрите монографию "Тейлор Дж. Введение в теорию ошибок. - М.: Мир, 1985", с. 24 и далее. Там поясняется, почему после +- должна стоять величина, характеризующая именно ошибку, а не рассеяние.

В цитируемой же работе далее даны подробные рассуждения о манипуляциях с величинами, рассматриваемыми в данной теме. Как раз ошибки (а не стандартные отклонения) позволяют данные манипуляции провести, не привлекая дополнительной информации об исходных данных, которая часто недоступна.

Если возникнет затруднение с поиском печатного варианта книги, поищите в Интернете электронный вариант. Где-то я его видел

плав

19.05.2008 - 14:57

Цитата(DrgLena @ 19.05.2008 - 12:11)

Издательство ELSEVIER не нуждается в представлении. У них во всех работах, которые мне встречались среднее +- SD. В постсоветстком пространстве, видимо, можно и то и другое, потому и возникают вопросы.

Ну вообще-то это не издательство, а редакционная коллегия определяет политику оформления статей. Она же может приглашать статистических рецензентов, что делают крупные журналы (я имею в виду журналы, типа Lancet, BMJ, JAMA, NEJM), т.е. журналы с очень высоким импакт-фактором. Что касается существа спора, давайте Вы будете спорить с Bland и Altman и позицией BMJ, рекомендованной другим журналам:
http://www.bmj.com/cgi/content/full/331/7521/903
Последний абзац, цитирую:
"In many publications a +/- sign is used to join the standard deviation (SD) or standard error (SE) to an observed mean - for example, 69.4+/-9.3 kg. That notation gives no indication whether the second figure is the standard deviation or the standard error (or indeed something else). A review of 88 articles published in 2002 found that 12 (14%) failed to identify which measure of dispersion was reported (and three failed to report any measure of variability). The policy of the BMJ and many other journals is to remove +/- signs and request authors to indicate clearly whether the standard deviation or standard error is being quoted. All journals should follow this practice."

DrgLena

19.05.2008 - 15:35

Плав, спасибо за ссылку, именно ее я и хотела найти, у меня потерялась где то.
Предметом спора, как раз и было высказывание, цитата "Да, и кстати запись +/- это запись не для стандартного отклонения, а для стандартной ошибки".
и эта ссылка, "In many publications a +/- sign is used to join the standard deviation (SD) or standard error (SE)" подтверждает то, что проблемы нет - можно приводить и то и другое, но обязательно указавать, что это.

плав

19.05.2008 - 20:53

Цитата(DrgLena @ 19.05.2008 - 16:35)

Плав, спасибо за ссылку, именно ее я и хотела найти, у меня потерялась где то.
Предметом спора, как раз и было высказывание, цитата "Да, и кстати запись +/- это запись не для стандартного отклонения, а для стандартной ошибки".

А это я писал: "Автор постера ясно указал, что приводится среднее +-стандартное отклонение, что принято в качестве стандарта представления данных в зарубежных публикациях." (выделение мое)
Насчет же "можно приводить и то и другое", то важен конец цитаты:
"The policy of the BMJ and many other journals is to remove +/- signs and request authors to indicate clearly whether the standard deviation or standard error is being quoted. All journals should follow this practice"
И обратите внимание на пост Игоря выше...

DrgLena

19.05.2008 - 22:11

Игорь не против формы записи +-, но считает, что нужно почитать Тейлора, чтобы понять почему после +- должна быть именно ошибка, а не рассеяние. Я не большой знаток статистики, но ясно представляю, что означает m и SD, и есло n указано, легко могу получить то, что меня интересует - точность определения среднего или разброс показателя в популяции. Раньше, в докомпьютерный период в наших публикациях чаще приводили m, сегодня, используя программы чаще приводят SD, поскольку в отчете, например в пакете Statistica при сравнении средних приводится SD обеих групп, а в случае связанных выборок и SD разницы. Именно с этой оценки эта ветка и началась. Реброва О.Ю. рекомендует приводить именно SD.

плав

20.05.2008 - 13:22

Цитата(DrgLena @ 19.05.2008 - 23:11)

Игорь не против формы записи +-, но считает, что нужно почитать Тейлора, чтобы понять почему после +- должна быть именно ошибка, а не рассеяние. Я не большой знаток статистики, но ясно представляю, что означает m и SD, и есло n указано, легко могу получить то, что меня интересует - точность определения среднего или разброс показателя в популяции. Раньше, в докомпьютерный период в наших публикациях чаще приводили m, сегодня, используя программы чаще приводят SD, поскольку в отчете, например в пакете Statistica при сравнении средних приводится SD обеих групп, а в случае связанных выборок и SD разницы. Именно с этой оценки эта ветка и началась. Реброва О.Ю. рекомендует приводить именно SD.

Да? И какой процент популяции находится в пределах +/- SD? 68% (нормальное распределение) или меньший процент (отклонения от нормальности, могут быть и все 100%)?
Если Вы делаете запись +/-2*SD, то, по крайней мере, можно утверждать, что как минимум 75% всех наблюдений находятся в этом диапазоне вне зависимости от типа распределения.
В том же случае, если речь идет о стандартной ошибке среднего, то, согласно центральной предельной теореме, распределение выборочных средних является нормальным (вне зависимости от исходного распределения). Соответственно, в случае записи +/-m Вы можете утверждать, что можете оценить точность определения среднего (Вы указываете 68% доверительный интервал). В случае же записи +/-SD подобного утверждения делать нельзя, ибо по неравенству Чебышева за пределами этого интервала могут находиться до 100% всех значений (напомню, что согласно неравенству Чебышева, вне зависимости от распределения, за пределами интервала в k SD находится не более 1/k^2 значений (http://en.wikipedia.org/wiki/Chebyshev's_inequality)).
Повторюсь, что в случае SEM центральная предельная теорема спасает ситуацию, иными словами, можно НЕ писать +/-, но если писать, то единственно возможным является эта запись для SEM.
Если хочется продолжить спор, прошу не ссылки на О.Ю.Реброву (ее точка зрения - это всего лишь точка зрения), а обоснование возможности записи +/-SD с опрвержением моих рассуждений (обратите внимание, не точки зрения, а доказательств). Итак, что надо опровергнуть, чтобы доказать возможность записи +/-SD:
- Подобная запись не позволяет определить степень рассеяния, поскольку рассеяние является распределение-зависимым. Соответственно, этот интервал имеет неизвестный размер и не имеет даже нижней границы
- Для +/-SEM ввиду наличия центральной предельной теоремы, при достаточном количестве наблюдений, запись указывает на интервал известного "объема" (68%), поэтому данная запись является обоснованной

DrgLena

20.05.2008 - 20:13

Спорить не буду, почитаю Тейлора, благодаря Игорю он уже у меня есть.

Leonov

21.05.2008 - 03:53

Цитата(Игорь @ 19.05.2008 - 09:41)

Причем тут постсоветское пространство? Наука интернациональна. А национальная самоидентификация не должна идти далее культуры и языка, которые каждому следует беречь и хранить. Теперь по делу.

Уважаемый доктор, посмотрите монографию "Тейлор Дж. Введение в теорию ошибок. - М.: Мир, 1985", с. 24 и далее. Там поясняется, почему после +- должна стоять величина, характеризующая именно ошибку, а не рассеяние.

В цитируемой же работе далее даны подробные рассуждения о манипуляциях с величинами, рассматриваемыми в данной теме. Как раз ошибки (а не стандартные отклонения) позволяют данные манипуляции провести, не привлекая дополнительной информации об исходных данных, которая часто недоступна.

Если возникнет затруднение с поиском печатного варианта книги, поищите в Интернете электронный вариант. Где-то я его видел

К примеру, можно скачать с сайта БИОМЕТРИКА (см. адрес http://www.biometrica.tomsk.ru/razdel_2_7.htm )