Liliya
20.03.2008 - 00:26
Добрый день! Работаю в экселе, поэтому прошу помощи: как расчитать вероятность, стандартную ошибку и т.д.? У меня 3 группы испытуемых плюс контрольная группа. Проводила психологическое тестирование.
DrgLena
21.03.2008 - 00:26
На такой вопрос серьезно ответить нельзя, итд. эксель точно посчитать не сможет. В Одессе скоро 1 апреля, и я бы вопросом ответила на вопрос. Я работаю на кухне, у меня есть скальпель и пинцет, как мне сделать энуклеацию?
Вот уж действительно - каков вопрос, таков и ответ. Неумение поставить задачу не стоит относить к недостаточной точности инструмента. Те статистические методы, которые реализованы в виде функций рабочего листа и "Пакета анализа", Excel считает правильно. Есть, конечно, проблемы, но непринципиальные. Это тема другой ветки форума.
Рекомендую найти книгу (это не составит труда) "Макарова Н.В., Трофимец В.Я. Статистика в Excel. - М.: Финансы и статистика, 2002". Там есть ответы, включая сводку статистических функций и примеры применения.
Статистические возможности Excel ограниченны. Для серьезной статистической обработки нужно обзавестись какой-либо фирменной специализированной программой. Естественно, для эффективной работы и азы статистики, и программу еще нужно изучить.
Ну, чтобы уж совесем не опускать спрашивающего

Расчет стандартного отклонения производится путем использования функции СТАНДОТКЛОН(диапазон ячеек)
Сравнить группы с контролем можно функцией ТТЕСТ(), однако, учитывая, что у Вас будет три сравнения, надо использовать пограничную вероятность не 0,05, а 0,016 (это - поправка Бонферонни)
Но вообще-то Ваша задача решается, скорее всего методами дисперсионного анализа, которые есть в пакете анализа (надстройке). Посмотрите краткое описание возможностей тут
http://www.5ka.ru/67/26229/1.htmlПравда, я бы не рекомендовал пользоваться Экселем для анализа, лучше изучить какую-нибудь более серьезную программу, поскольку учить статистику все равно придется
DrgLena
21.03.2008 - 23:02
Все зависит от шкалы оценки психологического тестирования. Чаще, анализ различий бальных оценок проводят с использованием ранговых критериев. Поэтому непараметрический аналог дисперсионного анализа Краскала - Уоллиса, с последующим применением критерия Манна - Уитни, возможно более предпочтителен.
Да, но вот ведь вроде в Экселе Краскела-Уоллеса нет (может путаю, не судите строго - не специалист по экселю).
Цитата(DrgLena @ 21.03.2008 - 23:02)

Все зависит от шкалы оценки психологического тестирования. Чаще, анализ различий бальных оценок проводят с использованием ранговых критериев. Поэтому непараметрический аналог дисперсионного анализа Краскала - Уоллиса, с последующим применением критерия Манна - Уитни, возможно более предпочтителен.
Зачем же так длинно? Может, сразу взять критерий Джонкхиера-Терпстра?
А в Excel непараметрики нет. Либо самому вводить формулы, либо надстройками пользоваться. Но они опять же платные. Тогда уж лучше специализированную программу взять (можно и бесплатную).
DrgLena
23.03.2008 - 14:49
Вы совершенно правы, но только для случая, если нужно оценить только тренд или показать, что он есть. Но чаще, не известно какие воздействия относительно контроля более сильные. И парные сравнения все равно нужны. Поясните, если можно, как в описании трактовать результат сравнения при использовании критерия Джонкхиера - Терпстра. У меня одна группа контроль и две под различными воздействиями. Оценка по Дж-Т р=0,04, по Кр-Уол р=0,11, медианный тест р=0,11. Фактически нулевая гипотеза не отвергается по двум тестам и дальнейший анализ парных различий не показан. Но по критерию Дж-Т тренд статистически значим. Как правильно сформулировать вывод?
Цитата(DrgLena @ 23.03.2008 - 14:49)

Вы совершенно правы, но только для случая, если нужно оценить только тренд или показать, что он есть. Но чаще, не известно какие воздействия относительно контроля более сильные. И парные сравнения все равно нужны. Поясните, если можно, как в описании трактовать результат сравнения при использовании критерия Джонкхиера - Терпстра. У меня одна группа контроль и две под различными воздействиями. Оценка по Дж-Т р=0,04, по Кр-Уол р=0,11, медианный тест р=0,11. Фактически нулевая гипотеза не отвергается по двум тестам и дальнейший анализ парных различий не показан. Но по критерию Дж-Т тренд статистически значим. Как правильно сформулировать вывод?
Вывод формулируется стандартно.
Критерий Джонкхиера-Терпстра представлен в параграфе 6.2 книги "Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере.- М.: ИНФРА-М, 1998". При этом критерию Краскела-Уоллиса посвящен раздел 6.2.1, критерию Джонкхиера - раздел 6.6.2. Более подробно критерий описан в книге "Холлендер М., Вулф Д. Непараметрические методы статистики. - М.: Финансы и статистика, 1983. Благодаря усилиям "пиратов" упомянутые источники можно загрузить для ознакомления из Интернета.
Рекомендовал бы также посмотреть критерий Кьюзика. Он введен в статье "Cuzick J. A Wilcoxon-type test for trend // Statistics in Medicine, January/March 1985, vol. 4, issue 1, pp. 87-90". Так как достать данный источник затруднительно, то можно ознакомиться с материалами по данному тесту по ссылке
http://www.camcode.com/help/statsdirect.htm.
Упомянутыми методами может быть установлено, что статистические параметры (например, параметры положения) в группе различаются. Однако они не покажут, параметры каких совокупностей действительно различаются между собой. Из непараметрических критериев для решения задачи применяется критерий Данна. Его краткое описание есть у Гланца (без функции распределения). Более подробно метод представлен в упомянутой выше книге Холлендера и Вулфа. Есть еще пара источников. Не указываю, т.к. все равно достать трудно.
DrgLena
24.03.2008 - 11:21
Зачем же так длинно! Вы рекомендовали применить критерий Джонхиера - Терпстры, я согласилась и привела пример его использования (в SPSS - реализован), но вы не ответили на вопрос, как трактовать результат его применения. Ведь без парных сравнений после его применения все равно не обойтись. Я не против Джонхиера - Терпстры, но наш ученый совет с трудом переварил критерий Мак-Немара (Нимара?), было много вопросов от оппонентов и рецензентов, почему именно его использовали. Каждый новый критерий, а особенно с таким тяжелым именем, воспринимается как враг. Литературы с математическим описанием много, но нет ссылок на применение этого критерия в русскоязычных медицинских статьях, хотя бы для ссылки, что это используется. Или есть?
Цитата(DrgLena @ 24.03.2008 - 11:21)

Зачем же так длинно! Вы рекомендовали применить критерий Джонхиера - Терпстры, я согласилась и привела пример его использования (в SPSS - реализован), но вы не ответили на вопрос, как трактовать результат его применения. Ведь без парных сравнений после его применения все равно не обойтись.
Критерий Джонкхиера-Терпстра не дает ответа на вопрос, какие именно ряды различаются по параметру положения. Если этого результата недостаточно, то без парных сравнений, действительно, не обойтись. Но применение критерия Манна-Уитни в данном случае - попарном сравнении многих совокупностей - будет некорректным.
Цитата(DrgLena @ 24.03.2008 - 11:21)

Я не против Джонхиера - Терпстры, но наш ученый совет с трудом переварил критерий Мак-Немара (Нимара?), было много вопросов от оппонентов и рецензентов, почему именно его использовали. Каждый новый критерий, а особенно с таким тяжелым именем, воспринимается как враг.
Критерий Мак-Немара трудно назвать новым. Объяснить его необходимость можно было тем, что его применение, видимо, было обусловлено характером исходных данных (в частности, шкалой их измерения). Враждебность же восприятия сильно зависит от контекста, от уместности, от поведения соискателя.
Цитата(DrgLena @ 24.03.2008 - 11:21)

Литературы с математическим описанием много, но нет ссылок на применение этого критерия в русскоязычных медицинских статьях, хотя бы для ссылки, что это используется. Или есть?
Есть такие работы. Даже монографии. Например, в книге д.м.н. В.А. Уткина "Статистические технологии в медицинских исследованиях. - Пятигорск: ГНИИК, 2002" (консультанты - 2 д.м.н., 1 профессор, рецензенты - 4 д.м.н., 1 д.ф.-м.н. и 1 профессор) на . с. 41 дано описание критерия Джонкхиера-Терпстра. Даже если тот или иной статистический метод не использовался до сих пор в медицинских статьях, то это не основание, чтобы отказаться от его применения. Кому-то надо начинать первым. А вероятностные законы всеобщи - занимаетесь ли вы биометрикой, психометрикой, технометрикой, хемометрикой, эконометрикой и прочими метриками.
DrgLena
24.03.2008 - 16:16
Игорь. спасибо вам, вы всегда внимательны и обстоятельны. Я, конечно ошиблась (парные сравнения не Манна -Уинти, а Вилкоксона. У Лакина - путаница с названиями). Критерий Джонкхиера - Терсптры хорошо описан в англоязычных источниках. Он весьма полезен в определенных ситуациях. Но первым, действительно трудно быть.
Тут мы немного в терминах напутали. Назвали попарные сравнения нескольких выборок (больше двух) между собой парными сравнениями. Это, конечно же, употребление зарезервированного термина в "бытовом" смысле. Конечно, о парных сравнениях (о сопряженных выборках) тут речь не идет. А идет именно о попарных сравнениях: 1-я выборка сравнивается со 2, 3, 4, ... и т.д., 2-я выборка - с 3, 4, .... и т.д. Тут критерий Вилкоксона не поможет, а критерий Данна подходит.
У Гланца критерий Данна описан, но, как сказано выше, не приводится его функция распределения. Т.е. по статистике критерия не найти p-значение. А хотелось бы. Оказывается, что p-значение критерия Данна находится как решение нелинейного уравнения
Q = Ф(p / k / (k - 1)),
где Q - вычисленная статистика критерия,
Ф(.) - функция стандартного нормального распределения,
k - количество групп (выборок, совокупностей).
Расчет получается несложным. Можно и в Excel сделать.
Небольшое дополнение к предыдущему. Все поминают Мак-Немара, но оригинал мало кто видел. К счастью, его совершенно легально можно загрузить по ссылке
http://www.archive.org/download/Psychologi...irdEdition.djvu. Рекомендую.
Ну, вообще-то Гланц приводит таблицы для использования критерия Дана, (т.е. вывод о различиях сделать можно и по его книге). Честно говоря, предложение в экселе находить корни нелинейного уравнения (предполагается. что это будут делать аспиранты-медики) меня позабавила.
Вообще с Данном ситуация сложная. Сам критерий был предложен в 1961 году для параметрического дисперсионного анализа, но затем (ввиду высокого консерватизма, как и оргинальный Бонферрони) был оттеснен такими тестами, как Ньюмана Коулса и Тьюки. Затем было предложено использовать его для непараметрического дисперсионного анализа (кстати, в русской версии книги Гланца не приведена формула для "связанных" рангов). Поэтому методика расчета осталась от параметрического критерия:
1) найти пограничное значение z (t). Тут есть следующие предложения -(а) разделить желаемый максимальный уровень достоверности (0,05) на к*(к-1)/2, где к-количество групп и найти значение нормального распределения z, соответтсвующее полученной вероятности (Daniel, 1990) или (б) рассчитать t=z+(z^3+z)/(4*(df-2)) (Keppel, 1991), где z - значение нормального распределения, соответствующее максимальной вероятности, деленной на количество групп и на 2 (т.е. 0,05/к/2).
2) Сравнить рассчитанную величину по формулам (например, из Глана) и полученное пограничное значение.
Иное использование теста (т.е. не путем сравнения с пограничными значениями) является бессмысленным, поскольку реально этот тест корректирует уровень значимости с учетом множественных сравнений, соответственно р=0,023 - это бессмыслица, а запись были достоверны (p>0.05) означает, что суммарная ошибка (experimentwise error) превышает 0,05, хотя в данном случае, различия между группами и были 0,045.
На самом деле, тест Дана является расширением теста Бонферрони, и также консервативен, как и Бонферрони, поэтому для простейших случаев можно не мудрствуя лукаво просто использовать поправку Бонферрони для множественных сравнений.
to DrgLena
Тест Jonckheere-Terpstra тестирует гипотезу о том, что данные являются упорядоченными, т.е. альтернативная гипотеза для него заключается в том, что Me1>=Me2>=Me3. Соответственно, (1) если группы не упорядочены, его использовать нельзя, (2) если группы упорядочены (измеяем длительность головных болей (исход) в четырех группах в зависимости от уровня шума (сила шума 1-4)), то он окажется более мощным критерием, нежел К-В. Это общий критерий, как и К-В, и F Снедекора в дисперсионном анализе. Соответственно, для попарных сравнений медиан групп придется использовать другие критерии.
Вопрос:
В книге: С. Гланц. Медико-биологическая статистика. М.: Практика, 1998. нашел только "критерий Даннета". Это и есть критерий Данна?
Реплика:
В одном из двух лучших в мире учебников по биометрии - книге Sokal & Rohlf "Biometry" в качестве менее консервативного теста для множественных сравнений рекомендуется последовательная техника Бонферрони - метод Данна-Шидака (Dunn-Sidak).
Цитата(nokh @ 27.03.2008 - 21:56)

Вопрос:
В книге: С. Гланц. Медико-биологическая статистика. М.: Практика, 1998. нашел только "критерий Даннета". Это и есть критерий Данна?
Реплика:
В одном из двух лучших в мире учебников по биометрии - книге Sokal & Rohlf "Biometry" в качестве менее консервативного теста для множественных сравнений рекомендуется последовательная техника Бонферрони - метод Данна-Шидака (Dunn-Sidak).
1) Критерий Данна в переводном варианте описан на стр. 351, Даннета - не то.
2) Критерий Данна-Шидака опять-таки немного не то (там просто коррекция (т.е. деление всеэкспериментального уровня альфа)) делается не так (последовательно).
DrgLena
28.03.2008 - 02:19
Игорю! Мак-Немара не только поминаю, но и широко использую. Очень полезен в анализе эффективности воздействий. Анализируется разность относительных частот наличия признака до и после лечения в одной группе (связанные выборки). Я вообще не знаю как без него обойтись. Решаем простую задачку. До лечения у 15 больных из 30 имелся признак (кашель), после лечения кашель остался только у 5. Эффективно ли было лечение? Критерий оценивает только разницу (15-5=10). ХиМ-Н=8,1; р=0,004. Разность относительной частоты признака до и послелечения составляет 33,3% (95%ДИ 16,5%-50,2%).
Описано на русском и у Ребровой и у Петри и Сэбин и реализовано во всех пакетах (SPSS, Statistica, MedCalc), кроме того, если данные не в базе данных, то есть калькуляторы в сети. Может и есть альтернатива этому критерию, но я не знаю, поделитесь, если знаете. Сложность только в том, чтобы правильно составить четырехпольную таблицу - это не таблица сопряженности!
Цитата(nokh @ 27.03.2008 - 21:56)

Вопрос:
В книге: С. Гланц. Медико-биологическая статистика. М.: Практика, 1998. нашел только "критерий Даннета". Это и есть критерий Данна?
Реплика:
В одном из двух лучших в мире учебников по биометрии - книге Sokal & Rohlf "Biometry" в качестве менее консервативного теста для множественных сравнений рекомендуется последовательная техника Бонферрони - метод Данна-Шидака (Dunn-Sidak).
Критерий Данна см. на с. 351 книги Гланца.
Извините, выше ответ на вопрос уже был. Не заметил.
Спасибо, нашел. Не совсем удобно: близкие темы обсуждаются в разных частях книги.
Цитата(DrgLena @ 28.03.2008 - 02:19)

Игорю! Мак-Немара не только поминаю, но и широко использую. Очень полезен в анализе эффективности воздействий. Анализируется разность относительных частот наличия признака до и после лечения в одной группе (связанные выборки). Я вообще не знаю как без него обойтись. Решаем простую задачку. До лечения у 15 больных из 30 имелся признак (кашель), после лечения кашель остался только у 5. Эффективно ли было лечение? Критерий оценивает только разницу (15-5=10). ХиМ-Н=8,1; р=0,004. Разность относительной частоты признака до и послелечения составляет 33,3% (95%ДИ 16,5%-50,2%).
Описано на русском и у Ребровой и у Петри и Сэбин и реализовано во всех пакетах (SPSS, Statistica, MedCalc), кроме того, если данные не в базе данных, то есть калькуляторы в сети. Может и есть альтернатива этому критерию, но я не знаю, поделитесь, если знаете. Сложность только в том, чтобы правильно составить четырехпольную таблицу - это не таблица сопряженности!
Действительно, наши расчеты критерия Мак-Немара такие же: 8,10, p = 0,00443
В-общем, о Мак-Немаре все ясно за исключением факта, двустороннее это значение или одностороннее? Рекомендую посмотреть также заметки "Bennett B.M., Underwood R.E. On McNemar?s test for the 2 x 2 table and its power // Biometrics, June 1970, vol. 26, no. 2, pp. 339-343". В работе рассмотрено точное распределение статистики критерия Мак-Немара. В классическом варианте хи-квадрат - это лишь аппроксимация.
Можно, наверное, и z-критерий применить. То, что показано выше, разбирается в источнике "Применение современных статистических методов в практике клинических исследований. Сообщение первое. Сравнение двух пропорций / А.В. Чубенко, П.Н. Бабич, С.Н. Лапач и др. // Украiнський Медичний Часопис, 2003, № 4 (36), с. 139-143". Ссылки
http://www.biostat.kiev.ua/pdf/statm1.pdf или
http://www.apteka.ua/archives/405/19649.htmlz-критерий 2,46 p = 0,01371
Разность пропорций (P2 - P1) -0,33 - совпадает с Вашими расчетами.
С доверительными интервалами проблема
Нижний 95% 0,07685
Верхний 95% 0,58982
Нижний 90% 0,11273
Верхний 90% 0,55394
Либо я неправильно посчитал, либо не совсем понятно, откуда такие цифры взялись. Не думаю, что ошибка у меня, т.к. с примером из Чубенко с соавт. все совпадает.
DrgLena
28.03.2008 - 21:04
Очевидно, мы по разной формуле считаем ДИ . Я не помню где я взяла эти формулы, но я их использую.
m =sqrt((v1)*(v2-v1)/v2^3)*100
m =sqrt((v1)-v1^2/v2)/v2*100
V1- разность частот (b-с), V2 ? общее число наблюдений в выбоке.
Это будет одно и тоже. Гордон Гайятт, стр 336 в приложении дает формулы для расчета ДИ для пропорций, вычитания пропорций (снижения абсолютного риска), а также OR, RR, ссылку дает на SAS.
А.В. Чубенко не дает ссылку на автора формулы, и он рассчитывает ошибку к разности двух пропорций (разные группы), я решила, или где то нашла, что формула ошибки к разности двух частот до и после воздействия (т.е. на одних и тех же объектах) может быть рассчитана по приведенным формулам. Это для случая, что в ячейке «с» значение «0»,т.е. хуже не стало ни кому.
Если в ячейке «с» число не равное нулю (v9), то m= 1/v2*(sqrt((v1+v9)-(v1-v9)^2/v2))*100
Источник, почему так, я не могу найти, но это было связано именно с критерием Мак-Немара.
Woolf, Katz, Daniel и наконец, Bland 2000 все по своим формулам считают ДИ.
Ссылка от Тьюки может пригодится:
http://www.sjsu.edu/faculty/gerstman/eks/gersms13.PDFУ меня MedCalc есть, там Ди рассчитывается по Bland 2000 и в случае, если с=0, верхняя граница= точечной оценке, т.е. для моего примера: Ди 12,65%?33,3%
Difference 33,33%
95% CI 12,65 to 33,33
Exact probability (binomial distribution)
Significance P = 0,0020
У Чубенко с соавт. формула очень похожа на правду.
Во все встречавшиеся мне формулы входила перцентиль нормального распределения. В Вашей формуле ее нет.
Опять же, как выглядят формулы разности пропорций для одной и той же выборки до воздействия и после? У Чубенко пример приведен для случая опыт-контроль. Одни и те же ли это формулы? В-общем, нужно разбираться.
DrgLena
31.03.2008 - 12:06
Я повторюсь, относительно книги, которая вышла в 2003 годау в издательстве Медиа Сфера. Путеводитель читателя медицинской литературы. Принциты клинической практики, основанной на доказанном. По редакцией Гордона Гпйятта и Драммонда Рени. Формуля даны в приложении на стр 336 со ссылкой на SAS.
Мне трудно вводить всю стараничку.
Цитата(DrgLena @ 31.03.2008 - 12:06)

Я повторюсь, относительно книги, которая вышла в 2003 годау в издательстве Медиа Сфера. Путеводитель читателя медицинской литературы. Принциты клинической практики, основанной на доказанном. По редакцией Гордона Гпйятта и Драммонда Рени. Формуля даны в приложении на стр 336 со ссылкой на SAS.
Мне трудно вводить всю стараничку.
Не понравился указанный источник. Моя библиография по данной теме небольшая - чуть более пары десятков статей. Посмотрел немного.
Очень хороший обзор классических и современных методов вычисления доверительных интервалов разности пропорций дан в статье "Brown L., Li X. Confidence intervals for two sample binomial distribution // Journal of Statistical Planning and Inference, 1 March 2005, vol. 130, issues 1-2, pp. 359-375". Если поискать, бесплатный препринт статьи можно обнаружить в Интернете. В статье рассказано, откуда что взялось и описано также еще несколько методов, а также даны практические рекомендации по применению того или иного метода. Так что проблема закрыта.
Формула из Чубенко, по которой я считаю, оказывается, совершенно верна и называется формулой Вальда с поправкой Йэйтса (см. работу "Hauck W.W., Anderson S. A comparison of large-sample confidence interval methods for the difference of two binomial probabilities // The American Statistician, November 1986, vol. 40, no. 4, pp. 318-322").
DrgLena
31.03.2008 - 17:12
Безусловно, формула Чубенко верна, но для разности двух пропорций, т.е. пропорций взятых из разных групп и только для больших выборок при анализе таблиц сопряженности. При оценке по критерию МакНемара таблица не является таблицей сопряженности. Если вам не понравился Гордон Гайят посмотрите:
Biostatistics
A Methodology for the Health Sciences
Second Edition
GERALD VAN BELLE
LLOYD D. FISHER
PATRICK J. HEAGERTY
THOMAS LUMLEY
Washington 2004 (стр.179-180)
Врят ли есть в инете бесплатно, всего 888 страниц.
Абсолютной истины нет, но мы хотим к ней приблизиться, и все мы здесь не волшебники, а только учимся.
Цитата(DrgLena @ 31.03.2008 - 17:12)

Biostatistics
A Methodology for the Health Sciences
Second Edition
... (стр.179-180)
Ну вот, та же формула для доверительных интервалов (замечу, со 100(1 - Alpha)% точкой нормального распределения). Только без поправки Йэйтса.
А так как тут считается не разность пропорций (difference of two binomial probabilities) и ее доверительный интервал, а отношение шансов (odds ratio) и его доверительный интервал, то стандартная ошибка, естественно, считается по другой формуле.
DrgLena
1.04.2008 - 18:47
Давайте уточним, для полной ясности, еще один случай применения критерия М-Н. Что мы оцениваем? Я привела частный случай, когда в ячеке "с" число наблюдений равно"0". На самом деле там может быть и другое число. Критерий оценивает число несовпадений, т.е. числа на диагонале сd. В следующем примере меня интересует общее число несовпадений
На одной и той же группе пациентов (n=75) испытывали два диагностических теста. В ячейке a=27, b=7, c=13, d=28. Т.е. 27 - оба теста положительны, 28- оба отрицательны. 7 и 13 - несовпадения (всего 20).
Меня интересует процент несовпадений, т.е. 20 из 75 и это просто 26,7% (ДИ 16,7%- 36,7%) .т.о. это не ДИ к разности пропорций.
McNemar Change Test
Pearson Chi2: 1.8 (p= 0.179)
Yates Chi2: 1.25 (p= 0.263)
Binomial P of 13 or more out 20 eq: 0.13158 (рекомендовано, если число несовпадающих пар <=25)
Верно ли я вычисляю в данном случае ДИ (формулы я приводила)?
Цитата(DrgLena @ 1.04.2008 - 18:47)

Давайте уточним, для полной ясности, еще один случай применения критерия М-Н. Что мы оцениваем? Я привела частный случай, когда в ячеке "с" число наблюдений равно"0". На самом деле там может быть и другое число. Критерий оценивает число несовпадений, т.е. числа на диагонале сd. В следующем примере меня интересует общее число несовпадений
На одной и той же группе пациентов (n=75) испытывали два диагностических теста. В ячейке a=27, b=7, c=13, d=28. Т.е. 27 - оба теста положительны, 28- оба отрицательны. 7 и 13 - несовпадения (всего 20).
Меня интересует процент несовпадений, т.е. 20 из 75 и это просто 26,7% (ДИ 16,7%- 36,7%) .т.о. это не ДИ к разности пропорций.
McNemar Change Test
Pearson Chi2: 1.8 (p= 0.179)
Yates Chi2: 1.25 (p= 0.263)
Binomial P of 13 or more out 20 eq: 0.13158 (рекомендовано, если число несовпадающих пар <=25)
Верно ли я вычисляю в данном случае ДИ (формулы я приводила)?
Это очень хорошо, когда есть опубликованные данные. Указанные исходные данные соответствуют примеру из руководства по StatXact (с. 149). Во-вторых, мы посчитаем варианты критерия самостоятельно.
Итак, StatXact 8
Оригинальный критерий Мак-Немара (асимптотика хи-квадрат) 1,3416 p = 0,1797
Точный условный критерий Мак-Немара (exact conditional) 1,3416 p = 0,2632
Наш расчет (в программке собственного изготовления)
Оригинальный критерий Мак-Немара (асимптотика хи-квадрат) 1,8 p = 0,1797
Критерий Мак-Немара (асимптотика хи-квадрат, с поправкой Йэйтса) 1,25 p = 0,2636
Точный условный критерий Мак-Немара 1,8 p = 0,2632
Выводы:
1. Результаты различаются и между собой, и отличаются от Ваших. Но главное, что в наших расчетах, и в StatXact, и в первых двух Ваших методах одинаковы p-значения для одинаковых методов.
2. При выводе статистики критерия StatXact безбожно врет во всех случаях, что для столь известной программы нехарактерно.
3. Первые два метода Ваша программа считает верно.
4. В Ваших результатах в качестве точного p-значения (в терминологии Вашей программы - Binomial P), в отличие от остальных Ваших методов, показано одностороннее p-значение, но не сделана оговорка об этом, что вводит в заблуждение. Т.о. при вычислении точного p-значения Ваша программа дает неверный ответ.
Доверительный интервал посмотрю позднее.
Добавлю, что руководство по StatXact (1340 страниц, с правильными формулами и содержательными примерами) входит в комплект бесплатно распространяемой полнофункциональной пробной версии (см. PDF файл в каталоге программы). Вычислению различных доверительных интервалов (включая, естественно, формулы) в руководстве уделено большое внимание, что выгодно отличает данное руководство от выхолощенной документации практически всех "больших" программ.
DrgLena
2.04.2008 - 14:22
Спасибо! Последний мой пример из другого источника. StatXact 7 я не знаю, если можно, дайте ссылку скачать документацию. Относительно выбора "р". Если мы лечим, то предполагаем, что после лечения число кашлящих снизится и одностороннего критерия вполне хватает. Во втором примере, интересует вопрос, различаются ли тесты. Двухсторониий р- свидетельствует, что не различаются.
У Гланца при описании критерия М-Н пример аналогичный последнему,т.е. анализируется два диагностических теста. Расчет самого значения критерия Chi2, вообще не по той формуле. У меня, в однорй из программ, пример из Гланца (81,48,23,21 соответсвенно a,b,c,d) решается так:
McNemar Change Test
Pearson Chi2: 8.803 (p= 0.003)
Yates Chi2: 8.113 (p= 0.004)
Binomial P of 23 or more out 71 eq: 0.99908 (поясните, что это означает?)
У Гланца Chi2 =8,817 и ничего про односторонний или двухсторонний "р"
В "Statistica" Chi2 =8,11; p= ,0044
В МedCalc
Difference = 14,45% (процент разницы в-с)
95% CI = 4,48% to 23,17%
Chi-square test
Chi-square = 8,1127 (DF=1)
Significance P = 0,0044
Цитата(DrgLena @ 2.04.2008 - 14:22)

У Гланца при описании критерия М-Н пример аналогичный последнему,т.е. анализируется два диагностических теста. Расчет самого значения критерия Chi2, вообще не по той формуле. У меня, в однорй из программ, пример из Гланца (81,48,23,21 соответсвенно a,b,c,d) решается так:
McNemar Change Test
Pearson Chi2: 8.803 (p= 0.003)
Yates Chi2: 8.113 (p= 0.004)
Binomial P of 23 or more out 71 eq: 0.99908 (поясните, что это означает?)
У Гланца Chi2 =8,817 и ничего про односторонний или двухсторонний "р"
В "Statistica" Chi2 =8,11; p= ,0044
В МedCalc
Difference = 14,45% (процент разницы в-с)
95% CI = 4,48% to 23,17%
Chi-square test
Chi-square = 8,1127 (DF=1)
Significance P = 0,0044
Результаты расчета критерия Мак-Немара нашей программой:
Хи-квадрат 8,8028, p = 0,0030
Хи-квадрат с поправкой Йейтса 8,1127, p = 0,0044
Точное 8,8028 p = 0,0041
Разность пропорций у нас получилась 0,1497
95% доверительный интервал 0,0435 - 0,2559
Разность пропорций (с поправкой Йейтса) 0,1445, что совпадает с Вашей программой
95% доверительный интервал 0,0411 - 0,2479
Отношение шансов 0,5349
95% доверительный интервал 0,3785 - 0,6912
0,99908 в Вашем случае означает, что программа считает неверно функцию биномиального распределения.
Statistica считает правильно, что неудивительно для программы за 67470 руб.
Программа StatXact выпускается компанией Cytel. Ссылка
http://www.cytel.com. Компания Cytel довольно известна в узких кругах. Достаточно сказать, что часть функций компания SPSS лицензировала у Cytel, а владельцы и авторы StatXact являются соавторами SPSS.
Для загрузки ознакомительной версии потребуют зарегистрироваться. Код для установки вышлют по электронной почте. Руководство по программе найдете в каталоге программы.
DrgLena
3.04.2008 - 10:25
Игорь, спасибо за ссылку!
Я могу понять, что Ди могут различаться, расчет по разным формулам. Но чтобы разность пропорций имела не однозначное значение, я не понимаю. Абсолютные числа выражfются в процентах и, как ни крути, получится 14,45, легко посчитать без всяких программ. 48-23=25, и это от 173 - 14,45%. Или 27,746-13,295=14,45%. Как поправка Йейтса влияет на этот процент? Все программы дают этот процент. И OR тоже не сходится. Как вы составляете таблицу для OR?
Цитата(DrgLena @ 3.04.2008 - 10:25)

Игорь, спасибо за ссылку!
Я могу понять, что Ди могут различаться, расчет по разным формулам. Но чтобы разность пропорций имела не однозначное значение, я не понимаю. Абсолютные числа выражfются в процентах и, как ни крути, получится 14,45, легко посчитать без всяких программ. 48-23=25, и это от 173 - 14,45%. Или 27,746-13,295=14,45%. Как поправка Йейтса влияет на этот процент? Все программы дают этот процент. И OR тоже не сходится. Как вы составляете таблицу для OR?
Моя неточность. Поправка Йейтса, конечно же, будет влиять только на границы интервала (отнимается от нижней и прибавляется к верхней). Видимо, исходные данные не те взял. Исправление к предыдущему посту:
Разность пропорций (без поправки)
0,144508671
Доверительный интервал
Нижний 95% 0,046860423
Верхний 95% 0,242156918
Разность пропорций (с поправкой)
0,144508671
Доверительный интервал
Нижний 95% 0,041080077
Верхний 95% 0,247937264
Отношение шансов брал по van Belle. Но подробный анализ показывает, что там или не то, что нужно, или полная чушь.
А вот если взять по статье Bland и Altman (очень известные, кстати, авторы) - доступна по ссылке
http://www.bmj.com/cgi/reprint/320/7247/1468 - то для рассматриваемых в нашем примере данных получится:
Отношение шансов 0,514099539
Доверительный интервал
Нижний 95% 0,325216792
Верхний 95% 0,812683547
Таблицу 2 х 2, действительно, можно строить по-разному.
1. Можно взять двумерную бинарную выборку и в ячейку a поместить количество вариант, имеющих обе единицы, в ячейку b - имеющих 1 и 0 и т.д.
2. А можно взять две бинарных выборки, не обязательно равной численности, и в ячейку a поместить число единиц 1-й выборки, в ячейку b - число единиц 2-й выборки, в ячейку c - чило нулей 1-й выборки и т.д.
Какой способ построения берется для какого случая, хотелось бы прояснить. Вроде бы случай 1 - логичный для эксперимента "до и после", случай 2 - для эксперимента типа "опыт и контроль". С другой стороны, очень подробная и доступная статья Бабич с соавт. по ссылке
http://www.umj.com.ua/pdf/46/1750.pdf полностью сопровождается примерами для случая 2. Не совсем все это для меня понятно. И те же ли формулы применяются для оценки шансов, отношения шансов, стандартного отклонения и доверительных интервалов? Хотелось бы узнать мнение опытных статистиков-практиков.
В упомянутой статье указаны и меры против нулевых численностей в ячейках.
Еще хотелось бы обратить внимание на одну тонкость вычислений. При анализе эксперимента типа "опыт и контроль" возможна ситуация, когда численности выборок различны. На оценку шансов и отношения шансов это формально влияния не оказывает. А вот на оценку стандартного отклонения отношения шансов (следовательно, и доверительного интервала) - даже очень. Необходимо при расчете, видимо, переходить на вероятности, а уже из них как-то получать численности и подставлять в формулу.
DrgLena
3.04.2008 - 22:50
Я использую OR, только для исследований типа случай-контроль, для анализа факторов риска. В этом случае рекомендуется (Бланд и Альтман рекомендует для RR чтобы не перепутать, там это важнее), чтобы в первой ячейке было число больных с имеющимся фактором риска и развившимся состоянием (случай), b- фактор есть , но состояние не развилось и дальше , как в моем примере.
Тогда логика вполне понятна - шанс развития дистофии при наличии фактора риска составляет 7:7, в отсутствия фактора 6:31. Отношение шансов соответственно будет показывать во сколько раз повышается шанс развития дистрофии сетчатки при наличии фактора риска, по сравнению с пациентами без этого фактора риска.
Фактор риска дистрофия сетчатки
развилась Не развилась
да 7 7
нет 6 31
Odds Ratio p1<->p2: 5.1667
Approx. Std.Err. Odds Ratio: 3.5968
Wald 95% CI: 1.3202<O.R.<20.2206
inverse OR p2<->p1: 0.19 (~SE=0.13)
Odds ratio = 5,1667
95 % CI = 1,3202 to 20,2206
z statistic = 2,359
P = 0,0183
Обе программы дают динаковый результат, формула для ДИ у того же Бланда, у Ребровой тоже есть.
Есть сведения, что 8 версия Statistica дает доверительные интервалы. У меня 7, но там еще нет даже OR, т.е. можно получить через логистическую регрессию для одного предиктора.
Для этих данных у меня те же самые результаты получились. За исключением z-критерия.
z-критерий 2,110561086, p = 0,034810069
DrgLena
4.04.2008 - 11:25
Игорь, мы явно увлеклись и отвлеклись от вопроса Liliya, но дискуссия была очень полезной, но только для нас с вами. Я посылала Вам личное письмо, но видимо что-то не сработало, в отправленных письма нет.
micshu
22.10.2009 - 12:32
Господа, я человек плохо разбирающийся в статистике, но меня интересует откуда у г-на Гайата в формулах для Se, Sp, Ac, PV+ и т.п. взялся
куб "n", а для САР кубы и "n" и "m"?
Получается, что статистика это искусство? эклектика? Куда дышло повернул, туда оно и вышло?
Правильно, видимо, писал позитивист К. Поппер, "что всякая вероятностная поддержка дедуктивна".
Кажется мне, что статистические методы исследований в медицине - то как они применяются сейчас в парадигме EBM не приведут к ее прогрессу,
а уведут в дебри и там похоронят под кучей метаанализов и систематических обзоров с противоречащими выводами и "форточной" применимостью.
Понятно стремление медиков создать хоть какую-то опору под ногами, потому что все опоры рассыпаются под строгим взглядом EBM
и они цепляются за статистику.
Цитата(micshu @ 22.10.2009 - 15:32)

Господа, я человек плохо разбирающийся в статистике, но меня интересует откуда у г-на Гайата в формулах для Se, Sp, Ac, PV+ и т.п. взялся
куб "n", а для САР кубы и "n" и "m"?
Получается, что статистика это искусство? эклектика? Куда дышло повернул, туда оно и вышло?
Правильно, видимо, писал позитивист К. Поппер, "что всякая вероятностная поддержка дедуктивна".
Кажется мне, что статистические методы исследований в медицине - то как они применяются сейчас в парадигме EBM не приведут к ее прогрессу,
а уведут в дебри и там похоронят под кучей метаанализов и систематических обзоров с противоречащими выводами и "форточной" применимостью.
Понятно стремление медиков создать хоть какую-то опору под ногами, потому что все опоры рассыпаются под строгим взглядом EBM
и они цепляются за статистику.
А мне кажется, что если человек сам признаётся в плохом знании статистики, то у него 2 пути: (1) учить статистику или (2) расписаться в своём бессилии и самоутверждаться на другом поприще, иначе это обычный флуд. По личному жизненному опыту могу посоветовать педагогику - болтуны там ценятся и успешно защищаются безо всякой статистики.
Цитата(micshu @ 22.10.2009 - 12:32)

Господа, я человек плохо разбирающийся в статистике, но меня интересует откуда у г-на Гайата в формулах для Se, Sp, Ac, PV+ и т.п. взялся
куб "n", а для САР кубы и "n" и "m"?
Научное общение предполагает уважение к собеседникам. А уважение предполагает точность формулировок и ссылок. 1. Автор, название источника, страница. 2. Предполагаемая ошибка.
Цитата(micshu @ 22.10.2009 - 12:32)

Получается, что статистика это искусство? эклектика? Куда дышло повернул, туда оно и вышло?
Ну конечно, искусство. Искусство точно формулировать задачу. А точная формулировка (постановка) задачи = 3/4 решения.
Цитата(micshu @ 22.10.2009 - 12:32)

Правильно, видимо, писал позитивист К. Поппер, "что всякая вероятностная поддержка дедуктивна".
Хотя перечитывать времени нет, я не думаю, что Поппер отрицал пользу теории вероятностей. Ибо вероятностные свойства явлений, объектов - это реально существующие свойства, подобно цвету, размеру и другим физическим параметрам. Математическая статистика, как приложение теории вероятностей, как раз занимается измерением (!) и изучением этих свойств. Подобно тому, как линейкой мы измеряем длину, а термометром - температуру.
Цитата(micshu @ 22.10.2009 - 12:32)

Кажется мне, что статистические методы исследований в медицине - то как они применяются сейчас в парадигме EBM не приведут к ее прогрессу,
а уведут в дебри и там похоронят под кучей метаанализов и систематических обзоров с противоречащими выводами и "форточной" применимостью.
Понятно стремление медиков создать хоть какую-то опору под ногами, потому что все опоры рассыпаются под строгим взглядом EBM
и они цепляются за статистику.
Согласен. Неграмотное применение инструментария статистики причинит больше вреда, нежели его неприменение вовсе. Есть, правда одна особенность - дискредитировать статистику (аналогично, скажем, телемедицине, борьбе за авторские права и т.п.) очень сложно благодаря мощной многовековой научной и практической базе. Себя опозорить - да, можно.