Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Множественные сравнения в одной группе
thedarkspirit
сообщение 6.10.2008 - 14:58
Сообщение #1





Группа: Пользователи
Сообщений: 7
Регистрация: 6.10.2008
Пользователь №: 5377



Всем добрый день! Столкнулся вот с такой задачей.
Есть группа больных с определенным типом рака. Для каждого больного определялся статус РЭ/РП.
Нужно выявить статус, которой встречался чаще всего.
Правоверно ли использовать парные сравнения по критерию Хи-квадрат с поправкой Бонферрони, учитывая что присутствуют частоты с нулевым значением ?
Пример данных
РЭ-/РП+ РЭ+/РП- РЭ-/РП- РЭ+/РП+
0 4 12 21
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
DrgLena
сообщение 6.10.2008 - 23:03
Сообщение #2





Группа: Пользователи
Сообщений: 1325
Регистрация: 27.11.2007
Пользователь №: 4573



А какие парные сравнения вы здесь видите? Вам нужно показать, что в исследуемой группе наблюдается определенное распределение состояний 0,4,12,21. Первое состояние вообще отсутствует, второе встречается реже, чем четвертое и это доказано.
В процентном отношении последнее состояние преобладает, но относительно третьего, статистически не доказано. Т.е. сравните 95% доверительные интервалы для описания процентов.
B % CI_1 CI_2
4 10,8 0,81 20,82
12 32,4 17,35 47,52
21 56,8 40,79 72,72
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
nokh
сообщение 7.10.2008 - 07:28
Сообщение #3





Группа: Пользователи
Сообщений: 1202
Регистрация: 13.01.2008
Из: Челябинск
Пользователь №: 4704



Действительно, хи-квадратом здесь никаких сравнений не сделать. Это можно было бы сделать если вы сравнивали долю людей с определенным статусом в нескольких выборках. Для этих данных, если это имеет смысл, хи-квадратом можно показать неслучайную ассоциацию РЭ с РП (минус с минусом и плюс с плюсом встречаются значительно чаще чем минус с плюсом).
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
thedarkspirit
сообщение 9.10.2008 - 10:50
Сообщение #4





Группа: Пользователи
Сообщений: 7
Регистрация: 6.10.2008
Пользователь №: 5377



Спасибо за ответы!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 9.10.2008 - 10:58
Сообщение #5





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(DrgLena @ 6.10.2008 - 23:03) *
... сравните 95% доверительные интервалы для описания процентов.

Автор темы тактично поблагодарил. Но не уверен, что ему все понятно. Главное. Каким статистическим методом рекомендуете сравнить доверительные интервалы? Сссылка, формулы, распределение статистики, P-значения.

Сообщение отредактировал Игорь - 9.10.2008 - 11:00


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
thedarkspirit
сообщение 9.10.2008 - 11:20
Сообщение #6





Группа: Пользователи
Сообщений: 7
Регистрация: 6.10.2008
Пользователь №: 5377



Техология построения доверительных интервалов мне известна, потому и не стал уточнять.
Суть вопроса заключалась в том, что меня поставила в ступор задача проверки гипотезы о различиях частот в одной группе.
Безусловно, доверительные интервалы в таком случае являются оптимальным выходом, за это и сказал спасибо ответившим.
Но, у меня было предположение, что гипотезу об отсутствии различий в распределении долей в одной группе можно проверить методом Хи-Квадрат для сравнения исходного распределения с теоретическим, выбрав в виде теоретического - равномерное. Если гипотеза верна, значит различий нет, если не верна, значит они есть. Собственно и хотелось бы уточнить правомерность такого предположения, раз.
Ну и два, из литератур осталось не понятным, действует ли на этот вариант критерия ограничение на ожидаемые значения.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 9.10.2008 - 16:28
Сообщение #7





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(thedarkspirit @ 9.10.2008 - 11:20) *
Суть вопроса заключалась в том, что меня поставила в ступор задача проверки гипотезы о различиях частот в одной группе.
Безусловно, доверительные интервалы в таком случае являются оптимальным выходом, за это и сказал спасибо ответившим.

Не является сравнение доверительных интервалов не только оптимальным, но и вообще методом проверки гипотезы. Думаю, не нужно повторять чужих ошибок. Но безусловная критика - не наш метод. Думаю, Вам имеет смысл ознакомиться с работой "Применение современных статистических методов в практике клинических исследований. Сообщение первое. Сравнение двух пропорций / А.В. Чубенко, П.Н. Бабич, С.Н. Лапач и др. // Украiнський Медичний Часопис, 2003, № 4 (36), с. 139-143". Статья доступна бесплатно по ссылке http://www.biostat.kiev.ua/pdf/statm1.pdf илиhttp://www.apteka.ua/archives/405/19649.html.

В статье описан метод (Z-критерий для долей), который, по-моему, Вам имеет смысл применить.

Отмечу только, что в названии и в тексте работы авторы совершенно неточно используют кальку с английского (proportion) как пропорцию. Хотя подобное вольное обращение с русским языком - наследником санскрита - простительно иностранным авторам. А по-русски это называется - доля.

Сообщение отредактировал Игорь - 9.10.2008 - 16:29


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 10.10.2008 - 19:24
Сообщение #8





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Игорь @ 9.10.2008 - 17:28) *
Не является сравнение доверительных интервалов не только оптимальным, но и вообще методом проверки гипотезы. Думаю, не нужно повторять чужих ошибок. Но безусловная критика - не наш метод. Думаю, Вам имеет смысл ознакомиться с работой "Применение современных статистических методов в практике клинических исследований. Сообщение первое. Сравнение двух пропорций / А.В. Чубенко, П.Н. Бабич, С.Н. Лапач и др. // Украiнський Медичний Часопис, 2003, № 4 (36), с. 139-143". Статья доступна бесплатно по ссылке http://www.biostat.kiev.ua/pdf/statm1.pdf илиhttp://www.apteka.ua/archives/405/19649.html.

В статье описан метод (Z-критерий для долей), который, по-моему, Вам имеет смысл применить.

Отмечу только, что в названии и в тексте работы авторы совершенно неточно используют кальку с английского (proportion) как пропорцию. Хотя подобное вольное обращение с русским языком - наследником санскрита - простительно иностранным авторам. А по-русски это называется - доля.

1) В другом посте я уже описал, почему идея о том, что доверительные интервалы нельзя использовать для тестирования гипотез не верна. Доверительный интервал - это интервал в котором находятся 95% выборочных средних (выборочных долей), если два интервала не перекрываются. значит одни и те же значения невозможны, популяции различаются.
2) z- метод тут все равно бы не подошел из-за малого количества наблюдений - нормальная аппроксимация биномиального распределения не работает
3) не понял, почему тут нельзя использовать хи2 (или Фишера)
РП
РЭ____+____ -
+_____21____4
-______0____12
и тестировать гипотезу независимости РП и РЭ
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
thedarkspirit
сообщение 11.10.2008 - 10:32
Сообщение #9





Группа: Пользователи
Сообщений: 7
Регистрация: 6.10.2008
Пользователь №: 5377



Спасибо за статью, я ее изучил. Действительно, как отметил Плав, применение данного метода тут не совсем уместно, из-за малого объема наблюдений. К слову сказать, в данной статье ни слова не сказано об ограничениях на использования этого метода. Кроме того, в этой же статье приведен пример использования доверительного интервала для проверки гипотез. Такие же примеры есть и в известной литературе. Потому, не могли бы Вы привести источник, в котором описано почему доверительные интервалы не являются методом проверки гипотез ?

И все же хотелось бы получить ответ на свой вопрос. Может быть я не очень понятно изъясняю. Приведу свой же пример.
Хотелось бы узнать насколько правомерен такой ход, просто в практическом смысле на будущее.

Наблюдаемые Ожидаемые
частоты частоты
0 9,25
4 9,25
12 9,25
21 9,25

Т.е. мы ожидаем равномерное распределение величины (расчитывается как сумма наблюдаемых/кол-во).
И далее для такой таблицы применяется хи-квадрат для проверки нулевой гипотезы.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 11.10.2008 - 17:22
Сообщение #10





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(плав @ 10.10.2008 - 20:24) *
3) не понял, почему тут нельзя использовать хи2 (или Фишера)
РП
РЭ____+____ -
+_____21____4
-______0____12
и тестировать гипотезу независимости РП и РЭ

Потому что нулевая частота, хи-квадрат, наверное, работать не будет. А ТМФ можно, как любой подходящий точный метод.
Цитата(thedarkspirit @ 11.10.2008 - 11:32) *
... не могли бы Вы привести источник, в котором описано почему доверительные интервалы не являются методом проверки гипотез ?

Сначала, если можно, приведите источник, где доверительные интервалы являются методом проверки гипотез.
Ну и логика у Вас, уважаемый thedarkspirit.
А где написано, что "Запорожец" не мотоцикл? Нигде! Нет такой книги! Уверен на 100%! Следовательно, "Запорожец" - мотоцикл!

Сообщение отредактировал Игорь - 11.10.2008 - 21:07


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
thedarkspirit
сообщение 12.10.2008 - 12:02
Сообщение #11





Группа: Пользователи
Сообщений: 7
Регистрация: 6.10.2008
Пользователь №: 5377



Цитата(Игорь @ 11.10.2008 - 18:22) *
Сначала, если можно, приведите источник, где доверительные интервалы являются методом проверки гипотез.
Ну и логика у Вас, уважаемый thedarkspirit.
А где написано, что "Запорожец" не мотоцикл? Нигде! Нет такой книги! Уверен на 100%! Следовательно, "Запорожец" - мотоцикл!


Таких источников очень и очень много. Для примера О.Ю. Реброва "Статистический анализ медицинских данных" стр. 163
"... необходиимо вычислить границы ДИ для каждой из сравниваемых относительных частот и сравнить эти ДИ. Если они не пересекаются, то различия частот можно считать статистически значимыми (с уровнем значимости 0,05 если анализировались 95% ДИ)...."
И такие утверждения встречаются достаточно часто, такой подход я встречал во многих научных работых, потому я и попросил Вас привести источник, где описано почему же такой подход ошибочен. И если я ошибаюсь, хотелось бы получить более существенные доводы нежели посылы к "запорожцам".

Сообщение отредактировал thedarkspirit - 12.10.2008 - 12:09
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 12.10.2008 - 19:08
Сообщение #12





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(Игорь @ 11.10.2008 - 18:22) *
Сначала, если можно, приведите источник, где доверительные интервалы являются методом проверки гипотез.
Ну и логика у Вас, уважаемый thedarkspirit.
А где написано, что "Запорожец" не мотоцикл? Нигде! Нет такой книги! Уверен на 100%! Следовательно, "Запорожец" - мотоцикл!

Мой любимый Armitage & Berry, p.90
"The value of the parameter inside the 95% confidence interval are precisely those which would not be contradicted by a two-sided significance test at the 5% level. Values outside the interval, on the other hand, would all be contradicted by such test"
"... a confidence interval may be regarded as equivalent to performing significance test for all values of a parameter, not just single value corresponding to the null hypothesis"


Надо заметить, что эти интервалы были разработаны в трудах Р.Фишера (под названием fiducial limits) и Неймана.

Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 12.10.2008 - 19:29
Сообщение #13





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Цитата(thedarkspirit @ 11.10.2008 - 11:32) *
И все же хотелось бы получить ответ на свой вопрос. Может быть я не очень понятно изъясняю. Приведу свой же пример.
Хотелось бы узнать насколько правомерен такой ход, просто в практическом смысле на будущее.

Наблюдаемые Ожидаемые
частоты частоты
0 9,25
4 9,25
12 9,25
21 9,25

Т.е. мы ожидаем равномерное распределение величины (расчитывается как сумма наблюдаемых/кол-во).
И далее для такой таблицы применяется хи-квадрат для проверки нулевой гипотезы.

В принципе, так делать можно (только используйте поправку Йетса на непрерывность из-за малого количества наблюдений). Но я все равно не понимаю, почему Вы считаете, что распределение должно быть равновероятным. Ведь РЭ+ 21 человек (из 37), а РП+ - 25. ПОэтому можно делать гипотезы
а) Количество РЭ+/- одинаково
б) Количество РП+/- одинаково
в) Количество с РЭ и РП больше, чем ожидается по относительной встречаемости РЭ и РП
Эти гипотезы тестируются по-разному, но ни одна так, как Вы указали.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 12.10.2008 - 21:25
Сообщение #14





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(thedarkspirit @ 12.10.2008 - 12:02) *
Таких источников очень и очень много. Для примера О.Ю. Реброва "Статистический анализ медицинских данных" стр. 163
"... необходиимо вычислить границы ДИ для каждой из сравниваемых относительных частот и сравнить эти ДИ. Если они не пересекаются, то различия частот можно считать статистически значимыми (с уровнем значимости 0,05 если анализировались 95% ДИ)...."
И такие утверждения встречаются достаточно часто, такой подход я встречал во многих научных работых, потому я и попросил Вас привести источник, где описано почему же такой подход ошибочен. И если я ошибаюсь, хотелось бы получить более существенные доводы нежели посылы к "запорожцам".

Это, видимо, очень ценный источник. Видимо, поэтому Вы его во множественном числе именуете.

Я уже приводил пример на ту же тему в другой ветке форума, однако пояснить его никто не захотел. Повторю частично:
Выборка 1
0,18
0,27
0,19
0,36
0,43
Выборка 2
0,41
0,38
0,73
0,49
0,58
Критерий Стьюдента для независимых выборок
2,91
P-значение (двустороннее)
0,0196
Параметры выборок с доверительными интервалами
Выборка 1
Среднее 0,29
Нижний 95% 0,15
Верхний 95% 0,42
Выборка 2
Среднее 0,52
Нижний 95% 0,34
Верхний 95% 0,69

ДИ, как видим, весьма пересеклись, но P-значение = 0,0196. Или, согласно К. Пруткову, "если на клетке слона увидишь надпись "буйвол", не верь глазам своим"?

Если Вас устраивают подобные источники [и подобные программы], пользуйтесь на здоровье и на благо науки. Я же в таком случае все свои возражения снимаю. Успехов!

P.S. Лучше вот тут гляньте, как доверительные интервалы сравнивать http://www2.sas.com/proceedings/sugi22/STATS/PAPER270.PDF.

Сообщение отредактировал Игорь - 14.10.2008 - 11:20


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 12.10.2008 - 22:06
Сообщение #15





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Ну вообще-то расчеты тут не верные (ДИ). Если анализируются две группы, то правильнее анализировать ДИ не для двух выборок по отдельности, а для разностей.
В приведенном выше примере мы имеем для разности средних
0,232, 95%ДИ=0,048-0,416. Поскольку нулевое значение находится вне пределов интервала, нулевую гипотезу о равенстве популяционных средних надо отклонить. Иными словами тут будет полный аналог t-теста
Если сравнивать два доверительных интервала, рассчитанных по отдельным выборкам, то мощность теста упадет, как если Вы возьмете и в t-тесте замените оценку стандартного отклонения из двух групп на одну группу.
Однако вопрос важности падения мощности не столь однозначен.
То, что разные тесты дают разные значения р отнюдь не удивительно. Для данного примера (я звездочками пометил менее 0,05):
  • Вилкоксон, нормальная аппроксимация р=0,0367 *
  • Вилкоксон, аппроксимация по t-критерию р=0,0663
  • Критерий Краскела-Уоллеса р=0,0283 *
  • Двухвыборочный медианный критерий р=0,0719
  • Критерий Ван-дер-Ваардена р=0,0302 *
  • Критерий Сэвиджа р=0,0474 *
  • Двухвыборочный критерий Колмогорова-Смирнова р=0,0815
  • Критерий Купера р=0,4404
Из 8 критериев в 4 менее 0,05, в 4 - более.
На самом деле в этом примере даже не скажешь, каким тестом пользоваться, пока не будешь знать об исходной популяции, ошибках измерения и задаче тестирования. Может - t-критерием, а может - КС. Учитывая малый размер выборки, чистый t-критерий представляется наименее адекватным тестом из мощных, если только нет данных в пользу нормальности распределения значения в исходной популяции. Для Вилкоксона, опять же по тем же причинам лучше использовать Вилкоксона с t-аппроксимацией, а она не дает достоверных отличий.
Вывод отнюдь не так однозначен, как кажется с первого взгляда.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему