Множественные сравнения в одной группе |
Здравствуйте, гость ( Вход | Регистрация )
Множественные сравнения в одной группе |
6.10.2008 - 14:58
Сообщение
#1
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 6.10.2008 Пользователь №: 5377 |
Всем добрый день! Столкнулся вот с такой задачей.
Есть группа больных с определенным типом рака. Для каждого больного определялся статус РЭ/РП. Нужно выявить статус, которой встречался чаще всего. Правоверно ли использовать парные сравнения по критерию Хи-квадрат с поправкой Бонферрони, учитывая что присутствуют частоты с нулевым значением ? Пример данных РЭ-/РП+ РЭ+/РП- РЭ-/РП- РЭ+/РП+ 0 4 12 21 |
|
6.10.2008 - 23:03
Сообщение
#2
|
|
Группа: Пользователи Сообщений: 1325 Регистрация: 27.11.2007 Пользователь №: 4573 |
А какие парные сравнения вы здесь видите? Вам нужно показать, что в исследуемой группе наблюдается определенное распределение состояний 0,4,12,21. Первое состояние вообще отсутствует, второе встречается реже, чем четвертое и это доказано.
В процентном отношении последнее состояние преобладает, но относительно третьего, статистически не доказано. Т.е. сравните 95% доверительные интервалы для описания процентов. B % CI_1 CI_2 4 10,8 0,81 20,82 12 32,4 17,35 47,52 21 56,8 40,79 72,72 |
|
7.10.2008 - 07:28
Сообщение
#3
|
|
Группа: Пользователи Сообщений: 1202 Регистрация: 13.01.2008 Из: Челябинск Пользователь №: 4704 |
Действительно, хи-квадратом здесь никаких сравнений не сделать. Это можно было бы сделать если вы сравнивали долю людей с определенным статусом в нескольких выборках. Для этих данных, если это имеет смысл, хи-квадратом можно показать неслучайную ассоциацию РЭ с РП (минус с минусом и плюс с плюсом встречаются значительно чаще чем минус с плюсом).
|
|
9.10.2008 - 10:50
Сообщение
#4
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 6.10.2008 Пользователь №: 5377 |
Спасибо за ответы!
|
|
9.10.2008 - 10:58
Сообщение
#5
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
... сравните 95% доверительные интервалы для описания процентов. Автор темы тактично поблагодарил. Но не уверен, что ему все понятно. Главное. Каким статистическим методом рекомендуете сравнить доверительные интервалы? Сссылка, формулы, распределение статистики, P-значения. Сообщение отредактировал Игорь - 9.10.2008 - 11:00 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
9.10.2008 - 11:20
Сообщение
#6
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 6.10.2008 Пользователь №: 5377 |
Техология построения доверительных интервалов мне известна, потому и не стал уточнять.
Суть вопроса заключалась в том, что меня поставила в ступор задача проверки гипотезы о различиях частот в одной группе. Безусловно, доверительные интервалы в таком случае являются оптимальным выходом, за это и сказал спасибо ответившим. Но, у меня было предположение, что гипотезу об отсутствии различий в распределении долей в одной группе можно проверить методом Хи-Квадрат для сравнения исходного распределения с теоретическим, выбрав в виде теоретического - равномерное. Если гипотеза верна, значит различий нет, если не верна, значит они есть. Собственно и хотелось бы уточнить правомерность такого предположения, раз. Ну и два, из литератур осталось не понятным, действует ли на этот вариант критерия ограничение на ожидаемые значения. |
|
9.10.2008 - 16:28
Сообщение
#7
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Суть вопроса заключалась в том, что меня поставила в ступор задача проверки гипотезы о различиях частот в одной группе. Безусловно, доверительные интервалы в таком случае являются оптимальным выходом, за это и сказал спасибо ответившим. Не является сравнение доверительных интервалов не только оптимальным, но и вообще методом проверки гипотезы. Думаю, не нужно повторять чужих ошибок. Но безусловная критика - не наш метод. Думаю, Вам имеет смысл ознакомиться с работой "Применение современных статистических методов в практике клинических исследований. Сообщение первое. Сравнение двух пропорций / А.В. Чубенко, П.Н. Бабич, С.Н. Лапач и др. // Украiнський Медичний Часопис, 2003, № 4 (36), с. 139-143". Статья доступна бесплатно по ссылке http://www.biostat.kiev.ua/pdf/statm1.pdf илиhttp://www.apteka.ua/archives/405/19649.html. В статье описан метод (Z-критерий для долей), который, по-моему, Вам имеет смысл применить. Отмечу только, что в названии и в тексте работы авторы совершенно неточно используют кальку с английского (proportion) как пропорцию. Хотя подобное вольное обращение с русским языком - наследником санскрита - простительно иностранным авторам. А по-русски это называется - доля. Сообщение отредактировал Игорь - 9.10.2008 - 16:29 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
10.10.2008 - 19:24
Сообщение
#8
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Не является сравнение доверительных интервалов не только оптимальным, но и вообще методом проверки гипотезы. Думаю, не нужно повторять чужих ошибок. Но безусловная критика - не наш метод. Думаю, Вам имеет смысл ознакомиться с работой "Применение современных статистических методов в практике клинических исследований. Сообщение первое. Сравнение двух пропорций / А.В. Чубенко, П.Н. Бабич, С.Н. Лапач и др. // Украiнський Медичний Часопис, 2003, № 4 (36), с. 139-143". Статья доступна бесплатно по ссылке http://www.biostat.kiev.ua/pdf/statm1.pdf илиhttp://www.apteka.ua/archives/405/19649.html. В статье описан метод (Z-критерий для долей), который, по-моему, Вам имеет смысл применить. Отмечу только, что в названии и в тексте работы авторы совершенно неточно используют кальку с английского (proportion) как пропорцию. Хотя подобное вольное обращение с русским языком - наследником санскрита - простительно иностранным авторам. А по-русски это называется - доля. 1) В другом посте я уже описал, почему идея о том, что доверительные интервалы нельзя использовать для тестирования гипотез не верна. Доверительный интервал - это интервал в котором находятся 95% выборочных средних (выборочных долей), если два интервала не перекрываются. значит одни и те же значения невозможны, популяции различаются. 2) z- метод тут все равно бы не подошел из-за малого количества наблюдений - нормальная аппроксимация биномиального распределения не работает 3) не понял, почему тут нельзя использовать хи2 (или Фишера) РП РЭ____+____ - +_____21____4 -______0____12 и тестировать гипотезу независимости РП и РЭ |
|
11.10.2008 - 10:32
Сообщение
#9
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 6.10.2008 Пользователь №: 5377 |
Спасибо за статью, я ее изучил. Действительно, как отметил Плав, применение данного метода тут не совсем уместно, из-за малого объема наблюдений. К слову сказать, в данной статье ни слова не сказано об ограничениях на использования этого метода. Кроме того, в этой же статье приведен пример использования доверительного интервала для проверки гипотез. Такие же примеры есть и в известной литературе. Потому, не могли бы Вы привести источник, в котором описано почему доверительные интервалы не являются методом проверки гипотез ?
И все же хотелось бы получить ответ на свой вопрос. Может быть я не очень понятно изъясняю. Приведу свой же пример. Хотелось бы узнать насколько правомерен такой ход, просто в практическом смысле на будущее. Наблюдаемые Ожидаемые частоты частоты 0 9,25 4 9,25 12 9,25 21 9,25 Т.е. мы ожидаем равномерное распределение величины (расчитывается как сумма наблюдаемых/кол-во). И далее для такой таблицы применяется хи-квадрат для проверки нулевой гипотезы. |
|
11.10.2008 - 17:22
Сообщение
#10
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
3) не понял, почему тут нельзя использовать хи2 (или Фишера) РП РЭ____+____ - +_____21____4 -______0____12 и тестировать гипотезу независимости РП и РЭ Потому что нулевая частота, хи-квадрат, наверное, работать не будет. А ТМФ можно, как любой подходящий точный метод. ... не могли бы Вы привести источник, в котором описано почему доверительные интервалы не являются методом проверки гипотез ? Сначала, если можно, приведите источник, где доверительные интервалы являются методом проверки гипотез. Ну и логика у Вас, уважаемый thedarkspirit. А где написано, что "Запорожец" не мотоцикл? Нигде! Нет такой книги! Уверен на 100%! Следовательно, "Запорожец" - мотоцикл! Сообщение отредактировал Игорь - 11.10.2008 - 21:07 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
12.10.2008 - 12:02
Сообщение
#11
|
|
Группа: Пользователи Сообщений: 7 Регистрация: 6.10.2008 Пользователь №: 5377 |
Сначала, если можно, приведите источник, где доверительные интервалы являются методом проверки гипотез. Ну и логика у Вас, уважаемый thedarkspirit. А где написано, что "Запорожец" не мотоцикл? Нигде! Нет такой книги! Уверен на 100%! Следовательно, "Запорожец" - мотоцикл! Таких источников очень и очень много. Для примера О.Ю. Реброва "Статистический анализ медицинских данных" стр. 163 "... необходиимо вычислить границы ДИ для каждой из сравниваемых относительных частот и сравнить эти ДИ. Если они не пересекаются, то различия частот можно считать статистически значимыми (с уровнем значимости 0,05 если анализировались 95% ДИ)...." И такие утверждения встречаются достаточно часто, такой подход я встречал во многих научных работых, потому я и попросил Вас привести источник, где описано почему же такой подход ошибочен. И если я ошибаюсь, хотелось бы получить более существенные доводы нежели посылы к "запорожцам". Сообщение отредактировал thedarkspirit - 12.10.2008 - 12:09 |
|
12.10.2008 - 19:08
Сообщение
#12
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Сначала, если можно, приведите источник, где доверительные интервалы являются методом проверки гипотез. Ну и логика у Вас, уважаемый thedarkspirit. А где написано, что "Запорожец" не мотоцикл? Нигде! Нет такой книги! Уверен на 100%! Следовательно, "Запорожец" - мотоцикл! Мой любимый Armitage & Berry, p.90 "The value of the parameter inside the 95% confidence interval are precisely those which would not be contradicted by a two-sided significance test at the 5% level. Values outside the interval, on the other hand, would all be contradicted by such test" "... a confidence interval may be regarded as equivalent to performing significance test for all values of a parameter, not just single value corresponding to the null hypothesis" Надо заметить, что эти интервалы были разработаны в трудах Р.Фишера (под названием fiducial limits) и Неймана. |
|
12.10.2008 - 19:29
Сообщение
#13
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
И все же хотелось бы получить ответ на свой вопрос. Может быть я не очень понятно изъясняю. Приведу свой же пример. Хотелось бы узнать насколько правомерен такой ход, просто в практическом смысле на будущее. Наблюдаемые Ожидаемые частоты частоты 0 9,25 4 9,25 12 9,25 21 9,25 Т.е. мы ожидаем равномерное распределение величины (расчитывается как сумма наблюдаемых/кол-во). И далее для такой таблицы применяется хи-квадрат для проверки нулевой гипотезы. В принципе, так делать можно (только используйте поправку Йетса на непрерывность из-за малого количества наблюдений). Но я все равно не понимаю, почему Вы считаете, что распределение должно быть равновероятным. Ведь РЭ+ 21 человек (из 37), а РП+ - 25. ПОэтому можно делать гипотезы а) Количество РЭ+/- одинаково б) Количество РП+/- одинаково в) Количество с РЭ и РП больше, чем ожидается по относительной встречаемости РЭ и РП Эти гипотезы тестируются по-разному, но ни одна так, как Вы указали. |
|
12.10.2008 - 21:25
Сообщение
#14
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Таких источников очень и очень много. Для примера О.Ю. Реброва "Статистический анализ медицинских данных" стр. 163 "... необходиимо вычислить границы ДИ для каждой из сравниваемых относительных частот и сравнить эти ДИ. Если они не пересекаются, то различия частот можно считать статистически значимыми (с уровнем значимости 0,05 если анализировались 95% ДИ)...." И такие утверждения встречаются достаточно часто, такой подход я встречал во многих научных работых, потому я и попросил Вас привести источник, где описано почему же такой подход ошибочен. И если я ошибаюсь, хотелось бы получить более существенные доводы нежели посылы к "запорожцам". Это, видимо, очень ценный источник. Видимо, поэтому Вы его во множественном числе именуете. Я уже приводил пример на ту же тему в другой ветке форума, однако пояснить его никто не захотел. Повторю частично: Выборка 1 0,18 0,27 0,19 0,36 0,43 Выборка 2 0,41 0,38 0,73 0,49 0,58 Критерий Стьюдента для независимых выборок 2,91 P-значение (двустороннее) 0,0196 Параметры выборок с доверительными интервалами Выборка 1 Среднее 0,29 Нижний 95% 0,15 Верхний 95% 0,42 Выборка 2 Среднее 0,52 Нижний 95% 0,34 Верхний 95% 0,69 ДИ, как видим, весьма пересеклись, но P-значение = 0,0196. Или, согласно К. Пруткову, "если на клетке слона увидишь надпись "буйвол", не верь глазам своим"? Если Вас устраивают подобные источники [и подобные программы], пользуйтесь на здоровье и на благо науки. Я же в таком случае все свои возражения снимаю. Успехов! P.S. Лучше вот тут гляньте, как доверительные интервалы сравнивать http://www2.sas.com/proceedings/sugi22/STATS/PAPER270.PDF. Сообщение отредактировал Игорь - 14.10.2008 - 11:20 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
12.10.2008 - 22:06
Сообщение
#15
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Ну вообще-то расчеты тут не верные (ДИ). Если анализируются две группы, то правильнее анализировать ДИ не для двух выборок по отдельности, а для разностей.
В приведенном выше примере мы имеем для разности средних 0,232, 95%ДИ=0,048-0,416. Поскольку нулевое значение находится вне пределов интервала, нулевую гипотезу о равенстве популяционных средних надо отклонить. Иными словами тут будет полный аналог t-теста Если сравнивать два доверительных интервала, рассчитанных по отдельным выборкам, то мощность теста упадет, как если Вы возьмете и в t-тесте замените оценку стандартного отклонения из двух групп на одну группу. Однако вопрос важности падения мощности не столь однозначен. То, что разные тесты дают разные значения р отнюдь не удивительно. Для данного примера (я звездочками пометил менее 0,05):
На самом деле в этом примере даже не скажешь, каким тестом пользоваться, пока не будешь знать об исходной популяции, ошибках измерения и задаче тестирования. Может - t-критерием, а может - КС. Учитывая малый размер выборки, чистый t-критерий представляется наименее адекватным тестом из мощных, если только нет данных в пользу нормальности распределения значения в исходной популяции. Для Вилкоксона, опять же по тем же причинам лучше использовать Вилкоксона с t-аппроксимацией, а она не дает достоверных отличий. Вывод отнюдь не так однозначен, как кажется с первого взгляда. |
|