Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Критерии сравнения
Форум врачей-аспирантов > Разделы форума > Медицинская статистика
anteich
Уважаемые коллеги! Требуется помощь в ответе на вопрос.

Вот такой пример: Две выборки из генеральной совокупности рассмотрены по какому-то определенному признаку. Согласно критерию согласия Пирсона, значения признака одной из выборок распределены нормально, а другой - ненормально. Требуется сравнить выборки при Ho: M(X)≠M(Y), при конкурирующей гипотезе H1:M(X)=M(Y). То есть выявить достоверные различия между значениями признака у двух различно распределенных выборок. Какой критерий нужно при этом использовать?

1. Как известно, параметрические критерии требуют нормального распределения. Если взять, к примеру, t-критерий Стьюдента, то его использование предопределяют два важных условия: нормальное распределение и равенство двух генеральных дисперсий. В случае, если дисперсии не равны, то можно использовать поправку к формуле - так называемую ошибку Беренса-Фишера.

2. Непараметрические методы, тоже вроде как бы не используются при подобных ситуациях. И вообще в литературе подобному вопросу по-моему мало внимания уделяется?

Да, и еще, если есть в программе Statistica решение моей проблемы - опишите, пожалуйста, подробные действия. Заранее спасибо.

С уважением,
anteich.

плав
Опять все перпутано. Как распределены выборки никого не волнует. Интересно, как распределены значения в популяции (популяциях) из которой эти выборки были взяты. Соответственно, если Вы предполагаете, что популяции различны (одна с нормальным распределением параметра, другая - с иным), то надо сравнивать характеристики распределения (например, по критерию Колмогорова-Смирнова). Если Вы предполагаете, что ненормальность в выборке вляется случайной и в популяции значения распределены нормально - то t-критерий. И т.д.
Это теория. На практике обычный совет, который дают обработчики - использовать критерий Мэнна-Уитни (Вилкоксона для несвязанных совокупностей), поскольку в случае нормального распределения этот критерий практически такой же мощности, что и Стьюдента. На самом деле в реальности этот совет не решает проблему, например, смешанных распределений, тогда лучше использовать сравнение винзоризиорванных (если мало наблюдений) или обрезанных (если много) средних при помощи bootstrap.
Теперь к Statistica. Современные методы - типа bootstrap на винзоризированных средних там отсутствует (как и в других пакетах, однако в SAS, Statistica или SPSS можно написать программу). Поэтому Вам остается только использовать критерий Мэнна - Уитни (модуль Непараметрическая статистика). Подробнее - почитайте встроенную подсказку Statsistica.
anteich

Если я правильно Вас понял - то рассматривать нужно распределение всех значений внутри популяции. Если же распределения двух популяций различны (смешанные распределения), то используется статистика bootstrap.

Спасибо за ответ!

С уважением,
anteich.




плав
Не совсем. Любой статистический анализ строится на предположении о распределении данных в популяции. Для того, чтобы реально оценить это распределение проводятся эпидемиологические исследования, которые позволяют оценить форму распределения показателя в популяции. Соответственно, любое исследование должно начинаться с того, что Вы проводите поиск в литературе исследований, в которых изучалось распределение изучаемого показателя. Если таких данных нет, то у Вас две возможности. Если выборка достаточно большая предположить, что распределение в выборке аналогично распределению в популяции (большая - понятие растяжимое, зависит от гетерогенности объектов - например, пациентов - но обычно речь идет о сотнях, а то и тысячах, наблюдений). тогда Вы проверяете распределение методами анализа распределений и подбираете метод статистического анализа исходя из типа распределения (кстати, хочу заметить, что статистическое тестирование предполагает проверку гипотезы (Но) о том. что выборки из одной популяции, поэтому идея о том, что в двух выборках может быть разное распределение уже сходу противоречит этой гипотезе).
Если у Вас наблюдений не очень много/выборка гетерогенна (пациенты в возрасте от 15 до 80, например), то Вы начинаете делать предположение о форме распределения исходя из общих знаний о предмете. Т.е. Вы можете предположить, что распределение нормально, можете, что оно не нормально и т.п. Типов ненормальных распределений очень много, ряд их является нормализуемыми (т.е. их можно превратить в нормальное распределение путем математических преобразований), тогда подбор соответствующего преобразования можно проводить методом Бокса-Кокса. Можно использовать непараметрические методы тестирования гипотез (но надо хорошо разобраться с их приемлимостью для того или иного распределения и типа гипотезы). Наконец, в последнее время много внимания уделяют смешанным распределениям (название происходит из того факта, что на самом деле распределение образовано в результате смешения нескольких субпопуляций с разными дисперсиями). На таких распределениях непараметрические критерии, распространенные в пакетах прикладных программ "работают" не очень хорошо (т.е. растет вероятность ошибки I типа и/или падает мощность). Поэтому для них рекомендуют использование методик bootstrap, зачастую для сравнения винзоризированных средних (или же используется bootstrap вариант t-теста). При некоторых навыках работы в приличных статистических программах с командным языком эти методики легко самому запрограммировать.
Поскольку медики часто имеют дело с гетерогенными популяциями вероятность смешанного распределения у них выше.
Правда, остается самый главный вопрос - а что Вы потеряете с точки зрения мощности при замене t-теста на что-нибудь непараметрическое или иное статстически продвинутое. Правильный ответ - не много, особенно если сравнивать с потерями от плохого дизайна исследования. например в результате малого количества наблюдений. Да, если у Вас будет р=0,052, используя другие методы анализа можно показать, что при правильных допущениях реальное значение р=0,049. Однако если посмотреть на цифры с позиции правильной оценки результатов исследования или воспользоваться байесовским подходом - результат практически аналогичен... (хотя первый вариант - "не значим", а второй - "значим"). Ну да это отдельная история...
anteich
Благодарю за доходчивое объяснение и приму все Ваши рекомендации к сведению.

Я знаю ряд авторов, которые использовали t-критерий при неизвестном распределении, ссылаясь на такое свойство t-критерия, как рабастность. Что Вы думаете по данному поводу? Вероятнее всего они могли получить при этом неверные результаты?

А вот вопрос о мощности критериев меня заинтересовал - если срьезно терять нечего, то можно использовать и непараметрическую статистику...

Правильное допущение? Это интересно... Где можно найти продолжение Вашей отдельной истории?

С уважением,
anteich.
http://uborshizzza.livejou
При сравнении есть 2 разные задачи:
1) выяснить, одинаковые или нет наблюдаемые величины (на древнем языке - принадлежат ли две выборки к одной генеральной совокупности)
2) определить достоверность различий средних арифметических безотносительно к другим различиям.

Критерий Колмогорова-Смирнова и т.д. действительно можно применять к любым случаям, но он дает решение только задачи 1. То есть, если он даст достоверные различия, то нельзя говорить, что различаются средние (может быть, что средние совпадают, а дисперсии различны)

для решения второй задачи нужно:
а) рассчитать коэффициент эксцентриситета. Если он порядка нескольких единиц или менее, то для объемов наблюдения от 30 и более можно пользоваться критерием студента, дисперсионным анализом и прочими параметрическими методами (в указанном случае строгой нормальности не требуется)

Если это не так, то возможны некоторые другие ухищрения для проверки корректности использования параметрических методов.

Если получается, что пользоваться параметрическими методами нельзя, то можно проранжировать переменные найти достоверность различия средних рангов. Различия средних рангов - не совсем то же, что и различия средних, но на крайний случай и то сгодится
плав
На самом деле одного показателя эксцесса недостаточно, коэффициент асимметрии также надо учитывать при определении нормальности распределения. Однако опять-же надо вначале доказать, что полученные на выборке данные переносимы на популяцию. Возьмите небольшие выборки из нормального распределения и получите там и скошенные распределения, и уплощенные и заостренные.
Еще раз повторю то, что писал неоднократно в других постах - выбор статистического критерия определяется знаниями о популяции, а не делается экспериментально по выборочным данным. Вообще-то метод обработки данных должен быть прописан в протоколе исследования до его начала (кстати, численность группы определяется на основании того, каким методом обработки предполагается воспользоваться).
Если вернуться на землю, то возможны два подхода - использовать сходу непараметрику (немного теряя в мощности) или спокойно продолжать использовать t-тест или дисперсионный анализ, если анализируемая группа гомогенна (кстати, t-тест можно использовать с очень небольшого количества наблюдений - от 4х, но при условии, что популяция крайне гомогенна, как батарейки в одной партии. При этом желательно иметь точную оценку стандартного отклонения. Число 30 наблюдений считается пограничным, поскольку после него стабилизируются SD и приближается к популяционному).
И еще - прежде, чем использовать ранги, следует попытаться нормализовать переменные, либо путем их логарифмирования, либо извлечением квадратного корня, либо... (см. преобразование Бокса-Кокса). Все мощнее будет.
Что же касается "неверных" результатов, то вот это самое сложное - что такое "неверный" результат при тестировании статистической гипотезы? Ее неправильное принятие или отвержение. Если же отказаться от прямолинейно-бинарной оценки и смотреть, например, на значения р - все становится немного проще. Если р=0,051 или 0,049 - результат, в реальности, практически одинаковый, а выводы "разные". Если же 0,001 и 0,0005 - результаты различаются в два раза, а вывод "одинаковый". Посему совет. Если у Вас получается р значительно ниже выбранной границы - изменение метода сильно не скажется на результате, если около 0,05, сомневайтесь в результатах, вне зависимости от того, на какой стороне 0,05 Ваша оценка frown.gif Для этого, собственно, байсовский подход и был реанимирован (посмотрите Bayesian statsstics, информации довольно много).
pifagor
Цитата(anteich @ 21.08.2007 - 22:31) *
Благодарю за доходчивое объяснение и приму все Ваши рекомендации к сведению.

Я знаю ряд авторов, которые использовали t-критерий при неизвестном распределении, ссылаясь на такое свойство t-критерия, как рабастность. Что Вы думаете по данному поводу? Вероятнее всего они могли получить при этом неверные результаты?

А вот вопрос о мощности критериев меня заинтересовал - если срьезно терять нечего, то можно использовать и непараметрическую статистику...

Правильное допущение? Это интересно... Где можно найти продолжение Вашей отдельной истории?

С уважением,
anteich.

Доказано (!), что критерий Стьюдента является робастным критерием. Это практически НЕПАРАМЕТРИЧЕСКИЙ критерий. Но более мощный, чем, например, критерий Манна-Уитни.
Поэтому для случая сравнения двух выборок (только двух!) необходимо использовать именно критерий Стьюдента. Если выборок более двух, нужно использовать критерии множественных сравнений. Лучший из них метод LSD. Это доказано методом статистического моделирования. Критерии множественных сравнений описаны в книге Гланца Биостатистика.
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Форум IP.Board © 2001-2025 IPS, Inc.