Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Критерий Колмогорова-Смирнова
Татьяна
сообщение 9.06.2007 - 10:19
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 9.06.2007
Пользователь №: 4154



Вопрос от чайника: здесь на форуме писали, что при применении непараметрической статистики не используются средние и стандартное отклонение (SD), а нужно использовать медиану и еще что-то. Однако есть непараметрический критерий Колмогорова-Смирнова, который эти величины для непараметрической статистики выдает. В каких случаях его можно использовать? Можно/нельзя его использовать как замену Стьюденту для случаев с неизвестным распределением? И почему?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 9.06.2007 - 17:51
Сообщение #2





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Для специалиста-нестатистика важно представлять следующее: статистические критерии могут тестировать различные параметры выборок. Выделяют следующие параметры: положения, рассеяния, функции распределения. Приведем примеры непараметрических критериев. В таблице указаны тестируемые параметры выборок для различных критериев.

Положение (location tests): среднее и/или медиана
-------------------------------------------------------------
Вилкоксона, Манна-Уитни, Ван дер Вардена, Уайта, Фишера-Иэйтса-Терри-Гефтинга, Розенбаума, медианы, медианный Муда-Брауна, Сэвиджа, Гехана, Блома, Тьюки

Рассеяние: дисперсия (homogeneity of variance), масштаб (scale tests)
------------------------------------------------------------------------------------
Ансари-Бредли, Клотца, Коновера, Муда, Дэвида, Зигеля-Тьюки, Мозеса

Функция распределения
------------------------------
Смирнова, Крамера-фон Мизеса, Койпера

Многие задают вопрос, почему, к примеру, одним методом между выборками выявляются статистически значимые различия, другим - нет. Дело в том, что все методы предназначены для проверки отсутствия статистических различий в различных параметрах (иногда - в совокупности параметров) выборок. Так, можно себе представить такие выборки, которые имеют одинаковые параметры положения (медианы), но разные параметры рассеяния (дисперсии). В таком гипотетическом случае критерий Ансари-Бредли покажет наличие различий, критерий Вилкоксона - нет. Становится понятным, почему исследователи часто не ограничиваются одним тестом, а пытаются выполнить их совокупность для статистического сравнения всевозможных параметров выборок: средних или медиан, дисперсий, функций распределения.
При формулировании нулевой гипотезы обязательно следует указывать, какие конкретные параметры эмпирических выборок сравниваются с помощью используемого критерия. Нужно указывать это в научной публикации, чтобы читатель имел возможность проверить правильность рассуждений автора.

Поэтому на вторую часть Вашего вопроса (о Стьюденте) можно ответить, что критерий Смирнова не может быть "заменой" критерию Стьюдента. "Заменой" может быть, например, критерий Вилкоксона. А параметрическому критерию Фишера можно сопоставить, к примеру, критерий Ансари-Бредли.

Представляется, что наиболее употребительными при анализе биомедицинских данных находят именно критерии положения, а не прочие перечисленные категории. Клинически важным выводом является не различие дисперсий или функций распределения, а различие средних или медиан (например, наличие эффекта, снижение осложнений, уменьшение сроков лечения и т.д.).

Почти все упомянутые методы прекрасно описаны и в русскоязычных источниках.

Кстати, название "Колмогоров-Смирнов" неправомерно. Следует использовать "критерий Смирнова". Критерий Колмогорова (и типа Колмогорова) применяется для проверки гипотез согласия.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 12.06.2007 - 16:11
Сообщение #3





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



В принципе, Sheskin (2004) указывает на то, что тест Колмогорова-Смирнова для двух независимых выборок (или тест Смирнова (1939)), может использоваться как альтернатива t-тесту. Однако, как замечено выше, он отвечает на другой вопрос - это тест, который сравнивает форму распределения и поэтому любые различия (дисперсия данных, эксцесс, асимметрия и т.п.) могут привести к заключению о том, что выборки пришли из разных популяций. Соответственно, получив положительный ответ на вопрос - "принадлежат ли выборки к разным популяциям" ничего большего (различаются у них средние, дисперсии или просто форма распределеения - одно скошено влево, другое вправо) Вы вообще утверждать не можете. Соответственно, даже непонятно что различается - средние или медианы (или еще что). Более того, в случае небольших различий средних (или медиан) при одинаковой форме распределения, критерий Колмогорова-Смирнова для независимых выборок может не найти различий, которые "увидят" тест Стьюдента или Вилкоксона (Мэнна-Уитни) - мощность этого теста для различий показателей центральной тенденции ниже, чем для специальных тестов.
Что же касается, того, что тест "выдает средние" - тест не использует средние при расчете. Сравниваются кумулятивные функции распределения. Поэтому средние "выдает" некая статистическая программа, авторы которой решили загнать в распечатку результатов теста оценку показателей центральной тенденции.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Татьяна
сообщение 13.06.2007 - 06:24
Сообщение #4





Группа: Пользователи
Сообщений: 3
Регистрация: 9.06.2007
Пользователь №: 4154



Гипотезу о равенстве средних я проверяю тестом Мэнна-Уитни. Пользуюсь программой Statistica. Вилкоксона тоже на всякий случай считаю. При нажатии на кнопочку "тест Колмогорова-Смирнова" (простите меня великодушно, господа статистики smile.gif ) получаю среди прочего среднее (mean) и SD. Вопрос: Можно ли при предоставлении данных использовать эти величины, или нужно что-нибудь другое (при нажатии на кнопочку "описательная статистика" еще можно получить медиану, геометрическое и гармоническое среднее, среднее отклонение... Что правильнее всего писать в виде Величина+-ошибка?
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 13.06.2007 - 13:01
Сообщение #5





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Если использовали тест Вилкоксона/МУ - медиану и межкватильное расстояние. А вот если КС использовали - то тут проблема, Вы можете только сказать, что распределения отличаются друг от друга, а вот чем - неизвестно. Однако, поскольку дисперсия есть у любого распределения и среднее есть у любого. то если Вы напишете Среднее (SD) - именно так, то можно. А вот +/- - не стоит smile.gif (хотите интервал - рассчитайте 95% доверительный интервал для медианы)
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Татьяна
сообщение 15.06.2007 - 08:30
Сообщение #6





Группа: Пользователи
Сообщений: 3
Регистрация: 9.06.2007
Пользователь №: 4154



Спасибо! Благодаря Вашим ответам еще раз перечитала Реброву - и до меня все дошло. И почему медиана, а не среднее, и почему + не равен - и как их считать... только когда руководителю рассказала, она что-то скисла, и сказала, что не зает, как лучше будет. Рецензенты - оппоненты люди пожилые, привыкли к среднему...
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 15.06.2007 - 10:11
Сообщение #7





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Ага, теперь становится понятно, почему в других ветках форума я так активно пропогандирую не отказываться от параметрики smile.gif !
Если серьезно, проблема с оппонентами и членами Совета есть, они привыкли к определенному формату представления данных и соискатель\аспирант не может (и не должен) их переучивать. Его задача подстроиться под требования Совета. Соответственно, я бы рекомендовал пересчитать результаты при помощи параметрического теста Стьюдента. Если от изменения теста интерпретация не страдает - пишите спокойно М+\-m и указывайте р.
Если t-тест дает принципиально иные результаты (т.е. t-тест 0,2, КС - 0,03). То тогда, интерпретация результатов, как имеющихразличия средних просто не верна. Тогда надо посмотреть (например по гистограммам, stem-an-leaf или коробчатым графикам) - чем выборки различаются и описать именно эти различия.
Я бы хотел воспользоваться случаем и подчеркнуть - в исследовании важнее всего не абсолютное значение р, а интерпретация результатов иследования с точки зрения надежности полученных данных.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
Игорь
сообщение 29.09.2007 - 14:15
Сообщение #8





Группа: Пользователи
Сообщений: 1114
Регистрация: 10.04.2007
Пользователь №: 4040



Цитата(плав @ 12.06.2007 - 16:11) *
В принципе, Sheskin (2004) указывает на то, что тест Колмогорова-Смирнова для двух независимых выборок (или тест Смирнова (1939)), может использоваться как альтернатива t-тесту. Однако, как замечено выше, он отвечает на другой вопрос - это тест, который сравнивает форму распределения и поэтому любые различия (дисперсия данных, эксцесс, асимметрия и т.п.) могут привести к заключению о том, что выборки пришли из разных популяций. Соответственно, получив положительный ответ на вопрос - "принадлежат ли выборки к разным популяциям" ничего большего (различаются у них средние, дисперсии или просто форма распределеения - одно скошено влево, другое вправо) Вы вообще утверждать не можете. Соответственно, даже непонятно что различается - средние или медианы (или еще что). Более того, в случае небольших различий средних (или медиан) при одинаковой форме распределения, критерий Колмогорова-Смирнова для независимых выборок может не найти различий, которые "увидят" тест Стьюдента или Вилкоксона (Мэнна-Уитни) - мощность этого теста для различий показателей центральной тенденции ниже, чем для специальных тестов.
Что же касается, того, что тест "выдает средние" - тест не использует средние при расчете. Сравниваются кумулятивные функции распределения. Поэтому средние "выдает" некая статистическая программа, авторы которой решили загнать в распечатку результатов теста оценку показателей центральной тенденции.

Вот цитата из электронного учебника StatSoft: "Например, двухвыборочный критерий Колмогорова-Смирнова чувствителен не только к различию в положении двух распределений, например, к различиям средних, но также чувствителен и к форме распределения". Ссылка из раздела "Непараметрическая статистика". Утверждение не содержит ошибок - оно само по себе ошибка.


Signature
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
плав
сообщение 30.09.2007 - 10:07
Сообщение #9





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Если я правильно понял, имеется ввиду фраза в учебнике Statsoft? Строго говоря, если мы имеем две выборки из разных популяций, с разными средними но одинаковой стандартной ошибкой и распределенных нормально, то тест КС укажет на то, что это - разные распределения. Другой дело, что мы никогда не сможем сказать, что была причина в разнице средних или в чем другом - формально, они, наверное, правы, но читателя-неспециалиста путают frown.gif
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему