Критерий для анализа сверхмалых выборок, выборки из 3 значений. Применение стат. анализа |
Здравствуйте, гость ( Вход | Регистрация )
Критерий для анализа сверхмалых выборок, выборки из 3 значений. Применение стат. анализа |
12.01.2023 - 13:39
Сообщение
#46
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
Добрый день. пожалуйста, у меня есть парные измерения показателя, мне нужно найти (или не найти) значимые изменения после воздействия фактора. Поскольку выборка небольшая, всего из 12 наблюдений, мой руководитель просит применить критерий W. Ансари-Бредли или К. Клотца, а в моих стат пакетах их нет. Если вам нетрудно, вы не могли бы обработать..? до. после. 1,96 2,03 2,89 2,60 2,61 2,16 1,83 2,17 1,56 1,65 2,12 2,65 1,44 2,13 2,04 2,16 1,65 2,09 1,12 1,16 1,33 2,16 0,79 1,10 Спасибо. Ваш (уважаемый) руководитель шутит с вами злые шутки: ни Ансари-Брэдли, ни Клотц не работают со связанными выборками. Кроме того, они тестируют гипотезу об однородности параметров масштаба против альтернативы различий масштабного параметра. Это точно то, что вам нужно? Адекватными критериями в данном случае являются: 1) парный критерий Стьюдента (реализован везде, где только можно, в т.ч. в Экселе); 2) тест омега-квадрат Орлова; 3) тест знаковых рангов Уилкоксона; 4) тест двумерной симметрии Холлендера; 5) точный перестановочный тест для связанных выборок. Все вышеперечисленное прикрепил в файле. Мой вердикт - гипотеза на 5% уровне значимости не отвергается.
Прикрепленные файлы
|
|
12.01.2023 - 16:09
Сообщение
#47
|
|
Группа: Пользователи Сообщений: 62 Регистрация: 6.12.2021 Пользователь №: 39615 |
Ваш (уважаемый) руководитель шутит с вами злые шутки: ни Ансари-Брэдли, ни Клотц не работают со связанными выборками. Кроме того, они тестируют гипотезу об однородности параметров масштаба против альтернативы различий масштабного параметра. Это точно то, что вам нужно? Адекватными критериями в данном случае являются: 1) парный критерий Стьюдента (реализован везде, где только можно, в т.ч. в Экселе); 2) тест омега-квадрат Орлова; 3) тест знаковых рангов Уилкоксона; 4) тест двумерной симметрии Холлендера; 5) точный перестановочный тест для связанных выборок. Все вышеперечисленное прикрепил в файле. Мой вердикт - гипотеза на 5% уровне значимости не отвергается. Спасибо еще раз огромное!!! |
|
24.02.2023 - 13:32
Сообщение
#48
|
|
Группа: Пользователи Сообщений: 62 Регистрация: 6.12.2021 Пользователь №: 39615 |
В принципе любая непараметрика. Можно посмотреть критерий рандомизации для независимых или для связанных выборок (он же критерий рандомизации компонент Фишера, он же критерий рандомизации Фишера-Питмана). На русском языке в справочнике Руниона хорошо описан. Здравствуйте. Скажите, раз непараметрический критерий подходит для малых выборок, зачем тогда расчет их объема для непарметрических критериев? А еще скажите, как вы относитесь к формулировке: "значимость на уровне тенденции" - когда речь идет о том что бы отвергнуть гипотезу на уровне 5-10%? Когда значимость различий на заявленном уровне в 5% не найдена..? Спасибо. Сообщение отредактировал salm - 24.02.2023 - 13:41 |
|
24.02.2023 - 14:47
Сообщение
#49
|
|
Группа: Пользователи Сообщений: 204 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 |
В указанных критериях объемы выборок, учитывается автоматически. Но ежели они очень малые, то достигаемый уровень значимости упирается в, скажем так, техническую границу и может никогда не перевалить за вожделенные 5% вне зависимости от величины различий. См. предыдущие страницы. Это как раз может быть одной из причин упомянутой Вами "значимости на уровне тенденции". Однако в большинстве случаев подобные выражения говорят лишь о том, что автор найти значимых различий не смог, но ему очень хочется.
Сообщение отредактировал ИНО - 24.02.2023 - 14:47 |
|
24.02.2023 - 17:37
Сообщение
#50
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Здравствуйте. Скажите, раз непараметрический критерий подходит для малых выборок, зачем тогда расчет их объема для непарметрических критериев? Есть такая штука - мощность критерия (посмотрите в Интернете, зачем она нужна). Мощность критерия является не числом, а функцией от численности (объема) выборки. Чем больше (ближе к 1), тем мощнее (тем лучше). По конкретным критериям, например, можно посмотреть исследования профессора Б.Ю. Лемешко с соавторами из НГТУ (бывший НЭТИ), в которых для многих критериев методом численного моделирования рассчитаны графики, из которых можно сделать вывод о достаточной численности при приемлемой мощности.Точные критерии, применяемые для малых выборок, при вычислении для больших выборок упираются в сложность расчета (для многих численность не более 12-13 или около того, иначе результатов ждать долго). Если необходимо непременно найти различия хоть какие-нибудь (как исследователь, чувствуя, что они есть), примените критерии различных типов (положение, масштаб, функция распределения, комплекс параметров). Сообщение отредактировал Игорь - 24.02.2023 - 18:52 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
24.02.2023 - 20:47
Сообщение
#51
|
|
Группа: Пользователи Сообщений: 62 Регистрация: 6.12.2021 Пользователь №: 39615 |
Есть такая штука - мощность критерия (посмотрите в Интернете, зачем она нужна). Мощность критерия является не числом, а функцией от численности (объема) выборки. Чем больше (ближе к 1), тем мощнее (тем лучше). По конкретным критериям, например, можно посмотреть исследования профессора Б.Ю. Лемешко с соавторами из НГТУ (бывший НЭТИ), в которых для многих критериев методом численного моделирования рассчитаны графики, из которых можно сделать вывод о достаточной численности при приемлемой мощности. Точные критерии, применяемые для малых выборок, при вычислении для больших выборок упираются в сложность расчета (для многих численность не более 12-13 или около того, иначе результатов ждать долго). Если необходимо непременно найти различия хоть какие-нибудь (как исследователь, чувствуя, что они есть), примените критерии различных типов (положение, масштаб, функция распределения, комплекс параметров). Я пока толко поняла что расчетный обьем выборки позволяет мне не найти различия в 20% при заявленной мощности 80%. А могу ли я при недостаточной выборке совершить ошибку первого рода и соврать что различия есть? |
|
24.02.2023 - 20:55
Сообщение
#52
|
|
Группа: Пользователи Сообщений: 62 Регистрация: 6.12.2021 Пользователь №: 39615 |
В указанных критериях объемы выборок, учитывается автоматически. Но ежели они очень малые, то достигаемый уровень значимости упирается в, скажем так, техническую границу и может никогда не перевалить за вожделенные 5% вне зависимости от величины различий. См. предыдущие страницы. Это как раз может быть одной из причин упомянутой Вами "значимости на уровне тенденции". Однако в большинстве случаев подобные выражения говорят лишь о том, что автор найти значимых различий не смог, но ему очень хочется. Спасибо. А в принципе, такое выражение "значимость на уровне тенденции" имеет право на существование? вне конкретной ситуации? Вообще, уместно ли так написать, при понимании того, что выборка мала при таких параметрах признака? |
|
24.02.2023 - 23:32
Сообщение
#53
|
|
Группа: Пользователи Сообщений: 902 Регистрация: 23.08.2010 Пользователь №: 22694 |
> Спасибо. А в принципе, такое выражение "значимость на уровне тенденции" имеет право на существование? Нет. > ...вне конкретной ситуации? Тем более, нет. > Вообще, уместно ли так написать, при понимании того, что выборка мала при таких параметрах признака? Нет. Сообщение отредактировал 100$ - 24.02.2023 - 23:33 |
|
25.02.2023 - 05:37
Сообщение
#54
|
|
Группа: Пользователи Сообщений: 204 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 |
А могу ли я при недостаточной выборке совершить ошибку первого рода и соврать что различия есть? Конечно, можете, особенно, если последуете совету Игоря и начнете проверять все возможные гипотезы всеми существующими критериями на одних и тех же данных. Игорь, судя по этому Вашему совету, а также по тому что Вы написали недавно написали о развитии интерфейса Вашего ПО в сторону одной волшебной кнопки, считающей вес и сразу, можно ли сделать вывод о том, что на Вами принято волевое решение на проблему множественных сравнений окончательно и бесповоротно забить? |
|
1.03.2023 - 10:25
Сообщение
#55
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Конечно, можете, особенно, если последуете совету Игоря и начнете проверять все возможные гипотезы всеми существующими критериями на одних и тех же данных. Игорь, судя по этому Вашему совету, а также по тому что Вы написали недавно написали о развитии интерфейса Вашего ПО в сторону одной волшебной кнопки, считающей вес и сразу, можно ли сделать вывод о том, что на Вами принято волевое решение на проблему множественных сравнений окончательно и бесповоротно забить? Виноват, что-то не припоминаю, что в данной теме и вообще где-либо с моим участием мы обсуждали множественные сравнения.
Сообщение отредактировал Игорь - 1.03.2023 - 11:56 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
1.03.2023 - 12:35
Сообщение
#56
|
|
Группа: Пользователи Сообщений: 204 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 |
Проблема множественных сравнений отнюдь не исчерпывается сравнением одной выборки одним критерием с множеством других выборок. Сравнение двух выборок между собой множеством разных критериев (с последующем выбором того, где получилось p меньше) - это тоже про нее.
|
|
1.03.2023 - 20:24
Сообщение
#57
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
Проблема множественных сравнений отнюдь не исчерпывается сравнением одной выборки одним критерием с множеством других выборок. Сравнение двух выборок между собой множеством разных критериев (с последующем выбором того, где получилось p меньше) - это тоже про нее. 1 пример. Имеем 2 выборки. Сравниваем выборочные средние Стьюдентом, выборочные дисперсии Фишером, эмпирические функции распределения Смирновым. И обнаружить, что средние значимо различаются, дисперсии не различаются, функции распределения различаются.2 пример. Имеем 2 выборки. Сравниваем выборочные средние 4-мя эквивалентными критериями (Стьюдента, Уэлча, Пагуровой, Кокрена-Кокс). Все значимы. Хотелось бы пошутить, но все так плохо, не до шуток сейчас. Предлагаю, если интересует, множественные сравнения перенести в отдельную тему. А мы ознакомимся и поправим свои знания. Сообщение отредактировал Игорь - 1.03.2023 - 20:49 Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
2.03.2023 - 07:16
Сообщение
#58
|
|
Группа: Пользователи Сообщений: 204 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 |
Пример 1. Почему у Смирнова мощность значительно меньше, чем у предложенного Вами критерия "применить поочередно и Стьюдента и Фишера (и еще десятком других, проверяющих по отдельности разные гипотезы о параметрах распределений) и выбрать наименьшее p"? Зачем в наш век высоких технологий вообще такой маломощный критерий нужен, если запустить дюжину разных и при этом установить не только сам факт различий в распределениях, но заодно и то, в чем конкретно они заключаются, ничего не стоит? Или все же стоит? Вы сервисом Virustotal пользовались? Никаких интересных аналогий с поведением ошибки первого рода не заметили?
Пример 2. Все зависит от того, насколько области ошибки первого рода разных критериев перекрываться. Если они действительно эквивалентны, то перекрытие должно быть практически полным, поэтому корректировка на множественные сравнения не требуется. Шутка в том, что в реальности мы это установить не можем. Даже сам автор критерия обычно не может сказать в какой конкретной ситуации больше соврет его критерий, а в какой - его конкурент. При нынешнем уровне научно-технического прогресса выработка сколь-нибудь эффективной процедуры контроля ошибки первого рода ля такого плана анализа представляется нереализуемой. Поэтому рекомендуется выбирать только один критерий, который исследователь считает наиболее мощным в данном случае, или же, если специфику случая представляет слабо, - равномерно наиболее мощный. Мне не встречалось ни одной публикации со словами типа "гипотезу о равенстве математических ожиданий проверяли критериями Стьюдента, Уэлча, Пагуровой, Кокрена-Кокс с последующим выбором наименьшего достигнутого уровня значимости". А ведь именно такой анализа Вы реализовали (или хотите реализовать) в своем ПО. |
|
2.03.2023 - 07:39
Сообщение
#59
|
|
Группа: Пользователи Сообщений: 1114 Регистрация: 10.04.2007 Пользователь №: 4040 |
А ведь именно такой анализа Вы реализовали (или хотите реализовать) в своем ПО. ПО - инструмент. Его задача - правильно посчитать. Пользователь сам принимает решение, какой метод использовать.
Ebsignasnan prei wissant Deiws ainat! As gijwans! Sta ast stas arwis!
|
|
2.03.2023 - 10:06
Сообщение
#60
|
|
Группа: Пользователи Сообщений: 204 Регистрация: 1.06.2022 Из: Донецк Пользователь №: 39632 |
Так-то оно так, вот только для перестраховки принято встраивать защиту от дурака. Хотя бы в виде предупреждения: "Множественные процедуры не рекомендуются" (С)х/ф "Пассажиры". Вы же озвучили диаметрально противоположный подход.
|
|