Цитата(100$ @ 24.12.2016 - 19:57)

Рекомендация использовать "ковровое бомбометание тестами" (как однажды иронично выразился p2004r) доставляет сама по себе, а применительно к проверке нормальности доставляет вдвойне, порождая при этом лавину неприличных мировоззренческих вопросов:
1.А как вообще получена оценка снизу оптимального количества тестов на нормальность (в данном случае 4)? Их же напридумывали гораздо больше. Ведь не может быть, чтобы автор рекомендации затруднился сходу вспомнить более 4-х тестов на нормальность?
Вы правы, не всякий автор способен затрудниться сходу вспомнить более 4-х тестов на нормальность.
Полагаю, что такое утверждение Вы делаете на своём практическом опыте. Что вполне нормально.
Вот и я рекомендую эти 4 критерия исходя из своего более 35-летнего опыта выполнения статистического анализа.
Именно эти критерии наиболее доступны в популярных статистических пакетах, а некоторые из них наиболее мощные.
А тот, кто вообще использует лишь один критерий проверки нормальности, не способен сходу вспоминать более 4-х критериев.
При этом, что критериев проверки на нормальность много. Вот лишь небольшой список этих критериев:
1. Али-Чёрго-Ревеса
2. Асимметрии и эксцесса
3. Васичека
4. Гири
5. Д'Агостино
6. Дэвида-Хартли-Пирсона
7. Колмогорова-Смирнова
8. Ла Брека
9. Лина-Мудхолкара
10. Локка-Спурье
11. Мартинеса-Иглевича
12. Муроты-Такеучи
13. Оя
14. Саркади
15. Филлибена
16. Фроцини
17. Хегази-Грина
18. Шапиро-Уилка
19 Шпигельхальтера
20. Критерий, основанный на совокупности малых выборок
21. Модифицированный хи-квадрат критерий.
Ну а при отмене нормального распределения, используются и ещё несколько десятков на проверку других видов распределений.
Цитата(100$ @ 24.12.2016 - 19:57)

2. Ну и какие именно тесты на нормальноть распределения должен использовать вопрошающий, дочитамши до конца подобную рекомендацию?
Набор используемых критериев для проверки нормальности, определяет сам исследователь.
Исходя из своих знаний, опыта, и используемых языков программирования или статистических пакетов.
Естественно, что желательно при этом использовать более статистически мощные критерии для используемых объёмов выборок.
Те критерии, которые упомянуты мною в моих рекомендациях, определены моим личным опытом таких проверок.
Цитата(100$ @ 24.12.2016 - 19:57)

3. И самое главное ("Least not last"): какой статистический вывод надо сделать вопрошающему, если тесты Шапиро - Уилка и Шапиро - Франчии гипотезу нормальности не отвергают, а тесты Чена - Шапиро и Лина - Мудхолкара отвергают?
Заранее благодарен за снисходительные разъяснения.
Искренне ваш,
100$
Уважаемый коллега! Мой ответ вовсе не является "снисходительным". Это обмен мнением с коллегами.
Уверен, что и у Вас тоже огромный опыт по статистическому анализу. И при желании Вы также высказываете свои детальные мнения по подобным вопросам.
Однако у всех нас, занятыми такой деятельностью, своя специфика и особенность этой работы.
В последние 10 лет у меня стремительно возрастает доля анализа очень больших объёмов выборок.
И вот для таких больших массивов данных, упомянутые конфликты критериев как раз продуктивны.
Поскольку активируют дальнейшие исследования. Некоторые аспекты этого я описал в своей последней статье по адресу
http://www.biometrica.tomsk.ru/comp_aver.htm А вот конкретный пример по такой ситуации.
Исходная группа анализаN = 55477
Mean = 24.2700117
Std Deviation = 3.1237266
Kolmogorov-Smirnov Pr > D <0.0100
Cramer-von Mises Pr > W-Sq 0.0504
Anderson-Darling Pr > A-Sq 0.0545
То есть при анализе выборки из 55477 наблюдений, один критерий отвергает нормальное распределение, а 2 других критерия - поддерживают.
Дальнейший анализ разных деталей этого распределения, позволил обнаружить наличие двух следующих подгрупп:
Группа 1)N = 30238
Mean = 24.5027307
Std Deviation = 3.19997413
Kolmogorov-Smirnov Pr > D 0.0843
Cramer-von Mises Pr > W-Sq 0.1366
Anderson-Darling Pr > A-Sq 0.1941
Группа 2)N 25239
Mean 23.9911989
Std Deviation 3.00628606
Kolmogorov-Smirnov Pr > D 0.1000
Cramer-von Mises Pr > W-Sq 0.1849
Anderson-Darling Pr > A-Sq 0.1837
____________________________________________
Когда я убеждаю медиков в необходимости использовать более 2-3-х статистических методов анализа, я напоминаю им,
как практикующие медики уточняют состояние пациента. Они используют для этого очень много методов анализа:
анализ крови, анализ мочи, ЭКГ, томография, УЗИ, и т.д. Что и позволяет им установить наиболее вероятное состояние пациента,
и в результате выбрать оптимальную подборку методов лечения. Такая же методология и в во многих науках, включая и статистику.
Спасибо за внимание к моим рекомендациям.
Уверен, что и Вы также часто выкладываете для читателей подобные полезные рекомендации.