Цитата(himik @ 26.05.2015 - 17:43)

1) Правильно ли я понимаю, что для сравнения медиан в ненормально распределённых выборках (больше 2) надо использовать критерий Краскела-Уоллиса?
2) Если есть статистически значимые отличия, то как потом понять, между какими группами эти отличия? Применять критерий Мана-Уитни? А каким образом учитывать множественные сравнения? А можно ли сразу применить критерий Мана-Уитни с учётом множественных сравнений?
3) Можно ли применять метод Краскела-Уоллиса для анализа величины, которая может прининять только 2 значения, условно ?0? и ?1?? А критерий хи-квадрат? А как при
применении критерия хи-квадрат учесть множественные сравнения?
4) А можно ли сделать так. Посчиать для каждой выборки % с величиной "0" и сравнивать по Краскелу-Уоллису эти проценты?
1) Для сравнения именно медиан лучше использовать медианный критерий. Критерий Краскела-Уоллиса, как и критерий Манна-Уитни сравнивает функции распределения, а это больше чем просто медиана, хотя и она в том числе. Критерий К-У обладает большей мощностью чем медианный (из практики, специально не читал).
2) Как уже сказал Alexandrovich нужно применять post-hoc, т.е. апостериорные критерии, а автор статьи, ссылку на которую дал малой, этого просто не знает. Критериев много, но они малоизвестные. Проще найти:
а) Критерий Данна, который был предложен Данном (Dunn, 1964), однако распространение получил после 1988 г, когда был приведён в книге Сьегля и Кастеллана (Siegel, Castellan, 1988) и потому в некоторых работах необоснованно называется их именами (Siegel-Castellan test). Есть в пакете Statistica в модуле непараметрических множественных сравнений без указания имён.
б) Критерий Стила - Двасса (Steel-Dwass test, Steel-Dwass-Critchlow-Fligner test) - ранговый аналог метода наименьшей значимой разности Тьюки (Tukey's LSD). Есть в пакете KyPlot (последняя бесплатная версия:
https://yadi.sk/d/CpuBB21yWVrmN ) в модуле непараметрических методов.
3) Хи-квадрат и аналоги (G-критерий отношения правдоподобия, критерий Фримана-Тьюки). Вместо множественных сравнений находят ячейки обеспечившие неслучайно высокий вклад в итоговую статистику. Для этого рассчитывают отклонения Фримана-Тьюки (Freeman-Tukey deviation) или стандартизованные остатки (остатки Хабермана, Adjusted Standardized Residuals, Haberman Residuals).
4) Идея непонятна, непрозрачна, мудрить не нужно:)