Цитата(hongma @ 9.08.2008 - 13:38)

Здравствуйте

Прежде всего, какие задачи вообще решает статобработка?
1. Для одной группы данных, например, возраст. Характер распределения, наличие значений, отклоняющихся от "нормы". Это гистограмма, анализ соответствия известным распределениям/чаще всего нормальному/ по характерным для этих распределений параметрам и критерию хи-квадрат, выявление "выбросов",например, по Q-критерию.
2. Есть 2 группы данных.
а/ Идентичные или разные. Сравнение по характерам распределений. Сравнение по средним. Распределения: сначала гистограмма, затем по параметрам распределений, по критерию хи-квадрат и другим более редким критериям. По средним: если близко к нормальному распределению (!) - Стьюдент. Если существенно ненормальное распределение или Стьюдент не дал то,что надо - непараметрические критерии. Последние позволяют иногда сравнить одновремено и средние и распределения.
б/ Наличие сопряженности. Коэффициент корреляции, дисперсионный анализ. Второй универсальнее, но дает ответ в виде наличия или отсутствия вообще какой-то связи, ничего не говоря о ее характере.
Сказанное относится в первую очередь к "статическим" данным. Если данные могут быть представлены как временные зависимости, общий алгоритм исследования сохраняется, но методы будут другими
Для информации.
1) Дисперсионный анализ является генерализацией метода сравнения средних, т.е. он из той же группы, что и тест Стьюдента. Насчет наличия или отсутствия какой-либо связи вообще путаница. Дисперсионный анализ проверяет гипотезу о равенстве выборочных средних.
2) Коэффициент корреляции относится к показателям сопряженности, это правильно, но он не тестирует никакой гипотезы. Это статистика, такая же, как и коэффициент t. Показатель линейности связи между переменными. Является случайной величиной (поскольку получен в выборке). Соответственно, должен также проверяться (обычно проверяется гипотеза о равенстве коэффициента корреляции нулю).
3) Заявление, что "если Стьюдент не дал, то, что надо" весьма забавное. Вообще-то обычно статистическая обработка планируется ДО начала исследования. Соответственно, исследователь, запланировавший использование t-теста должен получить результат и жить с ним, а не испробовать методы до тех пор, пока не получит "нужный" результат. В противном случае, это уже не статистическая обработка данных, а "рыбалка".