Цитата(Совочка @ 12.10.2009 - 23:32)

большое спасибо за подсказку! литературу прочитала
хотелось бы теперь самостоятельно провести дискриминантный анализ , данные получаена, а вот алгоритма нет. я не нашла примеров что и в какой последовательности надо твыполнять и как интерпретировать результаты. Подскажите, пожалста, как это сделать!
Я опишу больше с точки зрения демонстрации различий и интерпретации. Это дискриминантный анализ с переходом к каноническим функциям (как обычно сам и использую). А ещё можно сделать упор именно на качестве классификации (мне это обычно не нужно, но часто довольствуются именно этим).
1. Войти в модуль анализа, сделать доступными Advanced опции. Определить группирующую и независимые переменные.
2. Выбрать закладку Advanced и определиться с методом:
стандартный (войдут все заданные переменные) или пошаговый (войдут только переменные-лучшие дискриминаторы, отобранные программой по заданным условиям). Разные программы используют различное значение F-критерия для пошагового включения-исключения переменных из набора. Чем больше F, тем настройка "грубее" - будут выбраны только самые основные дискриминаторы. Стандартный анализ не проходит если объём выборок мал по сравнению с количеством переменных или если переменные мультиколлинеарны - здесь также может помочь пошаговая техника.
3. В результатах анализа посмотреть значимость всего анализа: Лямбду Уилкса, F-критерий, Р.
4. На новой закладке Advanced можно посмотреть какие переменные вошли в анализ (если использовалась пошаговая техника), можно количественно оценить дистанции между группами в многомерном пространстве признаков (квадрат расстояния Махаланобиса).
5. Если интерпретация особо не важна, а важна классификация - уходить на закладку Classification. Это как бы грубая классификация, не учитывающая взаимной корреляции переменных.
Почитайте Реброву!6.
Если нужно разобраться в данных - следует выбрать Канонический анализ и снова закладка Advanced. Здесь можно посмотреть:
- значимость выделенных дискриминантных осей (смотреть статистику хи-квадрат. Рассматривать оси с P<0,05 как главные и статистически значимые, можно также оси с 0,05<P<0,10 рассматривать как "дополнительные", типа по ним проявилась тенднция к различиям. Главные и дополнительные нужно интерпретировать, остальные (P>0,10) можно упомянуть, но не обсуждать);
- стандартизированные и нестандартизированные коэффициенты дискрим. функции;
- факторную структуру осей. Это - коэффициенты корреляции признака с канонической функцией. По ним и проводится интерпретация осей по величине и знакам входящий в неё переменных. Именно на этом этапе возможны трудности, поскольку: (1) желателен опыт интерпретации многомерных данных, (2) нужно глубоко разбираться в предметной области чтобы провести интерпретацию не формально, а по существу процессов, стоящих за наблюдаемой картиной и (3) факторная структура канонических осей всегда интерпретируется хуже факторной структуры главных компонент или факторного анализа т.к. содержит не общие для групп факторы (их проще понять), а, напротив, квинтэссенцию групповых особенностей.
- посмотреть средние значения дискрим. функций для групп.
На основании этих данных можно создать решающее правило (дискриминантный ключ). В него войдут нестандартизированные коэффициенты, а отнесение к той или иной группе будет проводиться в зависимости от знака рассчитанной функции для конкретного объекта. Какая группа в положительной зоне, какая в отрицательной смотреть по знаку групповых средних.
7. На вкладке канонических значений можно посмотреть степень разделения групп разными осями (если ось одна - то только ей).
8. Здесь же нужно построить диаграмму рассеяния (Scatterplot). Это возможно если осей несколько (если одна - строить гистограммы групповых распределений по данной оси (см. пунк 7). Для наглядности рисунок желательно дополнить. Для этого рисунок нужно вырезать из отчёта (Workbook - Extract as... - Copy). Довести его до ума (толщина и цвет линий, шрифты, можно перенести легенду внутрь рисунка: правой клавишей по легенде и convert to floating text) и только после этого рисовать (иначе рисунок сдвинется). Обычно рисуют так: выбрать на панели рисования "Polygon" и соединить линиями крайние точки для облака точек одной группы (выбрать цвет и/или тип линий), аналогично для других групп. Будет хорошо видно какие группы разделяются в данных канонических дискриминантных осях полностью, а какие трансгрессируют. Вы должно быть с такими рисунками сталкивались в литературе. Рисунок сохраните в двух форматах: в векторном stg (для возможности правки в будущем) и в bmp (для вставки в документ или презентацию).
А вообще, если хорошо проработать литературу, то алгоритм в конкретной программе легко нащупать методом тыка. Чтобы понять этот анализ лучше всего
прочитать соответствующий раздел в книге "Факторный, дискриминантный и кластерный анализ" (есть в и-нете): достаточно подробно и очень доступно. Это поможет правильно представить результаты анализа (что писать, а что можно опустить). Чему там не уделено внимания, так это распределению исходных признаков. Дискриминантный анализ - параметрическая техника, подразумевается примерно нормальное распределение исходных переменных. Это нужно проверить до анализа и в случае необходимости -
преобразовать данные к более симметричному виду.