Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

> Unsupervised fuzzy clustering (UFC) analysis, методы кластерного анализа
S.Nadorov
сообщение 20.12.2007 - 00:45
Сообщение #1





Группа: Пользователи
Сообщений: 3
Регистрация: 20.12.2007
Пользователь №: 4636



Уважаемые форумчане!

Может быть кто-то использовал fuzzy clustering analysis в своей научно-исследовательской работе. Пожалуйста, поделитесь впечатлением.
И знает ли кто-нибудь, в каких пакетах статистических программ реализован его алгоритм?

Заранее спасибо.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
 
Открыть тему
Ответов
плав
сообщение 29.12.2007 - 11:51
Сообщение #2





Группа: Пользователи
Сообщений: 1013
Регистрация: 4.10.2006
Пользователь №: 1933



Почему я напираю на необходимость проверки на другой группе. Классифицирование объектов (больных) проводилось по информации, которая содержалась в переменных описывавших иммунологические показатели. Соответственно, классифицировали больных, но на основании информации об иммунологических показателях. Однако измеренное значение показателя равно y=x+\epsilon, где х - истинное (не наблюдаемое) значение показателя, а \epsilon - случайная ошибка (ошибка измерения, индивидуальная вариабельность и т.д.). Случайная ошибка имеет (в многих моделях) нормальное распределение с параметрами (0,1) - т.е. среднее всех случайных значений равно нулю. Почти все статистические методы построены на том, что при наличии большого количества измерений случайные ошибки гасят друг друга и средня у оказывается равной средней х или близко к тому.
Теперь представьте себе следующую ситуацию, есть три наблюдения с \epsilon -1,+1,+0.5 Суммарное смещение равно 0,5 ввиду того, что последнее значение \epsilon не "гасится". Теперь, если мы удвоим количество наблюдений путем повтора каждого смещение увеличится до 1 (а стандратная ошибка снизится в sqrt(2) раз). Этот пример, как мне кажется, показывает, что дублирование наблюдений ни к чему хорошему не приводит.
Соответственно, если мы использовали информацию об иммунологических показателях для определения кластеров в кластерном анализе, мы уже один раз взяли все наблюдения, включая их ошибку. Если теперь, в какой-то другой модели (например, в дискриминантном анализе), мы опять включим те же показатели, мы продублируем наблюдения вместе с ошибкой и реализуем ситуацию, описанную в примере выше.
Соответственно, подход с использованием кластерного анализа абсолютно легитимный если исследователь определяет принадлежность к кластерам на основании некоего числа переменных, затем анализирует, например, прогноз в группах, образованных этими кластерами, но более не включает в модель переменные, на основании которых проводилась классификация. Исходные переменные в описательном виде, используются лишь для того, чтобы понять, на основании чего разделялись кластеры.
И вот тут мы подходим к факторному анализу, к сожалению, ссылки на хорошие описания дать не смогу (на свои ссылаться не хочется под названием "хорошие", моя любимая книжка Jahn и Hale Die Faktoranalyse была издана 36 лет назат в ГДР и вряд ли легко доступна, но можно найти достаточно много публикаций в психологии (например, Step-By-Step Approach to Using the SAS system for Factor Analysis and Structured Equation Modelling)). на русском языке был ряд публикаций в Кардиологии и Тер.Архиве в начале 1990х. Однако общая идея достаточно простая. Мы устанавливаем, какие переменные связаны с данным фактором, а затем проводим анализ литературы (по патофизиологии, например) с целью выяснить, какая причина может лежать в основе всех этих факторов вместе. Например, ожирение, АГ, высокие ТГ - нарушенная толернатность к инсулину. Фкторный анализ объясняет, что наблюдаемые параметры являются производными от одного (двух, трех) более общих показателей, объяснить которые можно только путем анализа литературы и знаний физиологии и биохимии (психологии в других областях). Так что факторный анализ просто требует значительного анализа литературы после проведения статистического анализа в отличие от остальных методов, которые требуеют этого до.
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Сообщений в этой теме
- S.Nadorov   Unsupervised fuzzy clustering (UFC) analysis   20.12.2007 - 00:45
- - Игорь   То, о чем сказано в предыдущем посте, по-русски на...   20.12.2007 - 10:27
- - плав   нечеткие методы кластерного анализа реализованы в ...   21.12.2007 - 11:49
- - S.Nadorov   Спасибо за помощь. Нашёл в сети книгу "Нечёт...   21.12.2007 - 20:53
|- - Lishe   Цитата(S.Nadorov @ 21.12.2007 - 21:5...   19.03.2013 - 23:00
- - Игорь   Несколько замечаний об упомянутых выше источниках ...   22.12.2007 - 07:29
- - плав   Насчет источников - я не вполне согласен. Если чел...   22.12.2007 - 21:59
- - IvanKur   Здраствуйте. Я в своей практике использовал ...   24.12.2007 - 11:13
- - Игорь   В наших расчетах метод k-средних давал стабильные ...   24.12.2007 - 11:20
- - IvanKur   А как у вас с разбиением на кластеры, график аглом...   24.12.2007 - 17:35
- - плав   Во-первых, если использованы одинаковые показатели...   24.12.2007 - 21:50
- - IvanKur   После кластеризации мы проводили дискриминантный а...   24.12.2007 - 22:12
- - плав   Но это что-то странное. Дело в том, что дискиминан...   25.12.2007 - 11:03
- - Игорь   А мне кажется, что IvanKur частично прав. На пробл...   25.12.2007 - 16:04
- - DrgLena   Игорь прав. Именно такой алгоритм и должен быть ис...   25.12.2007 - 22:34
- - IvanKur   Здравствуйте. Очень рад что разговор завязался, но...   26.12.2007 - 08:30
- - S.Nadorov   Очень приятно, что тема развивается, правда в неск...   26.12.2007 - 10:20
- - Игорь   Любой статистический метод распознавания дает разб...   26.12.2007 - 11:01
- - DrgLena   Прежде всего нужно знать для чего вы выделяете кла...   26.12.2007 - 12:55
- - плав   Цитата(Игорь @ 25.12.2007 - 16:04) А...   26.12.2007 - 22:52
- - плав   Цитата(Игорь)А можно (теоретически) описать движен...   26.12.2007 - 23:10
- - DrgLena   Не думаю, что проще исследовать влияние каждого их...   27.12.2007 - 06:32
- - плав   Прошу прощения за занудство, но фраза "не лим...   27.12.2007 - 21:54
- - DrgLena   Да, мы не совсем понимаем друг друга. Но я попробу...   29.12.2007 - 02:44
- - плав   Почему я напираю на необходимость проверки на друг...   29.12.2007 - 11:51
- - DrgLena   Спасибо, все что вы пишете, совершенно верно, но в...   29.12.2007 - 18:27
- - плав   Ну тут, либо я прав, либо так делать можно. Есть л...   4.01.2008 - 17:39
- - DrgLena   1. Модератор всегда прав, слава модератору! 2....   4.01.2008 - 23:54
- - Lishe   Здравствуйте, случайно заглянул в топик, не стал в...   19.03.2013 - 22:54
- - p2004r   Цитата(Lishe @ 19.03.2013 - 22:54) З...   23.03.2013 - 13:14
- - Lishe   Цитата(p2004r @ 23.03.2013 - 14:14) ...   23.03.2013 - 14:37


Добавить ответ в эту темуОткрыть тему