Unsupervised fuzzy clustering (UFC) analysis - Форум врачей-аспирантов

Unsupervised fuzzy clustering (UFC) analysis, методы кластерного анализа

S.Nadorov Просмотр профиля	20.12.2007 - 00:45 Сообщение #1
Группа: Пользователи Сообщений: 3 Регистрация: 20.12.2007 Пользователь №: 4636	Уважаемые форумчане! Может быть кто-то использовал fuzzy clustering analysis в своей научно-исследовательской работе. Пожалуйста, поделитесь впечатлением. И знает ли кто-нибудь, в каких пакетах статистических программ реализован его алгоритм? Заранее спасибо.

Ответов

плав Просмотр профиля	29.12.2007 - 11:51 Сообщение #2
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933	Почему я напираю на необходимость проверки на другой группе. Классифицирование объектов (больных) проводилось по информации, которая содержалась в переменных описывавших иммунологические показатели. Соответственно, классифицировали больных, но на основании информации об иммунологических показателях. Однако измеренное значение показателя равно y=x+\epsilon, где х - истинное (не наблюдаемое) значение показателя, а \epsilon - случайная ошибка (ошибка измерения, индивидуальная вариабельность и т.д.). Случайная ошибка имеет (в многих моделях) нормальное распределение с параметрами (0,1) - т.е. среднее всех случайных значений равно нулю. Почти все статистические методы построены на том, что при наличии большого количества измерений случайные ошибки гасят друг друга и средня у оказывается равной средней х или близко к тому. Теперь представьте себе следующую ситуацию, есть три наблюдения с \epsilon -1,+1,+0.5 Суммарное смещение равно 0,5 ввиду того, что последнее значение \epsilon не "гасится". Теперь, если мы удвоим количество наблюдений путем повтора каждого смещение увеличится до 1 (а стандратная ошибка снизится в sqrt(2) раз). Этот пример, как мне кажется, показывает, что дублирование наблюдений ни к чему хорошему не приводит. Соответственно, если мы использовали информацию об иммунологических показателях для определения кластеров в кластерном анализе, мы уже один раз взяли все наблюдения, включая их ошибку. Если теперь, в какой-то другой модели (например, в дискриминантном анализе), мы опять включим те же показатели, мы продублируем наблюдения вместе с ошибкой и реализуем ситуацию, описанную в примере выше. Соответственно, подход с использованием кластерного анализа абсолютно легитимный если исследователь определяет принадлежность к кластерам на основании некоего числа переменных, затем анализирует, например, прогноз в группах, образованных этими кластерами, но более не включает в модель переменные, на основании которых проводилась классификация. Исходные переменные в описательном виде, используются лишь для того, чтобы понять, на основании чего разделялись кластеры. И вот тут мы подходим к факторному анализу, к сожалению, ссылки на хорошие описания дать не смогу (на свои ссылаться не хочется под названием "хорошие", моя любимая книжка Jahn и Hale Die Faktoranalyse была издана 36 лет назат в ГДР и вряд ли легко доступна, но можно найти достаточно много публикаций в психологии (например, Step-By-Step Approach to Using the SAS system for Factor Analysis and Structured Equation Modelling)). на русском языке был ряд публикаций в Кардиологии и Тер.Архиве в начале 1990х. Однако общая идея достаточно простая. Мы устанавливаем, какие переменные связаны с данным фактором, а затем проводим анализ литературы (по патофизиологии, например) с целью выяснить, какая причина может лежать в основе всех этих факторов вместе. Например, ожирение, АГ, высокие ТГ - нарушенная толернатность к инсулину. Фкторный анализ объясняет, что наблюдаемые параметры являются производными от одного (двух, трех) более общих показателей, объяснить которые можно только путем анализа литературы и знаний физиологии и биохимии (психологии в других областях). Так что факторный анализ просто требует значительного анализа литературы после проведения статистического анализа в отличие от остальных методов, которые требуеют этого до.

Сообщений в этой теме

S.Nadorov Unsupervised fuzzy clustering (UFC) analysis 20.12.2007 - 00:45

Игорь То, о чем сказано в предыдущем посте, по-русски на... 20.12.2007 - 10:27

плав нечеткие методы кластерного анализа реализованы в ... 21.12.2007 - 11:49

S.Nadorov Спасибо за помощь. Нашёл в сети книгу "Нечёт... 21.12.2007 - 20:53

Lishe Цитата(S.Nadorov @ 21.12.2007 - 21:5... 19.03.2013 - 23:00

Игорь Несколько замечаний об упомянутых выше источниках ... 22.12.2007 - 07:29

плав Насчет источников - я не вполне согласен. Если чел... 22.12.2007 - 21:59

IvanKur Здраствуйте. Я в своей практике использовал ... 24.12.2007 - 11:13

Игорь В наших расчетах метод k-средних давал стабильные ... 24.12.2007 - 11:20

IvanKur А как у вас с разбиением на кластеры, график аглом... 24.12.2007 - 17:35

плав Во-первых, если использованы одинаковые показатели... 24.12.2007 - 21:50

IvanKur После кластеризации мы проводили дискриминантный а... 24.12.2007 - 22:12

плав Но это что-то странное. Дело в том, что дискиминан... 25.12.2007 - 11:03

Игорь А мне кажется, что IvanKur частично прав. На пробл... 25.12.2007 - 16:04

DrgLena Игорь прав. Именно такой алгоритм и должен быть ис... 25.12.2007 - 22:34

IvanKur Здравствуйте. Очень рад что разговор завязался, но... 26.12.2007 - 08:30

S.Nadorov Очень приятно, что тема развивается, правда в неск... 26.12.2007 - 10:20

Игорь Любой статистический метод распознавания дает разб... 26.12.2007 - 11:01

DrgLena Прежде всего нужно знать для чего вы выделяете кла... 26.12.2007 - 12:55

плав Цитата(Игорь @ 25.12.2007 - 16:04) А... 26.12.2007 - 22:52

плав Цитата(Игорь)А можно (теоретически) описать движен... 26.12.2007 - 23:10

DrgLena Не думаю, что проще исследовать влияние каждого их... 27.12.2007 - 06:32

плав Прошу прощения за занудство, но фраза "не лим... 27.12.2007 - 21:54

DrgLena Да, мы не совсем понимаем друг друга. Но я попробу... 29.12.2007 - 02:44

плав Почему я напираю на необходимость проверки на друг... 29.12.2007 - 11:51

DrgLena Спасибо, все что вы пишете, совершенно верно, но в... 29.12.2007 - 18:27

плав Ну тут, либо я прав, либо так делать можно. Есть л... 4.01.2008 - 17:39

DrgLena 1. Модератор всегда прав, слава модератору! 2.... 4.01.2008 - 23:54

Lishe Здравствуйте, случайно заглянул в топик, не стал в... 19.03.2013 - 22:54

p2004r Цитата(Lishe @ 19.03.2013 - 22:54) З... 23.03.2013 - 13:14

Lishe Цитата(p2004r @ 23.03.2013 - 14:14) ... 23.03.2013 - 14:37

« Предыдущая тема · Медицинская статистика · Следующая тема »