Здравствуйте, гость ( Вход | Регистрация )
20.12.2007 - 00:45
Сообщение
#1
|
|
|
Группа: Пользователи Сообщений: 3 Регистрация: 20.12.2007 Пользователь №: 4636 |
Уважаемые форумчане!
Может быть кто-то использовал fuzzy clustering analysis в своей научно-исследовательской работе. Пожалуйста, поделитесь впечатлением. И знает ли кто-нибудь, в каких пакетах статистических программ реализован его алгоритм? Заранее спасибо. |
|
|
![]() |
![]() |
![]() |
29.12.2007 - 11:51
Сообщение
#2
|
|
|
Группа: Пользователи Сообщений: 1013 Регистрация: 4.10.2006 Пользователь №: 1933 |
Почему я напираю на необходимость проверки на другой группе. Классифицирование объектов (больных) проводилось по информации, которая содержалась в переменных описывавших иммунологические показатели. Соответственно, классифицировали больных, но на основании информации об иммунологических показателях. Однако измеренное значение показателя равно y=x+\epsilon, где х - истинное (не наблюдаемое) значение показателя, а \epsilon - случайная ошибка (ошибка измерения, индивидуальная вариабельность и т.д.). Случайная ошибка имеет (в многих моделях) нормальное распределение с параметрами (0,1) - т.е. среднее всех случайных значений равно нулю. Почти все статистические методы построены на том, что при наличии большого количества измерений случайные ошибки гасят друг друга и средня у оказывается равной средней х или близко к тому.
Теперь представьте себе следующую ситуацию, есть три наблюдения с \epsilon -1,+1,+0.5 Суммарное смещение равно 0,5 ввиду того, что последнее значение \epsilon не "гасится". Теперь, если мы удвоим количество наблюдений путем повтора каждого смещение увеличится до 1 (а стандратная ошибка снизится в sqrt(2) раз). Этот пример, как мне кажется, показывает, что дублирование наблюдений ни к чему хорошему не приводит. Соответственно, если мы использовали информацию об иммунологических показателях для определения кластеров в кластерном анализе, мы уже один раз взяли все наблюдения, включая их ошибку. Если теперь, в какой-то другой модели (например, в дискриминантном анализе), мы опять включим те же показатели, мы продублируем наблюдения вместе с ошибкой и реализуем ситуацию, описанную в примере выше. Соответственно, подход с использованием кластерного анализа абсолютно легитимный если исследователь определяет принадлежность к кластерам на основании некоего числа переменных, затем анализирует, например, прогноз в группах, образованных этими кластерами, но более не включает в модель переменные, на основании которых проводилась классификация. Исходные переменные в описательном виде, используются лишь для того, чтобы понять, на основании чего разделялись кластеры. И вот тут мы подходим к факторному анализу, к сожалению, ссылки на хорошие описания дать не смогу (на свои ссылаться не хочется под названием "хорошие", моя любимая книжка Jahn и Hale Die Faktoranalyse была издана 36 лет назат в ГДР и вряд ли легко доступна, но можно найти достаточно много публикаций в психологии (например, Step-By-Step Approach to Using the SAS system for Factor Analysis and Structured Equation Modelling)). на русском языке был ряд публикаций в Кардиологии и Тер.Архиве в начале 1990х. Однако общая идея достаточно простая. Мы устанавливаем, какие переменные связаны с данным фактором, а затем проводим анализ литературы (по патофизиологии, например) с целью выяснить, какая причина может лежать в основе всех этих факторов вместе. Например, ожирение, АГ, высокие ТГ - нарушенная толернатность к инсулину. Фкторный анализ объясняет, что наблюдаемые параметры являются производными от одного (двух, трех) более общих показателей, объяснить которые можно только путем анализа литературы и знаний физиологии и биохимии (психологии в других областях). Так что факторный анализ просто требует значительного анализа литературы после проведения статистического анализа в отличие от остальных методов, которые требуеют этого до. |
|
|
![]() |
![]() |
S.Nadorov Unsupervised fuzzy clustering (UFC) analysis 20.12.2007 - 00:45
Игорь То, о чем сказано в предыдущем посте, по-русски на... 20.12.2007 - 10:27
плав нечеткие методы кластерного анализа реализованы в ... 21.12.2007 - 11:49
S.Nadorov Спасибо за помощь.
Нашёл в сети книгу "Нечёт... 21.12.2007 - 20:53
Lishe Цитата(S.Nadorov @ 21.12.2007 - 21:5... 19.03.2013 - 23:00
Игорь Несколько замечаний об упомянутых выше источниках ... 22.12.2007 - 07:29
плав Насчет источников - я не вполне согласен. Если чел... 22.12.2007 - 21:59
IvanKur Здраствуйте.
Я в своей практике использовал ... 24.12.2007 - 11:13
Игорь В наших расчетах метод k-средних давал стабильные ... 24.12.2007 - 11:20
IvanKur А как у вас с разбиением на кластеры, график аглом... 24.12.2007 - 17:35
плав Во-первых, если использованы одинаковые показатели... 24.12.2007 - 21:50
IvanKur После кластеризации мы проводили дискриминантный а... 24.12.2007 - 22:12
плав Но это что-то странное. Дело в том, что дискиминан... 25.12.2007 - 11:03
Игорь А мне кажется, что IvanKur частично прав. На пробл... 25.12.2007 - 16:04
DrgLena Игорь прав. Именно такой алгоритм и должен быть ис... 25.12.2007 - 22:34
IvanKur Здравствуйте.
Очень рад что разговор завязался, но... 26.12.2007 - 08:30
S.Nadorov Очень приятно, что тема развивается, правда в неск... 26.12.2007 - 10:20
Игорь Любой статистический метод распознавания дает разб... 26.12.2007 - 11:01
DrgLena Прежде всего нужно знать для чего вы выделяете кла... 26.12.2007 - 12:55
плав Цитата(Игорь @ 25.12.2007 - 16:04) А... 26.12.2007 - 22:52
плав Цитата(Игорь)А можно (теоретически) описать движен... 26.12.2007 - 23:10
DrgLena Не думаю, что проще исследовать влияние каждого их... 27.12.2007 - 06:32
плав Прошу прощения за занудство, но фраза "не лим... 27.12.2007 - 21:54
DrgLena Да, мы не совсем понимаем друг друга. Но я попробу... 29.12.2007 - 02:44
DrgLena Спасибо, все что вы пишете, совершенно верно, но в... 29.12.2007 - 18:27
плав Ну тут, либо я прав, либо так делать можно. Есть л... 4.01.2008 - 17:39
DrgLena 1. Модератор всегда прав, слава модератору!
2.... 4.01.2008 - 23:54
Lishe Здравствуйте, случайно заглянул в топик, не стал в... 19.03.2013 - 22:54
p2004r Цитата(Lishe @ 19.03.2013 - 22:54) З... 23.03.2013 - 13:14
Lishe Цитата(p2004r @ 23.03.2013 - 14:14) ... 23.03.2013 - 14:37![]() ![]() |