Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Форум врачей-аспирантов _ Медицинская статистика _ Алгоритмы k-mean и случайного леса

Автор: зоо 20.02.2019 - 18:56

Подскажите, пожалуйста, пошагово, как работают Алгоритмы k-mean и случайного леса, без формул, ссылки на вики не нужны) сам умею вики смотреть, а там одни формулы
Интересует словесное описание работы этих методов

k-mean
шаг первый
вторый

случайный лес
шаг первый
второй

Автор: passant 20.02.2019 - 23:54

Цитата(зоо @ 20.02.2019 - 17:56)

Ну, это примерно как просьба рассказать, как выполняют операцию по удалению аппендицита на словах и не употребляя медицинские термины.

Но если кратко - то и k-mean относится к алгоритмам кластеризации (обучение без учителя).
Первый шаг - в пространстве описания объектов вводится мера подобия (расстояния).
Второй шаг - берется множество объектов, задается желаемое количество кластеров. Назначаются произвольные точки в качестве центроидов кластеров.
Шаг третий. Как только набор центроидов становится доступен, каждый кластер обновляется таким образом, чтобы содержать точки ближайшие к данному центроиду.
Шаг четвертый. Как только набор кластеров становится доступен, каждый центроид пересчитывается, как среднее значение всех точек, принадлежащих данному кластеру.
Шаги 3 и 4 повторяются, пока кластеры и центроиды не перестанут изменяться.
Все проще простого, и без всякой математики.

Случайный лес. Относится к алгоритмам классификации (обучение с учителем).
По сути это совместное применение множества решающих деревьев.
Шаг первый. Выбирается подвыборка обучающей выборки и по ней строится дерево. При построении дерево для каждого узла случайно выбираются наборы признаков из которых по определенному критерию ищется лучший. Этот шаг повторяется многократно для различных подвыборок обучающей выборки. В итоге получаем множество деревьев.
Шаг второй. Берем полученное множество деревьев, берем объект классификации и пытаемся решить задачу каждым из деревьев. Ответы усредняем (обычно - в случае регрессии), или принимаем решение по принципу голосования (обычно - в задачах классификации).
Как вы просили - просто, словесно и без математики.

Но если честно, я не понимаю, если вы "сами умеете читать вики", то зачем вам еще словесное описание? Только не говорите, что хотите научиться этим "премудростям" без изучения математики и формул. Я же не хочу научиться удалять аппендицит по вашему описанию операции, без предварительно серьезного изучения анатомии, физиологии, диагностики и еще чего-то там, что составляет "таблицу умножения" медицины.