Форум врачей-аспирантов

Здравствуйте, гость ( Вход | Регистрация )

 
Добавить ответ в эту темуОткрыть тему
> Алгоритмы k-mean и случайного леса
зоо
сообщение 20.02.2019 - 18:56
Сообщение #1





Группа: Пользователи
Сообщений: 24
Регистрация: 6.12.2017
Пользователь №: 30681



Подскажите, пожалуйста, пошагово, как работают Алгоритмы k-mean и случайного леса, без формул, ссылки на вики не нужны) сам умею вики смотреть, а там одни формулы
Интересует словесное описание работы этих методов

k-mean
шаг первый
вторый

случайный лес
шаг первый
второй
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 
passant
сообщение 20.02.2019 - 23:54
Сообщение #2





Группа: Пользователи
Сообщений: 231
Регистрация: 27.04.2016
Пользователь №: 28223



Цитата(зоо @ 20.02.2019 - 17:56) *
Подскажите, пожалуйста, пошагово, как работают Алгоритмы k-mean и случайного леса, без формул, ссылки на вики не нужны) сам умею вики смотреть, а там одни формулы
Интересует словесное описание работы этих методов

k-mean
шаг первый
вторый

случайный лес
шаг первый
второй


Ну, это примерно как просьба рассказать, как выполняют операцию по удалению аппендицита на словах и не употребляя медицинские термины.

Но если кратко - то и k-mean относится к алгоритмам кластеризации (обучение без учителя).
Первый шаг - в пространстве описания объектов вводится мера подобия (расстояния).
Второй шаг - берется множество объектов, задается желаемое количество кластеров. Назначаются произвольные точки в качестве центроидов кластеров.
Шаг третий. Как только набор центроидов становится доступен, каждый кластер обновляется таким образом, чтобы содержать точки ближайшие к данному центроиду.
Шаг четвертый. Как только набор кластеров становится доступен, каждый центроид пересчитывается, как среднее значение всех точек, принадлежащих данному кластеру.
Шаги 3 и 4 повторяются, пока кластеры и центроиды не перестанут изменяться.
Все проще простого, и без всякой математики.

Случайный лес. Относится к алгоритмам классификации (обучение с учителем).
По сути это совместное применение множества решающих деревьев.
Шаг первый. Выбирается подвыборка обучающей выборки и по ней строится дерево. При построении дерево для каждого узла случайно выбираются наборы признаков из которых по определенному критерию ищется лучший. Этот шаг повторяется многократно для различных подвыборок обучающей выборки. В итоге получаем множество деревьев.
Шаг второй. Берем полученное множество деревьев, берем объект классификации и пытаемся решить задачу каждым из деревьев. Ответы усредняем (обычно - в случае регрессии), или принимаем решение по принципу голосования (обычно - в задачах классификации).
Как вы просили - просто, словесно и без математики.

Но если честно, я не понимаю, если вы "сами умеете читать вики", то зачем вам еще словесное описание? Только не говорите, что хотите научиться этим "премудростям" без изучения математики и формул. Я же не хочу научиться удалять аппендицит по вашему описанию операции, без предварительно серьезного изучения анатомии, физиологии, диагностики и еще чего-то там, что составляет "таблицу умножения" медицины.

Сообщение отредактировал passant - 21.02.2019 - 00:05
Вернуться в начало страницы
 
+Ответить с цитированием данного сообщения
 

Добавить ответ в эту темуОткрыть тему