На сегодняшний день разработано более
На сегодняшний день разработано более сотни различных алгоритмов кластеризации. Некоторые, наиболее часто используемые, будут подробно описаны во втором разделе курса лекций.
Приведем краткую характеристику подходов к кластеризации [21].
Алгоритмы, основанные на разделении данных (Partitioning algorithms), в т.ч. итеративные:
разделение объектов на k кластеров;
итеративное перераспределение объектов для улучшения кластеризации.
Иерархические алгоритмы (Hierarchy algorithms):
агломерация: каждый объект первоначально является кластером, кластеры, соединяясь друг с другом, формируют больший кластер и т.д.
Методы, основанные на концентрации объектов (Density-based methods):
основаны на возможности соединения объектов;
игнорируют шумы, нахождение кластеров произвольной формы.
Грид-методы (Grid-based methods):
квантование объектов в грид-структуры.
Модельные методы (Model-based): использование модели для нахождения кластеров, наиболее соответствующих данным.