二分k-means算法是分层聚类(Hierarchical clustering)的一种,分层聚类是聚类分析中常用的方法。 分层聚类的策略一般有两种:
聚合。这是一种自底向上的方法,每一个观察者初始化本身为一类,然后两两结合 分裂。这是一种自顶向下的方法,所有观察者初始化为一类,然后递归地分裂它们二分k-means算法是分裂法的一种。
二分k-means算法是k-means算法的改进算法,相比k-means算法,它有如下优点:
二分k-means算法可以加速k-means算法的执行速度,因为它的相似度计算少了 能够克服k-means收敛于局部最小的缺点二分k-means算法的一般流程如下所示:
(1)把所有数据初始化为一个簇,将这个簇分为两个簇。
(2)选择满足条件的可以分解的簇。选择条件综合考虑簇的元素个数以及聚类代价(也就是误差平方和SSE),误
图解AI 认证博客专家 数据分析 机器学习 深度学习 致力于:机器学习、深度学习、数据分析、算法、架构、C/C++、Rust、HTML5/webApp、Go、Python、Lua...