[机器学习]二分k-means算法详解

    xiaoxiao2021-03-26  41

    二分k-means算法

      二分k-means算法是分层聚类(Hierarchical clustering)的一种,分层聚类是聚类分析中常用的方法。 分层聚类的策略一般有两种:

    聚合。这是一种自底向上的方法,每一个观察者初始化本身为一类,然后两两结合 分裂。这是一种自顶向下的方法,所有观察者初始化为一类,然后递归地分裂它们

      二分k-means算法是分裂法的一种。

    1 二分k-means的步骤

      二分k-means算法是k-means算法的改进算法,相比k-means算法,它有如下优点:

    二分k-means算法可以加速k-means算法的执行速度,因为它的相似度计算少了 能够克服k-means收敛于局部最小的缺点

      二分k-means算法的一般流程如下所示:

    (1)把所有数据初始化为一个簇,将这个簇分为两个簇。

    (2)选择满足条件的可以分解的簇。选择条件综合考虑簇的元素个数以及聚类代价(也就是误差平方和SSE),误

    图解AI 认证博客专家 数据分析 机器学习 深度学习 致力于:机器学习、深度学习、数据分析、算法、架构、C/C++、Rust、HTML5/webApp、Go、Python、Lua...
    转载请注明原文地址: https://ju.6miu.com/read-661702.html

    最新回复(0)