族谱和簇谱是两种不同的聚类算法。
族谱(Hierarchical Clustering)是一种基于树形结构的聚类方法,它将样本从单个点逐步合并到越来越大的集群(cluster)中,从而形成一棵树状结构。这个过程可以分为两种方式:自底向上(Agglomerative)和自顶向下(Divisive)。在自底向上方式中,每个样本一开始都被当做一个单独的集群,每次迭代都会将距离最近的两个集群合并成一个新的大集群;在自顶向下方式中,则是将初始所有样本看作一个大集群,每次迭代都会将当前元素分裂成不同的子集。相反,簇谱(K-means Clustering)则是基于设定聚类数目K的优化算法。该算法试图将所有样本分成K个具有最小平均距离误差的非重叠集群。首先选择K个随机点作为质心,接着通过计算每个点与质心之间的距离,并把其划分至与之最近的集群。这个过程循环进行,直到所有点标记完成后再重新计算各个质心位置以继续迭代。总而言之,族谱更加注重分析数据点之间相似度来建立树形结构;而簇谱则更注重确定具体数量及位置来划分不同的数据集。