摘要:基于相互最近邻的密度峰聚类算法(DenMune) 通过相互最近邻计算数据点的局部密度,是一种有效的聚类手段。但该算法存在构建聚类骨架不合理的问题,在分配弱点时采用硬投票策略,易产生错误。因此提出一种新的基于反向最近邻的密度估计聚类算法(RNN-DEC)。该算法引入反向最近邻来计算数据点的局部密度,将数据点分成强点、弱点和噪音点。使用强点构建聚类算法的骨架,通过软投票的方式将弱点分配到与其相似度最高的簇中去。最后,提出了一种基于反向最近邻的簇融合算法,将相似度高的子簇融合,得到最终的聚类结果。实验结果表明,在一些合成数据集和UCI真实数据集上,相比较于其它经典算法,该算法具有更好的聚类效果。
文章目录
1 DenMune算法与分析
1.1 DenMune算法
1.2 DenMune算法分析
2 RNN-DEC算法
2.1 数据划分
2.2 构建聚类骨架
2.3 分配数据对象
2.4 子簇融合策略
2.5 算法复杂度
3 实验结果
3.1 实验数据
3.2 参数设置
3.3 人工数据集实验结果分析
3.4 UCI数据集实验结果分析
3.5 参数敏感性分析
4 总结与展望