摘要:粒计算是模拟人脑多粒度认知模式处理复杂问题的方法论。模糊商空间理论作为粒计算的一种典型模型,将复杂问题渐进式粒化成为分层递阶的多粒度空间,从而实现层次化的求解。然而,面对海量高维数据,现有模糊商空间模型通过模糊相似关系构建多粒度空间的效率将大幅降低。一方面,模糊相似关系需要计算数据空间中任意两个对象之间的相似性,不利于处理体量大的数据集;另一方面,模糊相似关系包含大量冗余信息,导致后续步骤中存在大量的冗余计算。因此,本文基于2近邻模糊关系,提出了多粒度空间的快速构建方法,在保证面向下游分类任务时性能不下降的前提下,极大地提升了多粒度空间构建效率。首先,基于k近邻算法提出k近邻模糊关系,并分析证明其关键性质;然后,面向多粒度空间构建任务,对k近邻模糊关系进行参数分析,从理论上证明k取2时即可包含数据空间中全部有效信息;随后,定义了最近邻和次近邻两阶段的有效位置数,提出了模糊相似关系有效值和有效位置提取算法,提升了多粒度空间构建的效率。最后,通过在9个UCI数据集、3个UKB数据集、3个图像数据集和3个文本数据集上的相关实验,验证了该算法构建多粒度空间的高效性、正确性,以及面向下游分类任务的有效性、稳定性和显著性。
文章目录
1 引言
2 背景知识
2.1 模糊商空间
2.1.1 经典模糊商空间模型
2.1.2 基于有效值的模糊商空间模型
2.2 ■近邻
3 基于2近邻模糊关系的多粒度空间快速构建方法
3.1 基于2近邻模糊关系的多粒度空间快速构建方法
3.1.1 ■近邻模糊关系及其性质
3.1.2 ■近邻模糊关系及其性质
3.2 有效值和有效位置的提取
3.3 多粒度空间快速构建方法
3.3.1 算法设计
3.3.2 时间复杂度分析
3.3.3 实例分析
4 实验分析
4.1 构建多粒度空间的效率评估
4.2 构建多粒度空间的正确性评估
4.3 面向分类任务的有效性评估
4.4 面向分类任务的显著性评估
5 结论