近日,计算机与信息学院PRiSE(Pattern Recognition and Intelligence Software Engineering)研究团队23级硕士研究生吴童在信息科学领域国际期刊《Information Sciences》(中科院二区)发表题为“Tensorized diversity and consistency with Laplacian manifold for multi-view clustering”的研究成果,安徽工程大学为论文第一署名单位。
针对现有多视图聚类方法通常将多样性与一致性视为相互对立属性、忽略二者内在联系,并且未能充分利用多视图完整信息的问题,该论文提出了融合拉普拉斯流形的张量化多样性与一致性多视图聚类方法(TDCLM)。该方法从原始数据的自表达性质出发,同时学习多样性图和一致性图,首次引入拉普拉斯流形约束以增强多样性与一致性之间的关系,并在联合优化过程中促进二者协同建模。进一步地,论文创新性地将多样性图和一致性图组合为张量,并施加张量核范数约束,从而捕获多视图之间的完整高阶信息,实现多样性图与一致性图的相互学习和相互增强。最终,论文采用增广拉格朗日乘子法构建统一优化框架。多组数据集实验验证了获取完整多视图信息以及有效利用多样性和一致性的重要性,该方法相较现有先进算法取得了更优性能,最高提升达25.85%。
研究主要创新点:1.提出了一种融合拉普拉斯流形的张量化多样性与一致性多视图聚类方法,在学习多样性图和一致性图的同时,利用拉普拉斯流形约束增强二者之间的内在联系;2.创新性地将多样性图和一致性图组合为张量,并施加张量核范数约束,既充分挖掘多视图之间的完整高阶信息,又实现了多样性图与一致性图之间的相互学习和相互增强;3.将多样性建模、一致性建模、流形约束和低秩张量约束整合到统一模型中,在多个数据集实验中取得优于现有先进方法的聚类性能。

图1 TDCLM 算法示意图。该方法联合学习多样性图与一致性图,并通过拉普拉斯流形约束和张量低秩约束实现多视图信息融合。
论文原文链接:https://doi.org/10.1016/j.ins.2024.121575
