收藏 分销(赏)

基于稀疏一致图分解的鲁棒多视图聚类算法.pdf

上传人:自信****多点 文档编号:2356458 上传时间:2024-05-28 格式:PDF 页数:11 大小:1.96MB
下载 相关 举报
基于稀疏一致图分解的鲁棒多视图聚类算法.pdf_第1页
第1页 / 共11页
基于稀疏一致图分解的鲁棒多视图聚类算法.pdf_第2页
第2页 / 共11页
基于稀疏一致图分解的鲁棒多视图聚类算法.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、浙江大学学报(理学版)Journal of Zhejiang University(Science Edition)http:/ 50 卷第 5 期2023 年 9月Vol.50 No.5Sept.2023 基于稀疏一致图分解的鲁棒多视图聚类算法耿莉,王长鹏*(长安大学 理学院,陕西 西安 710064)摘要:由于数据形式日益复杂,陆续涌现了大量多视图聚类算法。但现有方法存在计算复杂度较高、需要额外的后续处理步骤、构造的相似图非最优等缺点。基于此,首先提出一种基于稀疏一致图分解的单视图聚类算法,然后将其扩展为多视图聚类算法,考虑不同视图对最终结果的贡献不同,对每个视图分配适当的权重,同时利用L

2、2.1范数,得到性能更优的一致图,在一致图基础上学习非负表示矩阵,经交替迭代得到聚类结果。最后在多个数据集上进行比较实验,验证了该算法的有效性。关键词:多视图聚类;L2,1范数;一致图分解中图分类号:TP 181 文献标志码:A 文章编号:10089497(2023)0556911GENG Li,WANG Changpeng(School of Science,Changan University,Xian 710064,China)Robust multi-view clustering algorithm based on sparse consensus graph decomposit

3、ion.Journal of Zhejiang University(Science Edition),2023,50(5):569579Abstract:Due to the increasing complexity of data form,multi-view clustering algorithms emerge one after another.The main disadvantages of existing methods include:the computational complexity of these methods is high;the final clu

4、stering involves additional processing steps;the similarity graph constructed may not be the optimal graph.In order to solve the above problems,a clustering algorithm based on sparse consensus graph decomposition is proposed.The algorithm is first tested on single-view data,and then extends from sin

5、gle-view data to multi-view data.The algorithm takes into account different contributions of different views to the final result by giving each view appropriate weight,at the same time,makes use of the L2,1 norm to obtain the consensus graph with better performance,learns the non-negative representa

6、tion matrix on the basis of the consensus graph,and reveals the cluster result directly after alternation iteration.Finally,an update iterative algorithm is proposed and tested on a large number of data sets to verify the effectiveness of the algorithm.Key Words:multi-view clustering;L2,1 norm;conse

7、nsus graph decomposition聚类是机器学习1-2、数据挖掘等领域的基本内容。随着数据结构日益复杂,对于聚类算法的研究也不仅限于单视图,逐渐转向多视图。多视图聚类被广泛应用于轨迹线分析、医学诊断、异常检测等领域。近年来,基于图学习的多视图聚类算法研究取得了令人满意的进展3-10。NIE 等3为了去除超参数,提出了自适应加权的多视图聚类算法。WANG等4提出了一种更简洁、高效的方法,通过自加权每个图矩阵,获得更优的融合图矩阵,再施加拉普拉斯秩约束控制融合图的连通分量,得到聚类结果。ZHAN 等5通过哈达玛积将不同视图直接融合,保DOI:10.3785/j.issn.1008-9

8、497.2023.05.008收稿日期:20220418;修回日期:20221216;接受日期:20221219;出版日期:20230925.基金项目:国家自然科学基金青年项目(12001057);长安大学中央高校基本科研业务费专项资金资助项目(300102122101);陕西省重点产业创新链项目(2020ZDLGY09-09);陕西省自然科学基础研究计划项目(2020JQ-346).作 者 简 介:耿 莉(1998),ORCID:https:/orcid.org/0000-0002-8051-5236,女,硕 士 研 究 生,主 要 从 事 机 器 学 习 研 究,E-mail:.*通信作者

9、,ORCID:https:/orcid.org/0000-0001-8603-9704,E-mail:.浙 江 大 学 学 报(理学版)第 50 卷持其内在结构,学习到的全局图也尽可能接近得到的 哈 达 玛 积,最 后 通 过 全 局 图 得 到 聚 类 结 果。ZHAN 等6利用定义的代价函数最小化不同视图的差异,考虑视图兼容性,得到了具有拉普拉斯秩约束的一致图。HUANG 等7考虑视图的多样性,将自加权学习融合图的过程与多样性度量整合为统一框架,得到了具有确定分量的融合图。WU 等8提出了同时考虑视图权重与特征权重的无参数模型。MA 等9将多图学习、权重学习、一致图学习与聚类集成为统一框架

10、。WANG 等10将预定义的图用于指导具有秩约束的稀疏表示,以更好地学习相似矩阵。基于矩阵分解的方法可以显著降低计算复杂度,将原始的高维数据投影到低维空间,实现降维,但其聚类性能有待提高,而且需进行后续处理,如k-means,才能得到聚类结果。在传统非负矩阵分解的基础上,HUANG 等11提出了自适应图正则化非负矩阵分解,在自适应学习相似图的同时进行矩阵分解。近年来,提出了许多基于非负矩阵分解(NMF)的多视图聚类方法,在一定程度上提升了聚类性能。为了更全面、更综合地挖掘每个视图的数据信息,WANG 等12提出了多样性非负矩阵分解(diverse NMF,DiNMF)方法,该方法关注视图的多样

11、性,希望每个视图的表示矩阵尽可能正交,将每个视图特有的属性整合到模型中,同时加入了避免过拟合的项;进一步,在 DiNMF 的基础上加入保持局部几何结构的项,提出了局部保持的多样性非负矩阵分解(locality preserved DiNMF,LP-DiNMF)模型,以达到更好的聚类性能。LIANG 等13进一步改进了模型,通过施加基矩阵与表示矩阵正交性约束,使基矩阵列向量更加独立,而且考虑了每个视图的多样性。YANG 等14提出的基于三因子分解的均匀分布非负矩阵分解模型,减小了各视图的分布差异,获得了更好的一致表示矩阵。ZHAO 等15将视图的表示矩阵分为相关部分与不相关部分,每部分对应各自的

12、基矩阵,通过L2,1范数实现基矩阵稀疏,同时在模型中加入保持局部几何结构的项。SHI等16对相似矩阵进行图重构,通过施加非负约束获得聚类结果,提高了计算效率。基 于 此,提 出 基 于 稀 疏 一 致 图 分 解(sparse consensus graph factorization,SCGF)的聚类算法。先在单视图上初步建立模型,再推广至多视图,同时考虑视图对应的权重,利用L2,1范数获得结构化稀疏的一致图,并对其进行分解,通过非负表示矩阵得到聚类结果。利用增广拉格朗日乘子(augmented Lagrangian multiplier,ALM)方法将问题等价转化为易于求解的形式17,提出

13、具体优化算法,并在数据集上验证了所提出的基于 SCGF的单视图聚类算法(SCGFs)和 基 于 SCGF 的 多 视 图 聚 类 算 法(SCGFm)的有效性。1相关工作主要介绍传统的基于图的聚类方法以及非负嵌入 与 谱 嵌 入(nonnegative embedding and spectral embedding,NESE)模型。模型中涉及的符号说明如表 1 所示。若X Rn d,则Tr(X)表示矩阵X的迹,XT表示矩阵X的转置,X的F范数和L2,1范数分别 为XF=i=1nj=1dx2ij和X2,1=i=1nj=1dx2ij,X 0表 示X中 所 有 元 素 均 非 负。对 于 向 量m

14、 Rn,m2=i=1nm2i。传统的基于图的聚类方法,对于一个数据矩阵X Rn d,n表示样本数,d表示维数,X的每行表示一个样本,首先,度量第i个样本与第j个样本的相似性sij,得到一致图相似矩阵S Rn n;其次,计算相 应 的 度 矩 阵D=ST+S2与 拉 普 拉 斯 矩 阵L=D-S,再 对L进 行 特 征 分 解,得 到 嵌 入 矩 阵F Rn c;最后,通过额外的处理步骤,如 k-means,得到聚类结果。NESE模型18提出了一种分解相似矩阵的新思想,通过分解得到的非负矩阵,得到聚类结果。主要解决问题min F(v)cv=1,Hv=1cP(v)-HF(v)F,其中,P(v)cv

15、=1表示构造的c个相似矩阵,F(v)表示表 1符号说明Table 1Symbols explanations符号GvSDLPQE说明第v个视图的图矩阵一致图相似矩阵度矩阵拉普拉斯矩阵非负矩阵正交矩阵辅助变量符号Innvdvcwv说明单位矩阵数据样本数视图总数第v个视图的特征维数聚类数第v个视图的权重570耿莉,等:基于稀疏一致图分解的鲁棒多视图聚类算法第 5期第v个视图的谱嵌入矩阵,(F(v)T)F(v)=I,H 0表示一致非负嵌入矩阵,用于得到聚类结果。NESE 模型可避免传统方法所需的额外处理步骤,解决了特征分解导致的计算复杂度高的问题。2模型建立为更好地说明模型的有效性,首先提出 SCG

16、Fs算法,然后将其推广至 SCGFm,算法流程见图 1。2.1基于稀疏一致图分解的单视图聚类模型首先,基于 NESE 算法对S进行分解,对应于S的拉普拉斯矩阵,LS=D-(S+ST)/2,其中D为度矩阵,第i个对角元素为Dii=j(Sij+Sji)/2,可得minS-PQT2F,(1)其中,P为非负矩阵,Q为正交矩阵,QTQ=I。通过学习非负矩阵直接获得聚类结果,此过程可降低多视图聚类算法的计算复杂度。其次,为使学习到的相似矩阵更优,对给定的图矩阵G19施加L2,1范数,可得minS-G2,1。(2)相比于F范数,L2,1范数20可以避免因平方项大而受异常值影响,也可以降低噪声的影响,同时使得

17、学习到的相似矩阵结构化稀疏,具有更好的鲁棒性,对聚类过程更有利。由式(1)和式(2),可得 SCGFs模型:minS,P,QS-G2,1+S-PQT2F,s.t.S 0,P 0,QTQ=I,(3)其中,第 1 项用于学习更好的结构化稀疏的相似矩阵S,第 2 项可视为对S的分解重构过程,非负矩阵P Rn c为学习到的表示矩阵,选取每行中的最大元素,其对应的列标即为第i个样本的聚类结果。由于第 1 项和第 2 项均与S有关,且第 1 项涉及L2,1范数,因此求解复杂度较高,而 ALM 方法可收敛于问题的最优解,引入辅助变量E=S-G,可得式(3)的等价形式:minE,S,P,QE2,1+S-PQT

18、2F+2 E-S+G+2F,s.t.S 0,P 0,QTQ=I,(4)其中,R1 1为正则化系数,Rn n为惩罚参数,用于衡量目标变量与辅助变量的误差。2.2优化采用交替优化迭代策略求解式(4),即在对一个变量进行优化时,固定其余变量。2.2.1更新P固定E,S,Q,仅考虑变量P,式(4)可转化为minP 0S-PQT2F,(5)因为Q为正交矩阵,且满足QTQ=I,所以式(5)等价于minP 0SQ-P2F,(6)解为P=max(SQ,0)。(7)图 1SCGFm 流程Fig.1Flow chart of SCGFm571浙 江 大 学 学 报(理学版)第 50 卷2.2.2更新Q在式(4)中

19、,与Q相关的部分为minQTQ=IS-PQT2F,(8)转化为矩阵的迹,即minQTQ=ITr(STS-2STPQT+PTP),(9)省 略 与Q无 关 的 项,令F=STP,结 合 迹 的 性 质Tr(ABT)=Tr(BTA),可得maxQTQ=ITr(QTF)。(10)定理 1当F=STP且F的奇异值分解(SVD)为F=UVT时,式(10)的 最 优 解 为Q=U I;0 VT,其中,U Rn n,Rn c,V Rc c。证明由F=UVT,可得Tr(QTF)=Tr(QTUVT)=Tr(VTQTU)=Tr(Z)=i=1ciizii,(11)其中,Z=VTQTU Rc n,ii和zii分别为矩

20、阵和Z的第(i,i)个元素,-1 zii 1,ii 0为矩阵F的奇异值。进一步,验证ZZT=I,所以Tr(QTF)=i=1ciiziii=1cii,(12)显 然,当zii=1时,等 号 成 立,当Z=I;0 时,Tr(QTF)达 最 大 值。由 于Z=VTQTU,可 得 式(10)的最优解为Q=UZTVT=U I;0 VT。(13)2.2.3更新E固定其余变量,求解minEE2,1+2 E-S+G+2F,(14)令B=S-G-,可得minEE2,1+2E-B2F。(15)为求解式(15),引入引理 121。引理 1给定矩阵W=W1,W2,Wn和正标量,可得min12X-W2F+X2,1(16

21、)的最优解为X,且X的第i列为xi=Wi-WiWi,Wi2,0,其他,(17)从而可得式(15)的解,且解的第 i列为ei=()1-1bibi,1 1为学习率,用于控制收敛速度,越大,收敛速度越快,但过大会导致聚类性能变差。综上所述,可得求解式(4)的流程。算法 1输入图矩阵G,参数和。输 出 第i个 样 本 的 聚 类 结 果resulti=arg max1 j cPij。(1)初始化:S=G。(2)重复:通过式(7)更新P;通过式(13)更新Q;通过式(18)更新E;通过式(24)更新S;572耿莉,等:基于稀疏一致图分解的鲁棒多视图聚类算法第 5期通过式(25)更新;通过式(26)更新。

22、(3)直至收敛:obj(t)-obj(t+1)10-5,obj(t)为第t次迭代的目标函数值。2.3基于稀疏一致图分解的多视图聚类模型采用相同的方法使一致图相似矩阵S结构化稀疏,可得SCGFm模型:minS,P,Q,w S-v=1nvwvGv2,1+S-PQT2F,s.t.S 0,vwv=1,wv 0,P 0,QTQ=I,(27)引入辅助变量E=S-v=1nvwvGv,采用 ALM 方法,可得式(27)的等价形式为minE,S,P,Q,wE2,1+S-PQT2F+2 E-S+v=1nvwvGv+2F,s.t.S0,vwv=1,wv0,P0,QTQ=I。(28)考虑多视图数据中每个视图的贡献不同

23、,为了避免出现超参数情况22,需合理分配每个视图的权重,为此提出自适应更新权重的优化算法。2.4优化变量P,Q,的更新过程与算法 1相同。2.4.1更新E将式(28)转化为minEE2,1+2 E-S+v=1nvwvGv+2F,(29)令D=S-v=1nvGv-,则minEE2,1+2E-D2F,(30)由引理 1,得ei=()1-1didi,1di20,其他。,(31)2.4.2更新S在式(28)中,与S相关的部分为minSS-PQT2F+2 E-S+v=1nvwvGv+2F,(32)令J=E+v=1nvGv+,则minSS-PQT2F+2J-S2F,(33)展开并化简,得S=max()2P

24、QT+J2+,0。(34)2.4.3更新w固定其余变量,将式(28)转化为minw2 E-S+v=1nvwvGv+2F,(35)令M=E-S+,有minw2 M+v=1nvwvGv2F。(36)将 矩 阵 转 化 为 向 量 形 式23,将M Rn n转 化 为m Rn2 1,将 w1,w2,wnv转化为w Rnv 1,将G1,G2,Gnv转化为G Rn2 nv,即minw2m+Gw22,(37)展开,得minw2(wTGTGw+2mTGw),(38)即为易于求解的二次规划(QP)问题24。2.4.4更新=+()E-S-v=1nvGv。(39)综上所述,可得求解式(28)的流程。算法2输入图矩

25、阵G1,G2,Gnv,参数和。输 出 第i个 样 本 的 聚 类 结 果resulti=arg max1 j cPij。(1)初始化:S=v=1nvwvGv,wv=1nv。(2)重复:通过式(7)更新P;通过式(13)更新Q;通过式(31)更新E;通过式(34)更新S;通过式(38)更新w;通过式(39)更新;通过式(26)更新。(3)直至收敛:obj(t)-obj(t+1)10-5,obj(t)为第t次迭代的目标函数值。573浙 江 大 学 学 报(理学版)第 50 卷3实 验3.1单视图聚类实验为初步验证 SCGFs模型的有效性,在 3 个广泛使用的数据集上进行实验,并将聚类结果与现有方法

26、进行比较。3.1.1数据集描述选 用 Wdbc、Abalone、K1a 数 据 集,具 体 描 述见表 2。3.1.2评价指标采用精度(accuracy,ACC)、纯度(Purity)指标评价单视图聚类性能。ACC=1ni=1n(ri,map(si),(40)其中,n个样本点属于c类,ri表示第i个样本的真实标签,si表示第 i个样本的预测标签,(,)表示达拉克(Dirac delta)函数,map()表示最优的映射函数使用了 Kuhn-Munkres算法25。Purity为正确聚类的样本与总样本的比,计算式为Purity=1ni=1cmax1 j c|map(ri)si。(41)ACC和 P

27、urity越大,聚类性能越好。3.1.3实验结果将 SCGFs 与现有的非负矩阵分解(NMF)26、主成分分析(PCA)27、局部学习正则化的非负矩阵 分 解(LLNMF)28、图 正 则 化 的 非 负 矩 阵 分 解(GNMF)29、鲁 棒 流 形 非 负 矩 阵 分 解(RMNMF)30、自适应邻概念分解(CFANs)31和自适应邻非负矩阵分解(NMFAN)14算法(用原文的参数设置和代码)进行比较,结果见表 3,其中加粗项表示最优结果。从 表 3 中 可 以 看 出,SCGFs 算 法 在 Wdbc 和Abalone 数据集上的 ACC 和 Purity 均最高。相较于 NMFAN 算

28、 法,SCGFs 在 Wdbc 数 据 集 上 的ACC 和 Purity 均提高 3%以上;在 Abalone 数据集上的 ACC 提高近 2%,Purity 提高 2%以上;在 K1a数 据 集 上 的 ACC 上 提 高 17%,但 Purity 低 于NMFAN 算法,这体现了 SCGFs 算法的平均性能较优。此外,与 NMF 和 GNMF 算法相比,SCGFs算法显示出更优的性能。3.1.4参数敏感性分析分析 SCGFs 模型的参数,观察不同下 ACC的变化,探究对聚类结果的影响,从而更准确地分配权重。SCGFs模型对的敏感性分析见图 2。由图 2 可知,当为 1104时,ACC 相

29、对较为稳定,当=1和=10时性能更优。3.2多视图聚类实验3.2.1数据集描述选用 BBCSport、100leaves、ORL、Yale、MSRCV1共 5个多视图数据集,具体描述见表 4。3.2.2评价指标为更好地展示 SCGFm算法的优势,在单视图实表 2单视图数据集描述Table 2The datasets description of single view数据集WdbcAbaloneK1a样本数5692 2822 340特征数3081 326聚类数246表 3单视图聚类性能比较Table 3Clustering performance comparison of single vi

30、ew算法NMFPCALLNMFGNMFRMNMFCFANsNMFANSCGFsACCWdbc数据集0.848 20.854 10.597 90.853 20.689 20.837 50.854 10.889 3Abalone数据集0.375 40.358 90.352 80.360 30.319 60.310 10.388 10.405 8K1a数据集0.308 80.291 00.270 90.304 90.303 00.319 60.321 70.492 3PurityWdbc数据集0.848 20.854 10.655 40.853 20.689 20.837 50.854 10.889

31、 3Abalone数据集0.380 30.369 40.357 90.370 80.325 20.325 30.389 40.410 6K1a数据集0.620 80.624 80.616 30.619 40.616 20.616 10.625 10.603 8574耿莉,等:基于稀疏一致图分解的鲁棒多视图聚类算法第 5期验基础上,增加评价指标:归一化交互信息(NMI)、F值、准确率(Precision)、召回率(Recall)、调整兰德指数(ARI)6,各指标值越大,聚类性能越好。3.2.3实验结果将SCGFm算法与基于多图融合的多视图谱聚类(GFSC)32、自适应加权普鲁克(AWP)33、多

32、视图-数图聚类(MCGC)6、自加权多视图聚类(SwMC)3、基于图结构融合的多视图聚类(GSF)5、基于非负正交图重构的多视图聚类(MCNOGR_1)16、一致性和多样性的多视图聚类(CDMGC)7算法进行比较,各算法在 5个数据集上的聚类性能比较结果分别见表 5表 9,其中加粗项为最优结果。由表 5表 9 可知,SCGFm 算法的多项指标均显示出优异的性能,其在 5 个数据集上的聚类性能均有所提升。与 MCNOGR_1算法相比,SCGFm 算法的评价指标值均有所提高,这证明了L2,1范数可使学习到的一致图相似矩阵结构化稀疏,为聚类任务提供更优的矩阵。GFSC 算 法 需 执 行 后 续 聚

33、 类 任 务,MCGC、SwMC、GSF、CDMGC 算法均要求最终S的连通分量数等于聚类数,且迭代过程涉及LS的特征分解,表 4多视图数据集描述Table 4The datasets description of multi-view数据集BBCSport100leavesORLYaleMSRCV1样本数5441 600400165210视图数23336聚类数510040157第 v个视图的特征维数 dvd13 183644 0964 0961 302d23 203643 3043 30448d3646 7506 750512d4100d5256d6210图 2SCGFs模型对参数的敏感性分

34、析Fig.2Sensitivity analysis of SCGFs model on 表 5在 BBCSport数据集上的聚类性能比较Table 5Clustering performance comparison on BBCSport dataset算法GFSCAWPMCGCSwMCGSFMCNOGR_1CDMGCSCGFmACC0.699 90.930 10.957 70.758 40.553 30.788 60.735 30.976 1Purity0.711 90.930 10.957 70.776 90.577 20.862 10.759 20.976 1NMI0.504 70.

35、866 90.865 50.683 90.433 80.756 90.693 30.914 6F值0.600 30.907 60.910 70.724 10.540 60.835 60.714 40.955 1Precision0.491 20.884 30.891 10.586 70.377 50.827 20.565 90.967 7Recall0.806 50.943 40.931 20.958 80.951 90.844 20.968 30.942 8ARI0.429 00.874 50.881 90.605 40.302 30.783 40.591 30.941 3575浙 江 大

36、学 学 报(理学版)第 50 卷复杂度较高。SCGFm 算法对S进行分解,通过非负矩阵直接得到聚类结果,避免了LS的特征分解,并取得了更好的结果。SCGFm 算法虽然在 BBCSport、Yale 数据集上的 Recall并非最优,但其与最优值的差距极小,在可接受范围内。3.2.4参数敏感性分析分 析 SCGFm 模 型 的 参 数和,参 数在 100,104内取值,参数在 104,106内取值。以BBCSport、100leaves、ORL、Yale 数据集为例,分析其 对 参 数 的 敏 感 性,如 图 3 所 示。由 图 3 可 知,SCGFm 模型呈现较稳定的性能,表明其对参数和具有鲁

37、棒性。3.2.5收敛性分析对每个变量进行迭代优化更新,以 BBCSport、100leaves、ORL、Yale 数据集为例,绘制 SCGFm 模型目标函数的收敛曲线,如图 4 所示。由图 4 可知,随着迭代次数的增加,SCGFm 模型的目标函数值逐渐减小,初始迭代时下降速度很快,后收敛至最优解。这表明采用 ALM 方法将求解问题转化为其等价模型,可得到收敛解。表 6不同算法在 100leaves数据集上的聚类性能比较Table 6Clustering performance comparison of different algorithm on 100leaves dataset算法GFS

38、CAWPMCGCSwMCGSFMCNOGR_1CDMGCSCGFmACC0.064 30.771 30.758 80.793 10.895 60.908 80.886 90.943 8Purity0.115 20.790 00.779 40.816 10.903 10.915 60.902 00.948 1NMI0.334 40.885 30.858 60.881 30.946 10.948 20.948 30.965 0F值0.066 80.700 80.532 30.530 40.817 70.864 00.794 60.908 6Precision0.034 90.652 30.412

39、10.404 20.767 90.834 90.710 90.897 9Recall0.798 60.757 10.751 30.802 30.874 40.895 30.910 50.919 7ARI0.049 70.697 80.526 50.524 30.815 80.862 70.792 30.907 8表 7不同算法在 ORL数据集上的聚类性能比较Table 7Clustering performance comparison of different algorithm on ORL dataset算法GFSCAWPMCGCSwMCGSFMCNOGR_1CDMGCSCGFmACC0

40、.420 30.632 50.675 00.711 10.742 50.815 00.665 90.850 0Purity0.465 40.657 50.737 50.772 60.795 00.855 00.739 40.885 0NMI0.625 60.788 50.821 20.838 70.865 90.903 80.802 40.922 4F值0.293 30.524 10.469 20.456 00.613 80.741 30.345 10.800 7Precision0.197 80.462 90.339 50.322 60.503 20.687 70.219 80.767 3R

41、ecall0.574 30.603 90.758 90.811 80.786 70.803 90.825 10.837 2ARI0.268 70.511 60.452 10.437 50.602 90.734 80.320 80.795 9表 8不同算法在 Yale数据集上的聚类性能比较Table 8Clustering performance comparison of different algorithm on Yale dataset算法GFSCAWPMCGCSwMCGSFMCNOGR_1CDMGCSCGFmACC0.490 90.503 00.600 00.651 50.612 10

42、.624 20.683 90.703 0Purity0.509 10.509 10.618 20.654 50.618 20.642 40.688 50.703 0NMI0.534 80.591 10.640 20.670 40.660 10.656 90.682 00.706 6F值0.340 60.407 50.448 50.452 60.480 10.467 30.461 30.537 9Precision0.281 30.366 20.403 90.389 30.457 20.463 10.392 40.514 4Recall0.436 80.459 40.504 20.543 60.

43、505 50.471 50.564 40.563 6ARI0.287 50.364 40.408 50.410 60.444 60.432 30.419 40.506 4576耿莉,等:基于稀疏一致图分解的鲁棒多视图聚类算法第 5期表 9不同算法在 MSRCV1数据集上的聚类性能比较Table 9Clustering performance comparison of different algorithm on MSRCV1 dataset算法GFSCAWPMCGCSwMCGSFMCNOGR_1CDMGCSCGFmACC0.499 00.690 50.781 00.723 80.738 10

44、.738 10.871 00.881 0Purity0.511 40.695 20.785 70.756 20.747 60.795 20.871 00.881 0NMI0.446 80.632 10.697 50.709 60.694 70.691 00.786 50.791 5F值0.432 30.622 90.689 00.641 60.665 90.657 70.758 20.783 3Precision0.341 50.512 30.614 80.556 50.640 70.632 20.734 20.770 0Recall0.592 10.794 40.783 60.770 40.

45、693 30.685 40.783 90.797 0ARI0.310 80.546 40.631 70.570 60.609 60.600 00.717 80.747 7图 3SCGFm 模型对参数和的敏感性分析Fig.3Sensitivity analysis of SCGFm model for and 图 4SCGFm 模型在多视图数据集上的收敛曲线Fig.4Convergence curves of SCGFm model on multi-view datasets577浙 江 大 学 学 报(理学版)第 50 卷4结 论首先,提出了基于稀疏一致图分解的单视图聚类模型。然后,将其推广

46、至多视图聚类,进行一致图的学习与分解,利用L2,1范数的一致图相似矩阵结构化稀疏优势,令聚类更便利,在一致图分解过程中避免了特征分解,降低了计算复杂度,可直接通过非负矩阵得到聚类结果。利用ALM方法将求解问题转化为其等价模型,令求解更容易,同时给出了具体的优化算法。最后,分别在单视图数据集与多视图数据集上进行了对比实验,验证了本文算法的有效性与优越性。参考文献(References):1林宙辰,李欢,方聪.机器学习中的加速一阶优化算法 M.北京:机械工业出版社,2021.LIN Z C,LI H,FANG C.Accelerated Optimization for Machine Learn

47、ing First-Order Algorithms M.Beijing:China Machine Press,2021.2周志华.机器学习 M.北京:清华大学出版社,2016.ZHOU Z H.Machine Learning M.Beijing:Tsinghua University Press,2016.3NIE F P,LI J,LI X L.Self-weighted multiview clustering with multiple graphsC/Twenty-Sixth International Joint Conference on Artificial Intelli

48、gence.Melbourne:AAAI Press,2017:2564-2570.4WANG H,YANG Y,LIU B,et al.A study of graph-based system for multi-view clusteringJ.Knowledge-Based Systems,2019,163:1009-1019.DOI:10.1016/j.knosys.2018.10.0225ZHAN K,NIU C X,CHEN C L,et al.Graph structure fusion for multiview clusteringJ.IEEE Transactions o

49、n Knowledge and Data Engineering,2018,31(10):1984-1993.DOI:10.1109/TKDE.2018.28720616ZHAN K,NIE F P,WANG J,et al.Multiview consensus graph clustering J.IEEE Transactions on Image Processing,2018,28(3):1261-1270.DOI:10.1109/TIP.2018.28773357HUANG S D,TSANG I W,XU Z L,et al.Measuring diversity in grap

50、h learning:A unified framework for structured multi-view clustering J.IEEE Transactions on Knowledge and Data Engineering,2022,34(12):5869-5883.DOI:10.1109/tkde.2021.30684618WU D Y,NIE F P,DONG X,et al.Parameter-free consensus embedding learning for multiview graph-based clusteringJ.IEEE Transaction

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服