1、长沙民政职业技术学院学报Journal of Changsha Social Work CollegeVol.30 No.1March.2023第30卷第1期2023年3月基于税收数据的协同过滤推荐算法设计与实现张作玲123(山东经贸职业学院,山东 潍坊 261011)摘要:针对商品流通环节采购商与供应商信息不对称问题,采用现阶段主流的协同过滤推荐算法设计个性化推荐方案,为供应商匹配“资信良好”的采购商信息,为采购商提供“质优价廉”的供应商信息,有效沟通供求双方需求。文章首先介绍了基于税收数据进行协同过滤推荐算法设计的必要性,然后设计了基于近邻的协同过滤推荐算法,分别论述了基于用户的协同过滤和
2、基于物品的协同过滤;为克服数据稀疏问题,进一步设计了基于模型的协同过滤推荐算法,通过隐语义模型构建User与Item的关联,详细阐述了基于用户相似度的IncrementalSVD推荐算法实现过程,丰富了个性化推荐的应用场景。关键词:个性化推荐;协同过滤推荐算法;隐语义模型;税收数据中图分类号:TP391文献标识码:A文章编号:1671-5136(2023)01-0117-08生产要素是资源,但资源却不一定是生产要素1。数据作为一种新型生产要素,其价值的释放在于通过分析挖掘技术建立起数据间的关联关系2,将数据资源转化为现实生产力。孤立静止的数据是没有价值可言的,税收数据尤其是增值税发票数据能够对
3、纳税人的生产经营活动进行全链条、立体化的正向追踪和反向溯源,具有时效性强、覆盖面广、颗粒度细的优点,能够对纳税人的生产经营活动进行全链条跟踪,为基于协同过滤的个性化推荐奠定了数据基础。“金税四期”已经开启了“千人千面”个性化定制的道路,在决策指挥端“重大事项”模块,已经能够根据税务人员岗位、职务、偏好等数据进行差异化的信息资源推送,有效提高了工作人员信息获取的效率和质量。随着“金税四期”建设的深入推进,完全可以站在纳税人的角度,为纳税人提供“千企千面”的个性化定制服务,向纳税人推送其可能感兴趣的原材料供应商和潜在的商品采购商,一方面帮助采购商获取“质优价廉”的原材料,另一方面向供应商推送“资信
4、良好”的潜在客户信息,在供应链环节实现优胜劣汰的生物进化,优化要素资源配置。基于此,本文运用协同过滤推荐算法设计基于税收数据的个性化推荐方案,将数据要素转化为现实生产力。1协同过滤推荐算法协同过滤利用了两个非常朴素的哲学思想:“群体的智慧”和“相似的物体具备相似的性质”3。从概率上讲,大多数人的决策要比单一个体的决策更为理性和高效。群体智慧便是通过共享集体智能,实现高效决策和结果优化。协同过滤在税务服务个性化推荐中的思想是:相似的物体具备相似的化学或物理结构,其在最终用途或性能方面也具有相似性。协同过滤包括协同和过滤两个环节。所谓协同就是利用群体智慧来做决策(推荐),类似于生物学的进化论,通过
5、协同作用让群体进化到性能更佳的状态。对于税务推荐系统来说,就是通过纳税人的持续协同,为目标客户提供最符合其偏好的推荐组合。而过滤就是在可供选择的推荐组合中,根据目标客户行为偏好,确定最优的TopN进行推荐。基于税收数据的协同过滤推荐方案设计是通过群收稿时间:2023-02-15基金项目:山东省人文社会科学课题“山东省环境保护税的绿色创新效应评估研究”(2022-YYJJ-25);山东省社会科学规划研究项目“税收大数据赋能山东省产业链微循环的机制研究”(20CSDJ40)。作者简介:张作玲(1985),女,山东经贸职业学院副教授,博士研究生。E-mail:长沙民政职业技术学院学报2023年体的行
6、为来找到某种相似性(既可以是纳税人之间的,也可以是标的物之间的),通过该相似性来做决策或推荐。协同过滤推荐算法分为基于近邻的协同过滤和基于模型的协同过滤4。其中,基于近邻的协同过滤又分为基于用户的协同过滤(User-based CollaborativeFiltering,简 称 User CF)和 基 于 物 品 的 协 同 过 滤(Item-based Collaborative Filtering,简称Item CF);基于模型的协同过滤又可以进一步划分为基于用户相似度的 Incremental SVD推荐和基于物品相似度的 Incremental SVD推荐。2基于近邻的协同过滤推荐算
7、法基于近邻的协同过滤推荐算法是利用集体智慧的典型5。例如,当我们周末想去看电影,但又不知该看哪部电影的时候,通常会在微信朋友圈里问一句“朋友们,最近有什么好看的电影?求推荐”,并且在众多的推荐结果中,我们更倾向于与我们“志趣相投”的朋友们的推荐,他们的建议被采纳的概率更高,因为我们与朋友们拥有更多共同的兴趣爱好。基于近邻的协同过滤推荐算法基本思想是:如果纳税人 Taxpayer NO.1 喜欢商品 Goods NO.1,纳税人Taxpayer NO.2 喜欢商品 Goods NO.1、Goods NO.2、Goods NO.3,Taxpayer NO.3 喜 欢 Goods NO.1 和Goo
8、ds NO.3,那 么 认 为 Taxpayer NO.1 与 TaxpayerNO.2 和 Taxpayer NO.3 相似,因为他们都喜欢 GoodsNO.1,而喜欢 Goods NO.1 的用户同时也喜欢 GoodsNO.3,所以把 Goods NO.3 推荐给纳税人 TaxpayerNO.1。基于近邻的协同过滤推荐算法前提假设是:纳税人的生产经营范围具有相对稳定性,相应其生产资料消耗也具有延续性,即纳税人以前经常采购某商品,其在未来对该类商品也具有偏好,不会随着时间推移而发生变化。因此,我们就可以根据纳税人历史采购记录,获取纳税人偏好的商品。同时,纳税人对某种商品的购买次数可在一定程度
9、上反映纳税人对该商品优劣的评价。因为纳税人作为理性经济人,愿意从某公司重复采购某商品,可以在一定程度上说明该商品质量上乘且价格合理。本文以交易次数作为纳税人对商品进行综合评价的替代指标,并进行归一化处理,以20%为间隔,5代表交易次数最多的前20%的商品,1代表交易次数最少的后20%的商品,中间分别是4,3和2。假设纳税人Taxpayer NO.1NO.4与商品Goods NO.1NO.5之间存在如表1所示的历史交易行为,其中,“?”代表未发生过交易行为的商品。表1纳税人对某商品的综合评价纳税人商品纳税人:Taxpayer NO.1纳税人:Taxpayer NO.2纳税人:Taxpayer N
10、O.3纳税人:Taxpayer NO.4商品名称:Goods NO.13253商品名称:Goods NO.2?535商品名称:Goods NO.35535商品名称:Goods NO.4?422商品名称:Goods NO.55234我们要做的是根据“纳税人商品”历史交易数据矩阵,计算纳税人 Taxpayer NO.1 对商品 GoodsNO.2 和 Goods NO.4 的潜在购买可能性,并向 Taxpayer NO.1推荐购买可能性较高的商品。本文用余弦相似度衡量纳税人间的相似性(User CF)以及商品间的相似性(Item CF),余弦相似度的计算方法如下:D(A,B)=a*b a*b=x1
11、x2+y1y2x21+y21*x22+y22(1)2.1基于用户的协同过滤(User CF)基于用户(User-based)的协同过滤主要考虑的是纳税人和纳税人之间的相似度6。首先找出与目标服务对象纳税人A相似的纳税人群组B,然后分析群组中纳税人经常采购的物资名单,预测纳税人A对它们的评分,找到评分最高的若干个物品推荐给纳税人A。以表1中的数据为例,基于用户的协同过滤实现过程如下:第一步:采用余弦相似度衡量纳税人间的相似性,计算结果如表2所示:表2纳税人间的相似性TaxpayerNO.110.92920.89340.9942TaxpayerNO.1TaxpayerNO.2TaxpayerNO.
12、3TaxpayerNO.4118张作玲:基于税收数据的协同过滤推荐算法设计与实现第1期TaxpayerNO.2TaxpayerNO.3TaxpayerNO.40.92920.89340.994210.822980.96010.8229810.90580.96010.90581(续表)TaxpayerNO.1TaxpayerNO.2TaxpayerNO.3TaxpayerNO.4提取与纳税人 Taxpayer NO.1 相似的 3 个纳税人Taxpayer NO.2NO.4 有 过 交 易 行 为 的 商 品 GoodsNO.1NO.5。因 为 纳 税 人 Taxpayer NO.1 对 商 品
13、Goods NO.1、NO.3和NO.5有过交易行为,不需要重复推荐,只需要计算纳税人Taxpayer NO.1对未曾接触过的商品 Goods NO.2和 Goods NO.4的潜在购买可能性,并根据交易可能性的大小进行推荐优先级排序。方法是通过纳税人Taxpayer NO.2NO.4,建立起纳税人 Taxpayer NO.1与商品 Goods NO.2和 NO.4的联系。纳税人与商品之间的关系如图1所示。图1基于用户的协同过滤(UserCF)第二步:加权排序推荐。对纳税人i已经有过交易记录的物品的交易次数进行加权求和,权值为与纳税人i相近的n(n从1开始)个纳税人的相似度,然后对所有纳税人的
14、相似度的和求平均值,计算得到纳税人i对商品g的潜在购买可能性,计算方法如下:纳税人对商品的潜在评分为:Pi,g=n N(i)Ti,n*Sg,nn N(i)Ti,n(2)Pi,g为纳税人i对商品g的潜在购买可能性,N(i)为与纳税人i相似的纳税人,Ti,n为纳税人i与纳税人n的相似度,Sg,n为纳税人n对商品g的评分。第三步:计算纳税人Taxpayer NO.1对商品GoodsNO.2与 Goods NO.4的综合评价并排序。纳税人 Taxpayer NO.1对商品Goods NO.2和Goods NO.4的潜在综合 评 价 分 别 为 4.3657 和 2.6598,所 以 相 对 于 商 品
15、Goods NO.4,更应该向纳税人Taxpayer NO.1推荐商品Goods NO.2。2.2基于物品的协同过滤(Item CF)基于物品的协同过滤和基于用户的协同过滤类似,只不过在Item CF中,计算的是物品与物品之间的相似度7。例如当我们从电商平台购买了一本涉税服务实务方面的书籍,网站后续会向我们推荐税收法律法规、财务与会计等相关的书籍,这便是基于物品信息的协同过滤推荐。Item CF在为纳税人提供推荐服务中的应用是:首先根据纳税人的历史交易数据,确定纳税人偏好的商品信息,然后从商品库中筛选与纳税人偏好商品相近的商品组合,推荐与其偏好商品相关度最高的商品给他。基于物品的协同过滤计算步
16、骤如下:第一步:采用余弦相似度衡量商品间的相似度。计算结果如表3所示:表3商品间的相似度GoodsNO.1GoodsNO.2GoodsNO.3GoodsNO.4GoodsNO.5GoodsNO.110.84480.84480.79470.9338GoodsNO.20.8448110.95670.9428GoodsNO.30.8448110.95670.9428GoodsNO.40.79470.95670.956710.8339GoodsNO.50.93380.94280.94280.83391根据纳税人Taxpayer NO.1以前有过交易行为的商品 Goods NO.1、NO.3 和 NO.
17、5,计算纳税人 TaxpayerNO.1对商品Goods NO.2和Goods NO.4的潜在购买可能性,并根据可能性大小进行推荐优先级的排序。方法是通过商品Goods NO.1、NO.3、NO.5建立起纳税人 Taxpayer NO.1与商品 Goods NO.2和 NO.4的联系,如图2所示:图2基于物品的协同过滤(Item CF)119长沙民政职业技术学院学报2023年第二步:加权排序推荐。对纳税人i已经有过交易记录的商品的交易次数进行加权求和,权值为各个商品与商品g的相似度,然后对所有商品相似度的和求平均值,计算得到纳税人 i对商品 g的潜在购买可能性,计算方法如下:Pi,g=n N(
18、i)Gi,n*Ru,nn N(i)Gi,n(3)Pi,g为纳税人i对商品g的潜在评分,N(i)为纳税人i有过交易记录的商品,Gi,n为商品i与商品n的相似度,Ru,n为纳税人u对商品n的评分。第三步:计算纳税人Taxpayer NO.1对商品GoodsNO.2与 Goods NO.4的综合评价并排序。纳税人 Taxpayer NO.1对商品Goods NO.2和Goods NO.4的潜在综合 评 价 分 别 为 4.3939 和 4.3852,所 以 相 对 于 商 品Goods NO.4,更应该向纳税人Taxpayer NO.1推荐商品Goods NO.2。2.3基于模型的协同过滤我们期望得
19、到如表1所示的“纳税人商品”数据矩阵,但实际上纳税人有过交易行为的商品仅占税务系统商品门类的极小一部分,因此通常只能得到部分纳税人和部分商品之间交易记录的稀疏矩阵8,如表4所示,“?”即代表未发生过交易行为的商品。稀疏矩阵下很难再通过基于近邻的推荐算法得到理想的推荐结果,这就需要用到基于模型的协同过滤。利用历史数据训练得到一个推荐模型,然后用已有的部分稀疏数据来预测那些空白的纳税人与商品之间的关系,找到潜在交易可能性最大的商品推荐给纳税人9。表4纳税人对某商品的综合评价纳税人商品纳税人:Taxpayer NO.1纳税人:Taxpayer NO.2纳税人:Taxpayer NO.3纳税人:Tax
20、payer NO.4商品名称:Goods NO.155?5商品名称:Goods NO.25?34商品名称:Goods NO.334?3商品名称:Goods NO.4?53商品名称:Goods NO.55445商品名称:Goods NO.65455纳税人与商品在发生交易行为之前是各自独立的,无法直接获得二者的关系,这就需要寻找一种潜在因子,将二者联系起来10。比如用户User A在观看电影Item a战狼之前,无法直接建立用户与电影之间的联系,这时就需要找到一种潜在因子,建立起用户User A与Item a之间的联系。例如通过“类型:动作/战争”“演员:吴京”这些隐因子,分析用户A对类型为“动作
21、/战争”、主演为“吴京”的电影的喜爱程度,以及电影战狼有多少“动作/战争”成分,是否为“吴京”主演的电影,建立起User与Item之间的联系。这便是隐语义模型LFM的基本思想。隐语义模型是通过中间的潜在因子作为桥梁将User和Item联系起来。隐语义模型中应用最成功的算法是矩阵分解MF,即将一个矩阵分解成两个矩阵的乘积。奇异值分解 SVD 在矩阵分解中的应用最为广泛,它将一个矩阵分解成三个矩阵的乘积,其中一个矩阵代表User和潜在因子的关系程度,另一个矩阵代表Item和潜在因子的关系程度,中间对角矩阵为潜在因子。奇异值分解SVD在税务协同过滤推荐算法中的应用:“金三”系统中存储着千千万万的纳税
22、人信息和商品信息,一个纳税人不可能购买过所有的商品,所以这个拥有数以万计的“纳税人商品”交易数据矩阵A,是一个缺失值非常多的稀疏矩阵。这时,可以基于SVD分解,对这个稀疏矩阵A进行分解,分解为代表纳税人对某特征偏好程度的左奇异矩阵U、代表某个商品含有某特征程度的右奇异矩阵VT和特征矩阵S。此时矩阵A=Um*k*Sk*k*VTk*n,如图3所示。图3SVD分解2.3.1Incremental SVD算法本文采用的是增量SVD算法(Incremental SVD)。Incremental SVD算法下,只需要计算新加入数据库中的User或Item的坐标,不需要重新计算全部的User或Item信息。
23、与SVD算法相比,计算复杂度下降,运行120张作玲:基于税收数据的协同过滤推荐算法设计与实现第1期耗时缩短。Incremental SVD原理如图4所示:图4IncrementalSVD原理演示下面通过具体的数据演示Incremental SVD在推荐算法中的应用,仍以表4中的数据为例,步骤如下:第一步:对于表4这样的稀疏矩阵A,无法直接进行SVD分解,需要先用0或均值对矩阵进行补全11。此处使用 0 值进行填充,得到的新矩阵 AA 如表 5 所示:表5纳税人对某商品的综合评价商品纳税人:Taxpayer NO.1纳税人:Taxpayer NO.2纳税人:Taxpayer NO.3纳税人:Ta
24、xpayer NO.4商品名称:Goods NO.15505商品名称:Goods NO.25034商品名称:Goods NO.33403商品名称:Goods NO.40053商品名称:Goods NO.55445商品名称:Goods NO.65455第二步:根据图 4 中 Incremental SVD 分解原理,表 5 中的矩阵可以分解为三个矩阵的乘积,即 AA=U*S*VT,利用Python编程软件处理后,得到代表纳税人对某特征偏好程度的左奇异矩阵U(式4)、特征矩阵S(式5)和代表某个商品含有某特征程度的右奇异矩阵VT(式6)三个矩阵,如下所示:代表纳税人对某特征偏好程度的左奇异矩阵U:
25、U=-0.571 0-0.222 80.674 90.410 9-0.427 5-0.517 2-0.692 90.263 7-0.384 60.824 6-0.253 20.328 6-0.585 90.053 20.014 0-0.808 5(4)特征矩阵S:S=17.713 900006.391 700003.098 000001.329 000000000(5)代表某个商品含有某特征程度的右奇异矩阵VT:VT=-0.447 2-0.537 3-0.006 4-0.503 7-0.385 7-0.329 8-0.358 60.246 10.862 2-0.145 80.078 00.20
26、0 2-0.292 5-0.403 3-0.227 5-0.103 80.436 00.706 5-0.207 80.670 0-0.395 1-0.588 80.026 00.066 7-0.509 90.059 7-0.109 70.286 90.594 6-0.537 1-0.531 60.188 7-0.191 40.534 1-0.548 50.242 9(6)121长沙民政职业技术学院学报2023年第三步:我们抽取前k个特征来代表原来的矩阵,将其表示成三个矩阵相乘AA=U*S*VT。经过Python测算,k的取值为2,如图5所示。U-0.571 0-0.427 5-0.384 6-
27、0.585 9-0.222 8-0.517 20.824 60.053 2S17.713 9006.391 7VT-0.447 2-0.358 6-0.292 5-0.207 8-0.509 9-0.531 6-0.537 30.246 1-0.403 30.670 00.059 70.188 7图5特征值k为2时的新矩阵得到新的矩阵AAAA=5.288 55.162 70.214 94.459 13.276 81.902 13.740 03.805 83.532 43.547 9-0.133 22.898 41.147 5-0.641 74.947 22.384 65.072 73.664
28、03.788 75.313 05.108 63.401 94.616 65.582 2(7)此时我们可以很直观地看出,新矩阵AA的转置矩阵AAT接近于原矩阵A,二者间的误差是由于降维造成的压缩损失。这个误差在可以接受的范围内,说明选取的这两个特征值能较好地刻画出商品的特征和纳税人对特征的偏好程度。接下来分析矩阵中数据的相关性。可以将左奇异矩阵U的第一列当成X值,第二列看成Y值,即将U的每一行用一个二维向量来表示。同理,可以将右奇异矩阵 VT的每一行也用一个二维向量来表示。将U和VT标识在坐标系上,位置如图6所示。图6纳税人与商品的二维向量表示假设有新纳税人Taxpayer NO.5,并且已知这
29、个纳税人对商品Goods NO.1 NO.6的交易次数为:5 5 00 0 5。现在的任务是完成对纳税人Taxpayer NO.5的个性化推荐。思路是先预测新用户对商品的评分,然后选择评分高的商品,推荐给新用户。有两种实现方式:一是基于用户相似度进行Incremental SVD推荐;二是基于物品相似度进行Incremental SVD推荐。2.3.2基于用户相似度的Incremental SVD推荐算法假设有新纳税人X,在已知评分矩阵A、有序商品序列组合Y的情况下,基于用户相似度的Incremental SVD推荐的步骤是:第一步:从原始矩阵A中找出与特定商品Item=Y有过交易行为的所有纳
30、税人;第二步:使用降维矩阵,找出与Item=Y有过交易122张作玲:基于税收数据的协同过滤推荐算法设计与实现第1期行为且与纳税人Taxpayer=X最为相近的纳税人;第三步:从原始矩阵中获取与纳税人Taxpayer=X最为相近的纳税人对商品的评分,并把这个评分视作Taxpayer=X对Item=Y的评分。第四步:对Item=Y按评分高低排序,由高到低进行推荐。同理可以基于物品相似度进行 IncrementalSVD推荐。仍以表4中的数据为例,基于用户相似度的Incremental SVD推荐算法实现路径为:第 一 步:从 原 始 矩 阵 A 中 找 出 与 商 品 GoodsNO.1NO.6有
31、过交易行为的所有纳税人,此处是纳税人Taxpayer NO.1NO.4。第二步:利用纳税人Taxpayer NO.5历史交易记录“纳税人商品”矩阵,找出与Taxpayer NO.5相似的纳税人。Taxpayer NO.52D=Taxpayer NO.5T*U*Sk-1(8)Taxpayer NO.52D=550005*-0.447 2-0.537 3-0.358 60.246 1-0.292 5-0.403 3-0.207 80.670 0-0.509 90.059 7-0.531 60.188 7*17.713 9006.391 7(9)Taxpayer NO.52D=-0.37750.08
32、02(10)图7纳税人Taxpayer NO.5在二维向量中的位置采用 Incremental SVD 算法,将新进入的纳税人Taxpayer NO.5加入矩阵图中,如图7所示。采用余弦相似度测算纳税人间的相似程度,与Taxpayer NO.5 夹角最小的纳税人即为最相似的纳税人12,通 过 计 算 得 到 最 相 似 的 纳 税 人 是 TaxpayerNO.1。第三步:从原始矩阵中获取纳税人 Taxpayer=NO.1对商品Goods NO.1NO.6的评分向量(5 5 3 0 55),并把这个评分视作纳税人Taxpayer NO.5对商品的评分。在纳税人Taxpayer NO.5对商品的
33、评分向量(55 0 0 0 5)中,对于商品 Goods NO.1、NO.2、NO.6,纳税人Taxpayer NO.5已经有过交易行为,无须推荐,只需要对商品 Goods NO.3、NO.4、NO.5 进行推荐,而商品 Goods NO.4纳税人 Taxpayer NO.1同样未曾发生过交易行为,所以只能对商品Goods NO.3、NO.5进行推荐。123长沙民政职业技术学院学报2023年第四步:对商品按评分高低排序,由高到低进行推荐。根据纳税人Taxpayer NO.1对商品Goods NO.3、NO.5 的评分,得到(Goods NO.5:5,Goods NO.3:3),即推荐给纳税人
34、Taxpayer NO.5 的商品依次为Goods NO.5 和 Goods NO.3。至此,对于商品 GoodsNO.3和NO.5的推荐任务完成,后续可以通过多次协同过滤得到最优推荐组合。3结束语大中型企业因其存续时间较长、产品稳定、业绩良好,在非个性化推荐中占据绝对优势,反观中小企业,由于处于战略成长期,资金实力、业绩水平、市场占有率等都不够强大,在非个性化推荐中处于劣势。然而,中小企业作为吸纳就业的主力军,在促进国民经济高质量发展、维护社会稳定等方面具有不可替代的作用。基于税收数据的个性化推荐,可以创造全新的商业和经济模式,最大限度地发挥“长尾”效应,增加纳税人与潜在交易对象间的沟通与交
35、流。根据中小企业在生产经营中的“痛点”“堵点”,运用协同过滤推荐算法设计个性化的“私人订制”服务方案,帮助中小企业寻找“质优价廉”的原料供应商和“资信良好”的商品采购商,提升原料采购效率的同时拓宽商品销售渠道,推动数据要素价值向现实生产力转化。参考文献1段尧清,吴瑾,王蕊.数据要素基础制度的价值取向与框架J.数字图书馆论坛,2022(10):6-12.2匡文波.智能算法推荐技术的逻辑理路、伦理问题及规制方略J.深圳大学学报(人文社会科学版),2021,38(1):144-151.3牛温佳,刘吉强,石川,等.用户网络行为画像:大数据中的用户网络行为画像分析与内容推荐应用M.北京:电子工业出版社,
36、2016.4Xz A,Hl A,Xc B,et al.A novel hybrid deep recommendationsystem to differentiate users preference and items attractivenessJ.Information Sciences,2020,519:306-316.5王红霞,陈健,程艳芬.采用评论挖掘修正用户评分的改进协同过滤算法J.浙江大学学报(工学版),2019,53(3):522-532.6王建芳,韩鹏飞,苗艳玲,等.一种基于用户兴趣联合相似度的协同过滤算法J.河南理工大学学报(自然科学版),2019,38(5):118-
37、123.7陈帆,孙自强.结合物品类型和密度峰值聚类的协同过滤推荐算法J.华东理工大学学报(自然科学版),2018,44(6):862-868.8吴宾,娄铮铮,叶阳东.一种面向多源异构数据的协同过滤推荐算法J.计算机研究与发展,2019,56(5):1034-1047.9任永功,王思雨,张志鹏.缓解数据稀疏问题的协同过滤混合填充算法J.模式识别与人工智能,2020,33(2):166-175.10刘航.关于用户踪迹融合协同过滤推荐的仿真研究J.计算机仿真,2020,37(7):422-425+454.11王永贵,刘凯奇.一种优化聚类的协同过滤推荐算法J.计算机工程与应用,2020,56(15):66-73.12梁丽君,李业刚,张娜娜,等.融合用户特征优化聚类的协同过滤算法J.智能系统学报,2020,15(6):1091-1096.124