ImageVerifierCode 换一换
格式:PDF , 页数:6 ,大小:1.65MB ,
资源ID:3079688      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/3079688.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(基于知识图谱的银行反欺诈模型的研究与应用.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

基于知识图谱的银行反欺诈模型的研究与应用.pdf

1、收稿日期:2023-12-02作者简介:魏永强(1986),男,河南开封人,副教授,博士,主要从事采矿工程数字矿山研究。基于知识图谱的银行反欺诈模型的研究与应用魏永强(榆林学院 信息工程学院,陕西 榆林 719000)摘 要:针对传统的银行反欺诈模型已无法满足欺诈检测要求的及时性与准确性的问题,本文提出了一种基于知识图谱的反欺诈模型。该模型基于多源信息和高维衍生特征的大数据,构建知识图谱,对信贷个体进行全方位画像,分析关联关系,并抽取网络属性。从四大方面、两大维度挖掘风险特征,四大方面指个人基本信息、账户信息、征信和行为信息,两大维度指个人节点和网络结构。最后将风险特征代入LightGBM,判

2、断是否为欺诈类型,并得到对应概率。实验表明,相比于仅使用个人自身特征的模型,使用个人特征加网络特征的模型效果更好,AUC 和 F1 分数分别提升 5.18%和 5.71%。因此,该方案能够有效地为银行对个人信贷进行欺诈评估。关键词:银行反欺诈;特征衍生;知识图谱;LightGBM中图分类号:TD353 文献标志码:A 文章编号:1008-3871(2024)02-0068-06DOI:10.16752/ki.jylu.2024.02.014 反欺诈一直是金融体系中的重要一环,关于反欺诈的研究已经进行了很长的时间。电子商务交易、信贷和保险等各个领域都必须监督和实施反欺诈措施,以阻止欺诈行为的发生

3、,减少损失1。在大数据的时代背景下,数据呈现出海量、多来源、可交叉应用的特点,传统的数据管理模式已远远不能满足应用要求。这种情况下,能存储并灵活应用多来源、多关系数据的知识图谱逐渐引起人们的重视。在金融领域,知识图谱可以应用于多个场景,如信用卡申请/交易反欺诈、企业风险查询、反洗钱知识图谱等2。利用知识图谱加机器学习架构出贯穿整个信贷周期的智能反欺诈风控系统,该系统可以更准确地判定欺诈场景,识别应对欺诈行为,具有低时延、高精度的特点3。近年来,深度学习技术的发展为银行反欺诈带来了新的机遇。尤其是图神经网络(Graph Neural Networks,GNNs)在处理图结构数据方面的优势,使其在

4、基于知识图谱的银行反欺诈研究中显示出巨大的潜力4。图神经网络能够有效地捕捉复杂网络中的局部和全局信息,对于揭示欺诈行为中的关联性和模式具有重要作用5。因此,基于知识图谱和图神经网络的银行反欺诈模型逐渐成为研究的热点。针对银行反欺诈问题,许多研究者进行了大量的研究工作。Wang 等6则对原有的只基于特征的标记传播算法(LPA)做了改进,通过加入知识图谱,充分考虑实际业务中复杂的图结构和关联关系,使模型能有效检测到团伙欺诈。Cheng 等7基于欺诈者的特点 “时间聚集”和“空间聚集”,通过图神经网络从基于位置的交易图中获悉空间特征,提出一种基于时空注意机制的 3D 卷积神经网络方法用于信用卡欺诈检

5、测。Wang 等8根据业务场景的需求设置数据标签,并将数据保存为具有扩展属性的三元组导入到图数据库 Neo4j,之后转换为知识图系统,为用户提供基于 Web 知识图的 Internet 金融风险控制服务。上述研究在银行反欺诈领域的应用提出了一些有效的方法和技术,但仍存在知识图谱的质量不高,无法充分考虑到其他关键特征和信息,在数据处理和模型优化方面优化不足等问题。针对这些问题,本研究在构建知识图谱的基础上,综合多源信息和高维衍生特征的大数据,将风险特征代入 LightGBM模型,以判断是否为欺诈类型,并得到相应的概率。通过这些改进和完善,提高银行反欺诈系统的准确2024 年 3 月第 34 卷

6、第 2 期榆 林 学 院 学 报JOURNAL OF YULIN UNIVERSITYMar.2024Vol.34 No.2性和实用性。1 相关模型1.1 知识图谱简单来说,知识图谱的架构就是先将数据表示成“实体-关系-实体”或“实体-属性-属性值”的三元组形式,以表达事实和知识,再把数据输入图数据库并储存其中,通过不断迭代更新,构建完善的知识图谱9。每一轮迭代包含信息抽取、知识融合、知识加工三个阶段。知识图谱的基本组成单位是三元组10。所以基于知识图谱构建的用户关系网络包含节点、关系和属性,构建知识图谱之前,需要对节点、关系和属性进行抽取。信息抽取后的结果若包含错误和冗余信息,可以通过冲突解

7、决和相似性检测等规则,对其进行清理和整合11。由于使用的数据在命名规则、数据格式等方面较为规范,来源也较为可靠,在此只对不同来源的同一关键信息做检验,判断是否为明显的错误信息,去除含明显错误信息的样本,冗余数据则做简单的模糊匹配。知识融合一般分为两步,本体对齐和实体匹配,融合后还需要甄别检查12。另外,因为信息和知识量在不断增长,为了让模型拥有良好的时效性,有必要对知识图谱定期更新和维护。对此不做更多处理和阐述。1.2 LightGBMLightGBM 是一种基于梯度提升树(Gradient Boosting Decision Tree,简称 GBDT),由微软在 2016年提出的算法框架13

8、。通过采用带深度限制的Leaf-wise 的叶子生长策略和基于直方图的决策树算法,lightGBM 在不损害准确率的情况下避免了XGBoost 的缺陷,它训练速度快,内存消耗低,同时还支持高效率的并行训练,满足大规模特征数据处理运算,同时也满足银行对个人信贷反欺诈稳定性、及时性、准确性、泛化性的业务需求。另外,LightG-BM 不需要进行独热编码(One-Hot Encoding)处理,可直接读取类别特征,十分适合用于本文高维多分类特征的情况14。本方案将银行个人借贷问题定义为对欺诈的二分类问题,应用 LightGBM 算法预测个人最终的欺诈标签类型,同时输出欺诈概率。2 数据准备与模型说明

9、2.1 数据采集 本文数据来自于某商业银行,从工商、税务、司法等多个渠道得到,具体来源有国家统计局、财政局、中央银行、各大银行、银保监会、证监会、工商局、税务局、中国移动/联通/电信、邮政部门等,第三方数据源如 Wind、彭博、中经网、天眼查和企查查等。这些数据中既包括原始未加工数据,也包括加工后的数据,后者多经过数据来源机构的整理,如黑名单、失信名单库、高危账号库。多数据源为构建银行反欺诈知识图谱奠定了良好的基础。数据覆盖区间为 2022 年整年,主体是银行信贷的个人用户,去除不确定是否为欺诈的样本,留下带是否欺诈标签的样本,总计七万余条记录。现将采集到的数据整理并进行如表 1 所示。表 1

10、 用于构建银行反欺诈知识图谱的数据及分类数据分类特征列举个人基本信息基本信息、家庭信息、财产信息、工作信息个人账户信息申请行、开户天数、发卡天数申请贷款信息是否认证、申请日期申请手机号及运营商、申请时的具体地点、贷款金额、贷款目的、计划还款周期、利率、贷款状态(贷款前、贷款中、贷款后)个人征信信用(子)评级、是否一卡批核、是否被列入欺诈(征信)黑名单、是否为法院失信被执行人、是否在高危账号库内借款欺诈历史、借贷逾期历史个人行为信息用户信息、交易信息、通讯信息、还款信息2.2 数据预处理表 2 衍生特征列举拓展角度衍生特征统计窗口近 3 个月平均语音消费、近 3 个月平均增值业务费、近半年申请贷

11、款被拒次数、近半年转入转出卡的交易次数7 天内同一手机号下的交易时间、卡属性、种类、交易金额是否一致还款相对月份、信用卡消费相对月份聚合函数交易后账户余额、交易后对方账户余额、每月转出金额总计统计变量贷款逾期严重程度 为寻找潜藏的欺诈规律、准确感知风险,本小节主要利用基于 RFM(recency,frequency,monetary)的方案。RFM 在客户关系管理中较为常见,这里根据客户贷前、贷中(实时交易)、贷后的特点对基本的RFM 框架进行了拓展,定义了以客户、账号、设备为96魏永强:基于知识图谱的银行反欺诈模型的研究与应用核心的特征衍生主体,并将 R 拓展为时间窗口,F 拓展为聚合函数,

12、M 拓展为数据变量。通过对 RFM 方案的拓展,利用灵活多变的统计窗口和种类丰富的聚合函数,将特征分别从时间维度、价值维度、空间维度进行衍生,生成总计 100 余个特征,列举部分特征如表 2 所示。现在已经得到训练模型所需要的风险特征,包含个人节点属性特征和网络结构特征,进行必要的特征缩放,使所有特征的尺度相同。另外,由于欺诈标签只占总样本量的 1.8%,正常标签和欺诈标签数量相差过大,影响模型学习,利用 SMOTE(Syn-thetic Minority Oversampling Technique)方法,对数量较少的欺诈类进行过采样,合成新的欺诈类样本缓解类不平衡。SMOTE 并不像随机过

13、采样算法那样简单复制样本,而是通过细致分析人工合成新样本,SMOTE 方法使过拟合问题得 到 缓 解。表 3 为SMOTE 处理后的结果。表 3 SMOTE 处理前后样本规模样本个数正常样本占比欺诈样本占比处理前70 00098.2%1.8%处理后137 48050%50%由于是时序数据,故划分训练集和测试集时并未采用流行的 K 折交叉验证,而是按 7 3 的比例划分训练集和测试集。为了准确评价模型对“未来”的预测能力,将 2018 年的数据按日期排列,前70%的数据用于训练,后 30%的用于测试。2.3 模型说明模型建立分为两步:第一步,构建知识图谱,并利用知识图谱提取与高风险欺诈模式相关的

14、特征,使得该组特征能概括关系网络;第二步,将第一步得到的特征与非网络特征(即节点属性)结合,构造算法融合模型,将知识图谱和 LightGBM 进行组合,预测得到欺诈概率,基于 AUC、KS 等指标,对比加入网络特征前后模型的性能变化情况,从指标、响应速度等方面评价反欺诈模型是否有改善。建模流程如图 1 所示。将知识图谱应用于金融领域的反欺诈场景,可以实现分层级关联挖掘:第一层挖掘账号背后隐藏的欺诈分子,第二层挖掘欺诈分子之后的欺诈团伙,账号与欺诈分子、欺诈分子与欺诈团伙之间分别存在强关联和弱连接。这不仅在微观上提升了模型精度,宏观上还可以有效提高业务时效性、降低平均风控成本和欺诈风险。图 1

15、欺诈风险模型构建过程3 模型的建立与求解3.1 知识图谱构建本研究通过构建知识图谱,有效地整合了多源数据,并在 Neo4j 图数据库中存储了结构化的节点、关系和属性,为银行反欺诈模型提供了丰富的关联信息和分析维度,从而显著提升了模型的预测能力和独特性,如图 2 所示。图 2 存储在 Neo4j 图数据库里的数据在 Neo4j 图数据库中存储的数据包含了结构化的节点、关系和属性,这些数据是构建知识图谱的基础。在本研究中,图数据库中的节点代表了信贷个体和相关实体,例如个人基本信息、账户信息、征信记录和行为模式等。这些节点通过关系相互连接,形成了个体间的关联网络,揭示了不同实体之间的内在联系。3.2

16、 网络特征提取网络中的关系数据,在保留一维角度特征的同时,加强了对比,加深了联系,可以为分类模型提供07榆林学院学报 2024 年第 2 期(总第 172 期)更大帮助。应用到银行反欺诈,可分成两种欺诈情形:第一种,个人欺骗,表现为单独个体下不同关系之间的矛盾;第二种,团伙诈骗,表现为多个个体(一般两到三个)联系紧密且行为可疑。图 3 紧密聚集的节点3.2.1 个人欺骗情形特征 根据经常出现的欺诈情形,基于已经构建的知识图谱,利用 Neo4j 的特定语句检测确认是否包含表 4 所列的欺诈情况,收集并整理出现下述情况的特征。表 4 个人欺骗情形情形具体描述不一致信息拥有资产如车、房等与消费水平不

17、符合现住地址与公司地址差异较大,如不在同一城市中经常交易地址不在现住地址或公司地址中申请的记录在已有的记录 有 类 似出现电话号码出现在已有放贷或申请记录中地址出现在已有放贷或申请记录中银行卡号在已有放贷或申请记录中操作单个 IP 多次申请账号/贷款同一账号短时间登陆多个地域相差大的 IP同一账号短时间内申请贷款数量或金额超过一定限制3.2.2 团案欺诈特征 团案欺诈分两种:组团骗贷和代办包装,后者指资质较差,按银行正常流程申请借贷很可能失败的客户,为了顺利通过审核,寻求第三方代办包装机构对自己的征信等各方面资料做优化、掩盖甚至造假。基于知识图谱挖掘银行团案欺诈,会发现在疑似团案欺诈的地方,几

18、个节点的关联明显比普通节点间的关联密集,采用社区发现算法中的三角计数法,衡量网络中的局部聚集程度,揭示节点群集、独立组和网络结构。三角计数法决定了知识图谱上各节点组成的三角形个数,节点通过三角形产生联系,可以通过三角形流(triangle stream)获取三角密集区的节点以及节点特征。它在社交网络分析中很受欢迎。图 4 银行个人信贷反欺诈知识图谱中的三角形利用三角计数法,识别出的团案欺诈频发特征列举如下:交易时的地理位置、相邻交易间隔时间、一天内交易次数、一天内交易金额、一天内通话频次、三个月累计交易金额、工作类型、工作手机号、工作地址、居住地址、籍贯、收入来源类型、密码等。借助知识图谱,能

19、够很容易识别数据造假,发现高危人员的联系是否有交集,某个团队是否成群结队骗贷(包括组团欺诈和代办包装),反欺诈业务团队也可通过分析判断,据此定义大量规则,走智能化审核,若有疑似欺诈,则采用终端保护、用户认证、隐私保护、账户保护、交易保护等风控措施。可以发现的疑似欺诈行为如一个人在多个设备上登录多个账户、多人用一套信息(工作地址、手机号、身份证号)。对于后者,对这些人关联之后形成链条型关系网络,利用知识图谱可以进行交易链、担保链的识别,按相同路径,或者从同一个担保公司出发,顺藤摸瓜,挖掘出整条黑色产业链。对于这样复杂的电路式关系,传统的 SQL 是无法提取的。3.3 LightGBM 模型训练与

20、结果本研究分两组进行模型求解,一组作为对照组记为 A 组,没有采用知识图谱的模型,另一组采用了知识图谱+LightGBM 反欺诈模型算法,记为 B 组。两组数据在相同训练集上训练,并在相同测试集上测试,保证两组只有训练特征不同,其他全部相同,以此探究从知识图谱中抽取的网络关联特征是否能改善欺诈模型的预测效果。由于需要调整的参数较多,使用 scikit-learn 包里的网格搜索 GridSearchCV 自动调参,人为指定参数及参数范围后,GridSearchCV 依次调整参数,利用调整的参数一一学习模型,循环遍历,最终输出测试集上精度最高的模型所对应的参数。若最优参数为指定范围内的最值,人工

21、调参,即扩大或改变参数范围,避免单调产生的局部极值。为了提升计算效率,本研究集中对 LightGBM 模型的三个核心参数(feature_fraction、learning_rate 和17魏永强:基于知识图谱的银行反欺诈模型的研究与应用num_leaves)进行了细致调整,并在保持数据原分布的前提下,采用了三万条样本进行训练。通过网格搜索方法,对模型进行了持续的优化,确保了参数优化的全面性和一致性,最终确定了最优参数组合,如表 5 所示。这一过程不仅优化了模型性能,也体现了我们在模型改进和独特性方面的深入探索。本研究将测试集代入对应模型,预测所属类别及相应概率。结合 A 组和 B 组模型,对

22、模型构建、实施后的效果进行验证分析,从模型 AUC 和 F1 分数两个维度进行比较,其中 AUC 值表示 ROC 曲线下与坐标轴围成的面积,基于真正率(TPR)和假正率(FPR)得出;F1 分数是精确率(precision)和召回率(recall)的调和平均数,是对两者的综合。两个指标越高,说明模型质量越高。表 5 LightGBM 模型的最优参数组名特征分数学习率叶子数量A 组0.80.560B 组0.90.550表 6 指标评价组名组别采用特征算法AUCAUC 提升F1F1 提升A 组对照组画像特征LightGBM 算法0.8690.788B 组验证组画像特征、图特征知识图谱、LightG

23、BM 算法0.9145.18%0.8335.71%由表 6 比较发现,采用知识图谱与 LightGBM 结合的反欺诈模型算法,相比于只用 LightGBM 的算法,模型 AUC 和 F1 分数都有显著提升。这表明,知识图谱的引入显著增强了 LightGBM 算法在识别潜在欺诈行为方面的能力,模型的预测准确性和对正负样本的识别能力都得到了有效的增强。为了评估本文提出的知识图谱+LightGBM 算法的有效性,将结果与决策树(Decision Tree)、随机森林(Random Forest)和 XGBoost 进行比较。Accuracy 分类准确度、F1 值用作性能指标进行比较。如表 7所示,表

24、 7 本数据集上不同方法对比算法模型AUCF1Decision Tree(决策树)0.7840.715Random Forest(随机森林)0.8260.759知识图谱、XGBoost0.8910.811知识图谱、LightGBM 算法(本研究)0.9140.833 从表格中可以看出,本文提出的知识图谱+LightGBM 算法在准确率和 F1 值上都取得了最好的结果,优于其他方法。因为本方法能够更好地利用知识图谱中的实体关系和属性信息,并结合 LightG-BM 模型进行训练,从而提高了欺诈检测的性能。与其他方法相比,知识图谱+LightGBM 算法在捕捉实体关系和特征交互方面更加有效,进而提

25、升了模型的准确性和泛化能力。4 结论在金融行业中,尤其是在银行信贷领域,欺诈行为给金融机构带来了严重的风险和损失。传统反欺诈模型在及时性和准确性上已难以满足当前的需求,因此,本研究提出了一种基于知识图谱的反欺诈模型,以应对这一挑战。本研究采用了多源数据和高维衍生特征的大数据分析方法,构建了知识图谱,对信贷个体进行了全方位的画像,通过分析个体间的关联关系和抽取网络属性,从个人基本信息、账户信息、征信和行为信息四大方面,以及个人节点和网络结构两大维度,挖掘了风险特征。这些特征被输入到 LightGBM 模型中,以预测欺诈行为,并估计其概率。实验结果表明,与仅使用个人自身特征的模型相比,结合个人和网

26、络特征的模型在 AUC 和 F1 分数上分别提升了 5.18%和 5.71%,显示出更好的预测效果。这一发现不仅验证了知识图谱在银行反欺诈中的应用价值,也为金融行业的风险管理提供了新的视角和方法。本文的理论贡献在于提出了一种新的反欺诈模型构建方法,该方法结合了知识图谱的深度信息和机器学习的高效预测能力,为金融欺诈的检测和预防提供了有力的工具。在实践层面,本研究为银行和其他金融机构提供了一个有效的欺诈检测解决方案,有助于提高风险管理的效率和准确性。未来研究可以进一步探索如何利用更复杂的知识图谱结构和更多的数据维度来提升模型的性能,以及如何将这一模型应用于更广泛的风险管理场景中。参考文献:1徐晓群

27、.构建线上反欺诈智慧风控体系筑牢数字金融风险防线J.中国信用卡,2023(12):5-7.2仲崇高,迟爱宁.知识图谱技术对智能金融的影响研究J.海峡科技与产业,2022,35(11):45-49.3孙璇,王思遥,宋娜姿.基于欺诈新特征的数字化反欺诈管理体系建设J.中国银行业,2023(3):62-64.4周晓楠,黄磊,王飞跃,等.图数据库在识别重大疾病保险团伙式欺诈中的应用研究J.保险研究,2020(9):92-104.27榆林学院学报 2024 年第 2 期(总第 172 期)5杨帆,邹窈,朱明志,等.基于图注意力变换神经网络的信用卡欺诈检测模型J/OL.计算机应用,(2023-11-02)

28、2024-02-03.http:/ J H,GUO Y,WEN X X,et al.Improving graph-based label propagation algorithm with group partition for fraud detectionJ.Applied Intelligence,2020,50(10):3291-3300.7CHENG D W,WANG X Y,ZHANG Y,et al.Graph Neural Network for Fraud Detection via Spatial-temporal AttentionJ.IEEE Transaction

29、s on Knowledge and Data Engineering,2020(9):1.8 WANG Z Q,GUO M Y,TANG M W,et al.Knowledge Graph Construction for Payment Data Risk Control C/Lecture Notes in Electrical Engineering.Singapore:Springer,2020:1901-1907.9周金泽.基于用户行为分析的 APP 用户知识图谱构建J.现代电子技术,2024,47(1):129-133.10郭琳,陈晓慧,肖梅.知识图谱研究综述J.信息记录材料,2

30、023,24(6):17-19+23.11张西硕,柳林,王海龙,等.知识图谱中实体关系抽取方法研究J/OL.计算机科学与探索,(2023-10-16)2024-02-03.http:/ G,MENG Q,FINLEY T,et al.Lightgbm:A highly efficient gradient boosting decision treeJ.Ad-vances in neural information processing systems,2017,30:60-62.14吴晖南,陈淑娇,陈展峰,等.基于 LightGBM 模型的糖尿病预测模型的研究J.中国卫生标准管理,2023,

31、14(24):64-67.(责任编辑:李赵兴)Research and Application of Bank Anti-fraud Model Based on Knowledge GraphWEI Yong-qiang(School of Information Engineering,Yulin University,Yulin 719000,China)Abstract:In response to the issue that traditional bank anti-fraud models no longer meet the timeliness and accura-cy

32、requirements for fraud detection,this article proposes a knowledge graph-based anti-fraud model.This model uses big data based on multi-source information and high-dimensional derived features to build a knowledge graph,conduct a comprehensive profiling of credit individuals,analyze the associated r

33、elationships,and extract network attributes.Then,risk features are mined from four aspects and two dimensions.The four aspects refer to personal basic information,account information,credit history,and behavioral information,while the two dimensions refer to personal nodes and network structure.Fina

34、lly,the risk features are substituted into LightGBM to determine whether it is a fraudulent type and obtain the corresponding probability.Experiments show that,compared to mod-els using only personal characteristics,models using both personal and network characteristics perform better,with AUC and F1 scores increasing by 5.18%and 5.71%respectively.Therefore,this solution can effectively provide fraud assessment for banks personal credit.Key words:bank anti-fraud;feature derivation;knowledge graph;LightGBM37魏永强:基于知识图谱的银行反欺诈模型的研究与应用

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服