基于反馈监督式学习策略的信用卡欺诈检测方法.pdf

资源描述

1、为了提高信用卡欺诈检测的实用性和可靠性,提出一种反馈监督式学习策略的检测方法.首先,通过反馈信息单独训练分类器,确保与这些监督样本的较高相关性.由于反馈和报警信息均会受到样本选择偏倚(S S B)的影响,因此,从反馈和延迟监督样本中分别训练不同的分类器,然后对其预测进行汇总.接着,通过大量信用卡交易对该学习策略进行了测试.实验结果表明,所提检测方法可以有效解决分类不平衡,概念漂移问题.相比其他优秀方法,策略成本较低,具有实践参考价值.关键词:信用卡欺诈检测;反馈监督;样本选择偏倚;分类不平衡;分类器中图分类号:T P 3 9 1 文献标识码:A 文章编号:1 6 7 1-6 8 7 6(2 0

2、 2 3)0 2-0 1 2 5-0 7 收稿日期:2 0 2 2-0 9-2 8 基金项目:安徽省教育厅高校优秀拔尖人才培育项目(g x g n f x 2 0 2 1 1 1 0)通信作者:郜佳蕾,副教授,硕士,主要从事区域经济、风险评估等研究.0 引言信用卡欺诈检测1问题在机器学习和计算智能领域备受关注,该研究在学习方面极具挑战性,因为其同时具有分类不平衡(合法交易量远大于欺诈交易量)2和概念漂移(交易的统计特性可能会随时间而变化)3的特征.此外,在对现实世界欺诈检测系统中的学习问题进行表征时,还存在其他挑战.当前资金交易流中,通常采用分类器对所有授权交易进行分析,并针对最可疑的交易发出

3、警报.然后,专业调查人员对警报进行检查,联系持卡人确定每一次警报交易的真实性质(合法交易或欺诈交易).由此,调查人员以“标记交易”的形式向系统提供反馈,标记交易可被用于训练和更新分类器,从而逐步保持(或最终改进)欺诈检测性能.显然,由于时间和成本限制,大部分交易是无法通过调查人员进行核实的.目前,研究人员针对信用卡欺诈检测提出了各种监督式方法4和无监督方法5.无监督方法包括离群点/异常值检测技术,此类技术将与大多数交易不符的任何交易均视为欺诈.监督式方法是欺诈检测中最流行的方法,利用标记交易对分类器进行训练.通过对授权交易的特征向量进行分类或分析分类器的后验完成欺诈检测6.基于成本的度量7通过

4、成本矩阵对欺诈造成的财务损失进行量化,将成本与混淆矩阵的每个项相关联.文8 提出了一种基于特征敏感的s t a c k i n g集成学习方法F S B S,通过交叉验证的方式得到概率形式的输出,并通过s t a c k i n g集成方法使模型对大金额交易样本有所偏置.文9 对欺诈检测的分类不平衡问题进行了全面综述,将分类不平衡方法分为:1)采样方法;2)基于成本的方法.采样方法用于在运行传统学习算法之前平衡训练集中的类分布,而基于成本的方法1 0则通过修改学习算法,向少数类分配更大的误分类成本.引起信用卡交易流发生变化的两个主要因素被称为概念漂移1 1.因此,文1 2 使用变化检测检验或其

5、他统计触发程序,通过分析分类误差和(或)数据分布来监测输入数据.在检测到输入数据中的变化时,立即激活适应机制,并在与当前进程状态相一致的最新监督样本上对分类器进行更新/重训练.文1 3 提出一种深度信念神经网络(D B NN)集成算法来解决类极度不均衡的信用欺诈问题,引入成本-效益指数兼顾正类和负类样本的识别能力.为了提高欺诈检测的适用性和准确性,本文提出了一个学习策略,从反馈和延迟监督样本中分别训练不同的分类器,然后对其预测进行汇总.并通过大量信用卡交易对该学习策略进行了测试.该策略受反馈和延迟监督样本的不同性质所启发,尤其适用于使用滑动窗口或分类器集成的信用卡欺诈检测.1 模型概述信用卡欺

6、诈检测模型的示意图如图1所示.使用了5层控制:终端、交易阻断规则、得分规则、数据驱动模型(D DM)和调查人员.第1到4层完全实现了自动化控制,只有第5层需要人工干预.本文主要研究数据驱动型模型和警报-反馈交互,后者决定了最新监督样本的提供方式.图1 信用卡欺诈检测的控制分层图示1.1 欺诈检测的公式化表述设xi表示与第i个授权交易相关联的特征向量,yi+,-表示其对应的分类,其中+表示欺诈交易,-表示合法交易.为处理交易流的时变特性,每天更新(或重新训练)分类器K.将在第t-1天可用的监督交易数据上训练后的分类器表示为Kt-1.然后使用分类器Kt-1处理在第t天得到授权的交易集合Tt.PKt

8、天,以使得在第t天能够提供在第t-天授权的所有交易的标签.这些交易被称为延迟监督样本 Dt-=(xi,yi),xiTt-(3)其中,Tt-Dt-,因为在第t-天的交易显然包含了警报交易.一般通过警报精度Pk(t)来评估欺诈检测的性能,警报精度定义如下:Pk(t)=|T Pk(t)|k(4)式中T Pk(t)=(xi,yi);xiAt,yi=+.由此,Pk(t)为警报At中欺诈交易的占比.虽然分类器独立处理每个特征向量,但从信用卡而非授权交易方面测得的警报精度将更具实际意义.从信用卡层面上621淮阴师范学院学报(自然科学版)第2 2卷说,测量检测性能将得到更多信息,即来自同一张卡的多次欺诈交易将

9、被计为单个正确检测.由此,本文引入C Pk作为信用卡检测报警精度,检测到的被欺诈卡的占比为 C Pk(t)=|C+t|k(5)式中C+t表示在第t天正确检测到的被欺诈卡的集合,即至少报告了一次警报的被欺诈卡.1.2 欺诈检测的特征交易请求特征通过几个变量来描述,例如商户I D、持卡人I D、购买金额、日期和时间等.将所有通过阻断规则的交易请求输入包含所有近期授权交易的数据库中,并在该数据库中启动特征扩充.本文的检测特征概述如表1所示.在特征扩充过程中,计算出与每个授权交易相关联的一个特定聚合特征集合,以提供购买相关的附加信息,并更好地区分欺诈交易和合法交易.这些特征具有较大信息量,通过聚合特征

10、可以对自身并无可疑,但与特定持卡人日常购物习惯不符的交易会发出警报.2 学习策略表1 信用卡欺诈检测的特征描述属性项目名称属性简述交易I D交易的识别码交易时间交易的具体时间交易账号号码客户的识别码账户号码信用卡卡号交易类型如A TM、P O S、线上等接入的方式如磁条、芯片等平均交易金额交易处理的平均金额商户的I D商户类型持卡类型如银联卡、V i s a卡、万事达卡等持卡人性别男/女持卡人年龄年龄所在银行卡发行的银行国家持卡所在国家或区域在目前通用的信用卡欺诈检测框架中,反馈(Ft)与延迟样本(Dt-)是完全不同的监督样本集合.第1个差异很明显是Ft提供最新信息,而Dt-对于训练旨在分析下

11、一天授权交易的分类器来说可能已经过时.第2个差异是Ft和Dt-中欺诈交易的占比:Dt-中的类分布严重向合法交易倾斜,而Ft中的欺诈交易数量则取决于Kt-1的检测性能,分类器提供高度精确数值将导致Ft向欺诈交易倾斜.相关研究表明,反馈和延迟样本代表了两个不同的分类问题1 5,因此必须分开处理.因此,本文提出的学习策略包括仅使用反馈的分类器(Ft)和仅使用延迟监督样本的分类器(Dt),并在定义PKt-1(+|xi)时聚合两个分类器的后验概率以识别出欺诈交易.下文将详细解释提出的学习策略,其中基于被动式方法进行适应,并在包含最新的可用监督样本(反馈或延迟样本)的分批数据上每

12、天对分类器进行更新.首先,在反馈上对分类器Ft进行单独训练 Ft=T R A I N(Ft,Ft-(Q-1)(6)以及在延迟监督样本上单独训练的分类器 Dt=T R A I N(Dt-,Ft-(+M-1)(7)为通过聚合分类器At进行欺诈检测,将At的后验概率定义为 PAt(+|x)=PFt(+|x)+(1-)PDt(+|x)(8)式中,01为平衡Ft和Dt的贡献的加权参数.由此,通过式(8)给出分类器Kt(对第t+1天的授权交易发出警报)的后验概率.参数Q和M分别定义分类器训练时使用的反馈的天数和延迟监督样本的天数,在定义Q和M时必须考虑到反馈总数量和欺诈交易占比.Ft的训练集约包含Q|Ft

13、|个样本(每天提供的反馈数量可能不一样),训练分类器的样本数量必须足够大,以解决高维中的分类难题.学习策略的设计理念如下:首先,通过反馈信息单独训练分类器,确保与这些监督样本的较高相关性.其次,仅对Ft和Dt均认为很可能是欺诈的交易发出警报:实践中,由于每天要处理大量的交易,警报数量对应于PAt的数值(非常接近1).由于警报-反馈交互,Ft和At均会受到样本选择偏倚(S S B)的影响,只有延迟监督样本是不721第2期郜佳蕾,等:基于反馈监督式学习策略的信用卡欺诈检测方法受S S B影响的训练样本.3 实验与分析3.1 数据集本文使用了两个大型的线上电子商务交易数据集1 6.虽然这些交易并未从

14、物理终端发起,但其遵循了图1展示了相同过程.数据集满足了分类的极端不平衡性,因为欺诈交易仅占所有交易的约0.2%.如图2所示,随时间推移,每天欺诈交易数量存在显著差异,且欺诈交易数量大于被盗信用卡数量,这意味着同一张卡可能会被反复窃取.图2 欺诈交易和被欺诈的信用卡数量点状图为了对欺诈检测性能进行可靠评估,本文从所有特征向量中移除了C A R D-I D(信用卡标识).这一操作对于分类器在历史交易数据集的测试非常重要,因为在输入中接收到变量C A R D-I D的分类器可能会将该变量学习为区别性特征,以检测不同日期下来自同一张卡的多次欺诈(从而得到过于乐观的性能).C A R D-I D仅用于

15、计算聚合特征,而不包含在特征向量中.3.2 实验设置本文假定调查人员每天能够对D DM示警的1 0 0张信用卡进行核查.在Q天中,每天包含来自1 0 0个不同持卡人的示警交易上,每天对Ft进行训练.由于反馈取决于请求标签的实际分类器.所以当在At中使用和单独使用时,Ft的训练集可能会有差别:前者还会受到Dt的后验的影响,后者则仅取决于Ft.每个实验重复1 0次,以降低性能可变性,且在比较分类器在多个日子中的性能时,本文从分类器表示符号中去除下标t.在大部分实验中,将验证延迟考虑为一周(=7),M=8,由此反馈的总天数为Q=M+=1 5.使用较长的验证延迟=1 5、M=1 5和Q=3 0进行实验

16、.3.3 成本节约与报警精度本文使用修正的代价矩阵方法1 7评估不同方法的成本节约情况,使用式(5)来计算检测报警精度(C Pk).采用表1的特征作为检测特征.评估分类器方法有:l o g i s t i c回归(L R)、决策树(D T)、B E S S1 2、D B NN1 3、随机森林(R F)方法1 8.成本节约与报警精度方面的比较如表2所示.可以看出,在成本节约方面,表现最好的是L R,因为逻辑回归方法对于这种大数据处理表现出简单高效的数据分类效力,但是由于信用卡欺诈特征的多样821淮阴师范学院学报(自然科学版)第2 2卷性和复杂性,其在检测报警精度方面表现较弱.一般情况下,节约成本

17、与检测报警精度具有较弱的负向关系,但不是很明显.本文反馈监督学习方法的报警精度最高,这在下一节的概念漂移实验中得到验证.综合来看,所提方法在保持最高报警精度的同时,在节约成本方面也表现较好.为了研究特征对成本节约方面的影响,在表1的聚合特征中添加更多其他特征,例如客户每周(每月)在同一家商户的平均支出金额、平均交易金额、上一次购买的位置等,前后对比效果如图3所示,可以看出,更多的特征聚合可以增加检测的成本节约效果.表2 成本节约与报警精度方面的比较方法节约的成本/%检测报警精度C Pk/%L R3 9.65 3.7%D T9.56 1.8%R F2 6.66 0.3%B E S S2 2.17

18、 1.5%D B NN2 8.96 5.2%本文方法2 7.57 6.1%图3 不同特征情况下成本节约的结果比较3.4 概念漂移本节首先分析2 0 1 82 0 1 9年的数据集,其中包含了超过1 0个月中6 3 0 0万次以上的授权交易,并证明该数据流会受到概念漂移的影响.为此,本文使用了一个静态分类器St,该分类器最初在M天的数据上训练且从未更新(使其最初与WDt一致),并将其与WDt(定期更新)和AWt(利用了更新后的监督样本)相比较.在静态分类问题中,两个分类器S和WD的性能相似.在数据集中的主要参数性能如图4所示,取1 5天的滑动窗口上的均值.图4 a中C Pk的峰值对应于图4

19、b中被欺诈卡数量峰值.该结果表明,在被欺诈卡数量较大的日子里,分类器的精度较高.随时间推移St的性能优于WDt,这也表明该数据集受到了概念漂移的影响.图4 概念漂移的结果展示如图4 a所示,提出的AW在C Pk方面始终保持了最优性能,这表明提出的方法能够更好地适应概念漂移.值得一提,图4 a中的所有分类器的性能都存在较强波动,峰值出现在2 0 1 9年2月期间.这是因为实验数据集中该月份的被盗信用卡数量最大(图4 b).而在2 01 8年1 0月期间(实验数据集中被盗信用卡数量最少),所有分类器都得到了较低的C Pk数值.因此,图4表明警报精度很大程度上取决于一天921第2期郜佳蕾,等:

20、基于反馈监督式学习策略的信用卡欺诈检测方法中的被盗信用卡数量.3.5 超参数分析本节将分析影响Ft和AWt性能的因素:1)分类器训练数据中反馈数据的天数(即Q);2)调查人员每天控制的信用卡数量.为此,考虑验证延迟=1 5天,以使得Ft在3 0天的反馈上训练(Q=3 0,M=1 5,=1 5),延迟监督样本在1 5天后到达.如表3所示,在Q=3 0天的反馈上训练的F在C Pk方面的性能较优.当Q=3 0时,AW的性能也随F而上升.因此,在训练过程中使用更多天数的反馈,可有效弥补验证延迟的增加.此外,本文通过在每天使用更多数量的反馈进行了重复实验,以分析该参数对F和AW性能的影响.表4中假设调查

21、人员每天能够核查1 0 0张以上的信用卡,并给出了N C Pk方面的欺诈检测性能,以正确评估在控制更多信用卡时的警报精度.表4得分结果表明,每天更多数量的反馈能够提升欺诈检测性能.表3 使用3 0天数据时的平均C Pk分类器均值s t d秩和值数据集AW0.3 80.1 71 6 7 1.0 0 2 0 1 82 0 1 9F0.3 60.1 71 4 8 2.5 0 2 0 1 82 0 1 9R0.3 10.1 71 2 3 4.5 0 2 0 1 82 0 1 9W0.2 50.1 38 5 0.5 0 2 0 1 82 0 1 9WD0.2 40.1 27 0 5.5 0 2 0 1

22、82 0 1 9S0.2 30.1 26 0 5.5 0 2 0 1 82 0 1 9AW0.3 80.1 46 0 9.0 02 0 1 7F0.3 50.1 45 4 1.0 02 0 1 7R0.2 70.1 14 1 1.5 02 0 1 7W0.2 50.1 33 2 5.5 02 0 1 7WD0.2 40.1 22 8 1.0 02 0 1 7S0.2 00.1 21 9 8.0 02 0 1 7表4 当k1 0 0时的平均NC Pk分类器均值s t d秩和值kAW0.4 80.0 95 0 6.0 03 0 0F0.4 60.1 04 4 8.0 03 0 0W0.3 80.1

23、 12 8 3.0 03 0 0WD0.3 50.1 01 7 2.5 03 0 0AW0.4 10.1 05 1 9.5 01 5 0F0.3 80.1 04 4 1.5 01 5 0W0.2 90.1 02 7 2.5 01 5 0WD0.2 70.0 91 7 9.5 01 5 0AW0.4 00.1 35 1 8.5 01 0 0F0.3 70.1 34 4 3.0 01 0 0W0.2 90.1 03 4 2.5 01 0 0WD0.2 60.1 12 4 9.0 01 0 04 结论与展望文给出了信用卡欺诈检测的形式化描述,提出了一种警报-反馈交互模式,即提供最新监督样本来训练/更

24、新分类器的机制.由于反馈在提出的学习策略中发挥着核心作用,必须在学习过程中向反馈分配较大的重要性权值.因此,本文对两个分类器的后验进行聚合以识别出警报.实验结果验证了所提方法的有效性.未来,本文将尝试将自适应非线性聚合方法应用到在反馈和延迟监督样本上训练的分类器.同时,通过实施排序学习方法,以取代后验概率的线性聚合,进一步提升警报精度.参考文献:1 阳文斯.基于联邦学习的信用卡欺诈检测系统研究D.北京:中国科学院大学(中国科学院深圳先进技术研究院),2 0 2 0.2 VANNU C C IM,C O L L AV.S e l f-r g a n i z i n g-M a p sB a s

25、e dU n d e r s a m p l i n gf o rt h eC l a s s i f i c a t i o no fU n b a l a n c e dD a t a-s e t sC/I E E E W o r l dC o n g r e s so nC o m p u t a t i o n a l I n t e l l i g e n c eWC C I 2 0 1 8.2 0 1 8:7 5-8 6.3 张鹏,叶剑,张鹏.基于概念漂移检测的大数据交易过程模型优化方法 J.电子学报,2 0 1 9,4 7(7

26、):1 4 6 5-1 4 7 4.4 A TAO,HA Z I ML.C o m p a r a t i v eA n a l y s i so fD i f f e r e n tD i s t r i b u t i o n sD a t a s e tb yU s i n gD a t aM i n i n gT e c h n i q u e so nC r e d i tC a r dF r a u dD e t e c t i o nJ.T e h n i c k iV j e s n i k,2 0 2 0,2 7(2):6 1 8-6 2 6.5 KUMA RB,KUMA R

27、S.3 5 6 4AN o v e lA p p r o a c hf o rC r e d i tC a r dF r a u dD e t e c t i o nU s i n gM a c h i n eL e a r n i n gP a r a-d i g mJ.S o l i dS t a t eT e c h n o l o g y,2 0 2 0,6 3(2 s):3 5 6 4-3 5 7 1.6 张爱琦,何燕超,李冬晓.基于静态分析的金融I T系统非功能测试过程质控研究及实践J.中国金融电脑,2 0 1 9,2 1(2):4 8-5 3.7 D E V I D,B I S

28、WA SSK,P UR KAYA S THAB.AC o s t-s e n s i t i v ew e i g h t e dR a n d o mF o r e s tT e c h n i q u e f o rC r e d i tC a r dF r a u dD e t e c t i o nC/2 0 1 91 0 t h I n t e r n a t i o n a lC o n f e r e n c e o nC o m p u t i n g,C o mm u n i c a t i o na n dN e t w o r k i n gT e c h n o l o

29、-031淮阴师范学院学报(自然科学版)第2 2卷g i e s(I C C C N T).2 0 1 9:1 7 7-1 8 5.8 黄家元.一种基于特征敏感的信用卡欺诈检测模型J.计算机科学与应用,2 0 2 1,1 1(1 2):3 0 1 9-3 0 2 7.9 D UD I AK M,MA R T OMP V OG.A ne m p i r i c a l s t u d yo f d a t a i n t r i n s i c c h a r a c t e r i s t i c s t h a tm a k e l e a r n i n g f r o mi m b a l

30、-a n c e dd a t ad i f f i c u l tJ.E x p e r tS y s t e m sw i t hA p p l i c a t i o n s,2 0 2 1,1 8 2(8):2 9 7-3 0 9.1 0 N I NGZ,Y EZ,J I AN GZ,e t a l.B E S S:B a l a n c e de v o l u t i o n a r ys e m i-s t a c k i n gf o rd i s e a s ed e t e c t i o nu s i n gp a r t i a l l yl a b e l e d i

31、 m b a l a n c e dd a t aJ.I n f o r m a t i o nS c i e n c e s,2 0 2 2,5 9 4(8):2 3 3-2 4 8.1 1 D I T Z L E RG,R OV E R IM,A L I P P i I C,e ta l.L e a r n i n gi nn o n s t a-t i o n a r ye n v i r o n m e n t s:As u r v e yJ.C o m p u t a-t i o n a l I n t e l l i g e n c eM a g a z i n e,2 0 1 5

32、,1 0(4):1 2-2 5.1 2 MO R ERS,AWA T OCJ,S H I R G AV ESK,e t a l.C r e d i tC a r dF r a u dD e t e c t i o nU s i n gS u p e r v i s e dL e a r n i n gA p-p r o a c hJ.I n t e r n a t i o n a l J o u r n a l o fS c i e n t i f i c&T e c h n o l o g yR e s e a r c h,2 0 2 1,9(1 0):2 1 6-2 1 9.1 3

33、刘颖,杨轲.基于深度集成学习的类极度不均衡数据信用欺诈检测算法J.计算机研究与发展,2 0 2 1,5 8(3):5 3 9-5 4 7.1 4 L U C A SY,P O R T I E RPE,L A P P R T EL,e t a l.D a t a s e t s h i f t q u a n t i f i c a t i o nf o r c r e d i t c a r df r a u dd e t e c t i o nC/2 0 1 9I E E ES e c o n dI n t e r n a t i o n a lC o n f e r e n c eo n

34、A r t i f i c i a l I n t e l l i g e n c ea n dK n o w l e d g eE n g i n e e r i n g(A I K E).2 0 1 9:3 1 6-3 2 5.1 5 Y L AB,P E PA,L IA,e t a l.T o w a r d sa u t o m a t e df e a t u r ee n g i n e e r i n gf o r c r e d i t c a r df r a u dd e t e c t i o nu s i n gm u l t i-p e r s p e c t i v

35、 eHMM sJ.F u t u r eG e n e r a t i o nC o m p u t e rS y s t e m s,2 0 2 0,1 0 2(3):3 9 3-4 0 2.1 6 P O Z Z O L OAD,C A E L E N O,J o h n s o nRA,e ta l.C a l i b r a t i n gP r o b a b i l i t yw i t hU n d e r s a m p l i n gf o rU n b a l a n c e dC l a s s i f i c a t i o nC/2 0 1 5I E E ES y m

36、 p o s i u mS e r i e so nC o m p u t a t i o n a l I n t e l l i g e n c e(S S C I).2 0 1 6:1 5 9-1 6 6.1 7 K ON I J N R M,DU I V E S T E I J N W,ME E NG M,e ta l.C o s t-b a s e dq u a l i t ym e a s u r e si ns u b g r o u pd i s c o v e r yJ.J o u r n a l o f I n t e l l i g e n t I n f o r m a

37、t i o nS y s t e m s,2 0 1 5,4 5(3):3 3 7-3 5 5.1 8 李梦涛,吕朝辉.基于数据挖掘的信用卡欺诈检测J.中国传媒大学学报(自然科学版),2 0 2 0,2 7(6):6 9-7 3.C r e d i tC a r dF r a u dD e t e c t i o nM e t h o db a s e do nF e e d b a c kS u p e r v i s e dL e a r n i n gS t r a t e g yGAOJ i a-l e i1,GAOJ i a-h u i2(1.S c h o o l o fA c c

38、 o u n t i n ga n dF i n a n c e,H e f e iV o c a t i o n a lC o l l e g eo fF i n a n c ea n dE c o n o m i c s,H e f e iA n h u i 2 3 0 6 0 1,C h i n a)(2.S c h o o l o fE d u c a t i o na n dP s y c h o l o g i c a lS c i e n c e,U n i v e r s i t yo f J i n a n,J i n a nS h a n d o n g2 5 0 0 2

39、2,C h i n a)A b s t r a c t:I no r d e r t o i m p r o v e t h ep r a c t i c a b i l i t ya n dr e l i a b i l i t yo f c r e d i tc a r df r a u dd e t e c t i o n,af e e d-b a c ks u p e r v i s e d l e a r n i n gs t r a t e g yd e t e c t i o nm e t h o d i sp r o p o s e d.F i r s t l y,t h ec

40、 l a s s i f i e r i s t r a i n e ds e p a-r a t e l yb yf e e d b a c k i n f o r m a t i o nt oe n s u r eah i g hc o r r e l a t i o nw i t ht h e s es u p e r v i s e ds a m p l e s.S i n c eb o t hf e e d b a c ka n da l a r mi n f o r m a t i o na r ea f f e c t e db ys a m p l es e l e c t i

41、 o nb i a s(S S B),d i f f e r e n tc l a s s i f i e r sa r et r a i n e df r o mf e e d b a c ka n dd e l a ym o n i t o r i n gs a m p l e s,a n d t h e i rp r e d i c t i o n s a r e s u mm a r i z e d.T h e n,t h el e a r n i n gs t r a t e g y i st e s t e dt h r o u g hal a r g en u m b e ro

42、fc r e d i tc a r dt r a n s a c t i o n s.T h ee x p e r i m e n t a l r e-s u l t ss h o wt h a t t h ep r o p o s e dd e t e c t i o nm e t h o dc a ne f f e c t i v e l ys o l v et h ep r o b l e m so fc l a s s i f i c a t i o ni m-b a l a n c ea n dc o n c e p td r i f t.C o m p a r e dw i t h

43、o t h e re x c e l l e n tm e t h o d s,t h i ss t r a t e g yh a sl o w e rc o s ta n dp r a c t i c a l r e f e r e n c ev a l u e.K e yw o r d s:c r e d i t c a r d f r a u dd e t e c t i o n;f e e d b a c ks u p e r v i s e d;s a m p l e s e l e c t i o nb i a s;c l a s s i f i c a t i o n i m-b a l a n c e;c l a s s i f i e r 责任编辑:李春红131第2期郜佳蕾,等:基于反馈监督式学习策略的信用卡欺诈检测方法

展开阅读全文