1、资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。消费金融信用风险研究信用评分概述本中心风险研究小组丁正中壹、 信用评分的发展历史(Historyofcreditscoring)信用源于拉丁语credo, 意谓相信(believe), 因为借贷双方彼此信任的关系而达成交易, 但借方为降低损失, 在决定借款前, 会先评估借款人的风险高低, 作为是否借款之参考, 而信用评分(CreditScoring)便是基于这样的概念, 所发展出来的风险评估工具。一般认为Durand在1941年将Fisher(1936)提出的鉴别分析方法(DiscriminantAnalysis)应用于区别贷款客户
2、好坏, 为信用评分应用之开端。另有一种说法是, 在1930年代, 邮购公司(mail-ordercompany)为了克服不同的信用分析人员对于信用决策产生不一致情形, 引进数值评分系统, 而二次世界大战发生后, 因大多人都投入战场, 许多信贷公司(financehouse)及邮购公司缺乏专家做信用分析工作, 这些公司便要求有经验的人将评估信用的准则写出来, 方便没有经验的人做贷款决策。总之, 早期设计评分卡(Scorecard)统计学家, 最初的想法, 是想仿照在申请保险时, 会有一张评分卡, 依据不同年龄及性别, 而给予不同的费率, 若是银行在办理贷款时, 也能设计一张评分卡, 依据贷款客户
3、的特性, 给予不同分数, 作为是否授信的依据, 能够有效节省核贷的时间, 又能达到风险管理的目的。在1950年代, 已经有人将自动化的信用决策与统计分类技术结合, 发展帮助授信决策的模式, 但因计算工具的不便, 在样本数及评分模式设计上限制颇多。而在此期间, 由数学家BillFair及工程师EarlIsaac在旧金山(SanFrancisco)成立第一家信用评分顾问公司。1960年代信用卡的出现, 让银行及信用卡发卡机构了解到信用评分是非常好用的工具, 因每日都有大量的申请案件, 在成本及人力考虑下, 自动化的决策能够节省不少成本及人力, 又能维持一定的决策质量, 而随着计算机科技的快速演进,
4、 信用评分与决策支持系统(decisionsupportsystem)结合, 使应用层面更广泛, 例如: 汽车贷款、 信用卡、 邮购、 直销、 房贷、 保单、 手机账户等皆可透过评分系统作客户管理。贰、 信用评分原理(ThePrincipleofCreditScoring)信用评分基本原理是借由分析技术, 由过去的资料来研发能预测未来授信客户表现的分数, 其假设在授信审核时有一些已知的客户特性(characteristics), 会与授信客户未来是否准时还款有关连, 一旦找出这些关连性, 在假设未来情况会与过去相类似的情形下, 能够套用现在的数据, 作未来的预测。这些假设与早期授信人员大多运用
5、过去授信审核的经验, 判断授信户未来是否还款的情形相同, 所不同的是现在许多数据可纪录在数据库中, 藉由软件及算法(algorithm)的辅助, 可使分析更精确。特别要注意的是, 信用评分模式是假设未来情况会与过去相类似(Thefuturewillresemblethepast), 但未必都是如此, 且一般时间经过越久, 信用评分模式预测力会越差, 因此评分模式建立完成后, 会持续监控(monitoring), 以确保评分模式能有效运作。参、 信用评分模式研发步骤(CreditScoringModelDevelopmentProcess)研发信用评分模式, 要有熟悉市场分析、 风险管理及统计方
6、法的人员, 并由信息部门提供数据库及程序开发等相关协助, 但要是否要自行研发, 并没有标准答案, 时间、 成本、 人员训练及未来维护都是考虑的重点。本中心就先前研发信用卡申请人评分的经验, 大致整理以下研发步骤, 或可提供有意自行研发的金融机构作为参考。一、 研究目的及定义(ObjectiveandGood/BadDefinition)要发展评分模式前, 必须先决定研究目的及想要预测的事件, 并要有明确定义, 未来在应用及解释上才不致混淆, 因此事件定义是经由讨论决定, 而非分析人员单独决定。例如: 研究目的为预测授信客户未来一年发生违约的事件, 但违约事件有许多不同定义, 数据源也可能不同,
7、 许多问题要逐一厘清, 讨论会变得冗长而没有效率, 因此在讨论前, 先决定想要达成的目的, 请信息部门提供数据库中相关的数据, 并由分析人员作初步分析, 开始讨论时会较有效率。值得注意的是, 越复杂的定义, 数据取得也越困难, 因此定义除了要明确, 也应尽量简化。另外, 模式未来应用目的不同, 定义也可能不一样, 例如: 同样是延迟缴款超过45天的客户, 若模式的目的是在增加获利或市占率, 较有可能定义为好客户(Good), 但若目的是减少损失, 较有可能定义为坏客户(Bad)。二、 数据库与选择样本(DatabaseandSampleSelection)本中心先前将过期数据保存在磁带中, 造
8、成研究人员在资料撷取时的不便, 在去年开始建置数据仓储(DataWarehouse), 保存所有时点数据状态, 方便日后研究使用, 同时可避免占用在线数据库资源, 降低对日常营运所产生的影响。数据仓储因数据量庞大, 撷取较耗时, 建立数据超市(DataMart)可节省数据撷取的时间, 且在设计数据超市字段时, 请资深分析人员提供相关经验, 未来可节省数据整理及转换的时间。抽样(Sampling)能够解决资料量过大的问题, 分析时更具效率, 但必须掌握研究目标群体(TargetPopulation)特性, 避免抽样时产生偏误。另外, 越大的样本会有越好的评分结果, 这种说法并非完全正确, 因一般
9、好客户多于坏客户, 假设所有条件都相同的情况下, 100,000个好客户与500个坏客户所建立的评分模式, 正确判断力会低于只有10000个好客户与3,000个坏客户所建立的评分模式。将样本分为发展组样本(DevelopmentSample)与测试组(HoldoutSample), 模式研发完成后作验证(Validation), 可避免研究人员选样的偏差(bias)或忽略了某些重要的因子, 造成模式在实际应用时产生落差。三、 清理资料(CleantheData)”Garbagein,garbageout.”虽然大家都知道这个道理, 但实际上要将数据清理干净, 却不是件容易的事。一般数据转入数据
10、仓储(DataWarehouse)前, 信息人员所订定的准则大多是数据是否符合字段的定义, 但不保证分析时不会有问题, 以年龄为例, 在数据转入数据仓储时要符合数值型态, 且设定上限为120, 下限为0, 但经分析人员分析后, 发现18岁以下也有信用卡主卡, 甚至有许多数值集中在99, 显然这些年龄是有问题的。如果资料量不多, 对于分析结果不致影响太大, 能够直接删除或将数据作区隔, 但仍需了解资料从何处取得, 因为有问题的资料一般是来源相同。四、 分析资料(AnalyzetheData)分析的主要目的是找出隐含在数据中的相关(Correlations)、 型态(Patterns)、 集群(C
11、lusters)、 趋势(Trends), 资料虽经过前述的清理步骤, 一般还需要经过数据转换(DataTransformation), 才能进行分析。例如: 数据库中会纪录信用卡的发卡日期与停卡日期, 但分析时的变量可能需要信用卡持卡期间( Duration) , 这时候就要经过数据转换的过程。事实上数据转换有很多技巧, 有时还牵扯到一些复杂的数学运算, 如: Log、 SIN、 COSIN等转换, 但转换的主要目的是要能分析出有意义的结果, 分析人员除了了解数据转换及分析方法, 也要了解最初定义的研究目的, 才有可能得到最后的结果。五、 建立模式(ModelBuilding)建立模式可运用
12、的方法非常多, 可分为统计方法(StatisticalMethods)与非统计方法(Non-statisticalMethods)两种类型, 常见的统计方法包含有鉴别分析(DiscriminantAnalysis)、 回归(regression)、 逻辑斯回归(logisticregression)、 分类树(ClassificationTrees)等; 而非统计方法有类神经网络(NeuralNetworks)、 基因算法(GeneticAlgorithms)、 专家系统(ExpertSystems)等。不同的方法, 有不同的假设与限制, 选用之前必须先考虑清楚, 避免误用。在实务运用上, 选
13、用逻辑斯回归(logisticregression)来建构评分模式, 结果可直接产生评分卡(Scorecard), 在模式实行(implementation)上成本较低也较快速, 是许多模式研发人员(Modeler)常选用的方法。信用评分一般是将客户分为好客户(Good)与坏客户(Bad), 就应用而言, 回归模式虽简单易懂, 但已逐渐被逻辑斯回归模式所取代, 主要是受到以下两种因素影响: 1.回归模式所计算出来的条件机率估计值(Estimateofconditionalprobability), 有可能会大于1或小于0, 违反机率须介于0与1之间的定义。2.在回归模式中, 假设自变量(Ind
14、ependentVariable)X与因变量(DependentVariable)Y之间的关系为线性, 则不论X值为何, 其对条件机率的边际影响都是恒定的, 显然与我们一般的认知不符。举例而言, 假设购买房屋决策(买或不买)与收入有关, 若收入太低, 即使增加20-30%的收入, 依然是买不起, 对决策没有影响; 另一种情况是收入已在某一水平之上, 购买机率趋近于1时, 收入再增加, 对于购买的决策也不再有影响。回归模式一般X愈是趋近两端, 条件机率愈不易有明显变化, 而逻辑斯回归模式, 当X愈趋近-, 条件机率以愈来愈慢的速度趋近于0; 当X愈趋近, 条件机率以愈来愈慢的速度趋近于1。以图形
15、来说明, 若研究收入与信用好坏的关系, 以横轴为收入, 好客户(Good)为1, 坏客户为0, 可描绘出图1。若同时配适(fit)回归与逻辑斯回归模式, 由图2可看出, 逻辑斯回归呈现S型, 会与实际观察值较接近。图1回归与逻辑斯回归模式比较(1)图2回归与逻辑斯回归模式比较(2)模式建立最后步骤, 必须以测试组样本(HoldoutSample)作验证(Validation), 除可避免抽样偏误(Bias)的问题, 亦可检视模式过度配适(Over-fitting)的问题。若模式运用发展组样本的预测力非常好, 但用另一组数据预测力却显著下降时, 显然模式不够稳健(Robust), 未来实际运用时
16、, 会因数据不同而产生不一致的预测结果。六、 模式部署及系统测试(DeploytheModelandSystemTest)模式终究是帮助人做决策参考, 在模式经过验证后, 必须将模式产生结果写入日常使用的决策系统中, 提供未来作决策时参考。在此阶段, 信息部门(ITDepartment)扮演关键角色, 但熟悉业务、 风险管理及统计方法人员的配合也很重要。另外, 必须制作相关文件及作人员训练, 在系统测试时, 有助于评估系统运作是否与先前设定的目有一致性, 也能降低未来使用时对于评分(Score)的误解或误用。七、 持续监控(MonitoringandTracking)评分模式的预测力会因时间不
17、同而有变化, 透过定期及持续性的模式监控, 能够确认模式的预测力仍在合理范围内。若模式预测力与发展模式时有显著差异, 则必须调整评分模式的结果或重新建构新的评分模式。评分模式能够预测未来发生客户违约的机率, 假设高风险有高获利, 同样的客户, 风险管理人员与市场分析人员可能会有不一致的看法, 将应用模式所产生的决策纪录下来, 并持续追踪, 适时调整决策, 较能取得风险与获利的平衡点。肆、 结语信用评分是将数据(Data)转换为可用知识(Knowledge)协助决策的过程, 对照现在许多企业使用数据采矿(datamining)的方法, 会发现两者的方法都相类似, 都是由数据为开端, 找出隐含于数
18、据中的知识, 根据所得到的知识作决策, 不同的仅是应用领域不同, 而有不同的名称。使用信用评分的优点有降低人事成本, 决策更有效率及一致性(Consistency)等。虽然有研发成本较高, 如: 购买软硬件设备及顾问费用, 评分结果可能会被误解或误用等缺点, 也有人批评某些建立评分模式的方法, 像黑箱作业, 无法解释清楚, 可是就如同一句谚语所说: ”Theproofofthepuddingisintheeating.”, 好坏试过即知。参考文献1、 郭敏华( ),债信评等,台北:智胜文化2、 LynC.Thomas,DavidB.EdelmanandJonathanN.Crook( ),Cr
19、editScoringanditsApplications,Philadelphia:SIAM3、 ElizabethMays( ),HandbookofCreditScoring,NewYork:AMACOM4、 DavidW.Hosmer,StanleyLemeshow( ),AppliedLogisticRegression,NewYork:JonhnWiley&Sons,Inc.5、 ElizabethMays(1998),CreditRiskModeling:DesignandApplication,NewYork:AMACOM6、 JohnB.Caouette,EdwardI.Altman,andPaulNarayanan(1998),ManagingCreditRisk,NewYork:JonhnWiley&Sons,Inc.7、 RobertCole,LonMishler(1998),ConsumerandBusinessCreditManagement,NewYork:Irwin/McGraw-Hill