1、资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。 消费金融信用风险研究—信用评分概述 本中心风险研究小组 丁正中 壹、 信用评分的发展历史(Historyofcreditscoring) 信用源于拉丁语credo, 意谓「相信」(believe), 因为借贷双方彼此信任的关系而达成交易, 但借方为降低损失, 在决定借款前, 会先评估借款人的风险高低, 作为是否借款之参考, 而信用评分(CreditScoring)便是基于这样的概念, 所发展出来的风险评估工具。一般认为Durand在1941年将Fisher(1936)提出的鉴别分析方法(DiscriminantAnaly
2、sis)应用于区别贷款客户好坏, 为信用评分应用之开端。另有一种说法是, 在1930年代, 邮购公司(mail-ordercompany)为了克服不同的信用分析人员对于信用决策产生不一致情形, 引进数值评分系统, 而二次世界大战发生后, 因大多人都投入战场, 许多信贷公司(financehouse)及邮购公司缺乏专家做信用分析工作, 这些公司便要求有经验的人将评估信用的准则写出来, 方便没有经验的人做贷款决策。总之, 早期设计评分卡(Scorecard)统计学家, 最初的想法, 是想仿照在申请保险时, 会有一张评分卡, 依据不同年龄及性别, 而给予不同的费率, 若是银行在办理贷款时, 也能设计
3、一张评分卡, 依据贷款客户的特性, 给予不同分数, 作为是否授信的依据, 能够有效节省核贷的时间, 又能达到风险管理的目的。 在1950年代, 已经有人将自动化的信用决策与统计分类技术结合, 发展帮助授信决策的模式, 但因计算工具的不便, 在样本数及评分模式设计上限制颇多。而在此期间, 由数学家BillFair及工程师EarlIsaac在旧金山(SanFrancisco)成立第一家信用评分顾问公司。1960年代信用卡的出现, 让银行及信用卡发卡机构了解到信用评分是非常好用的工具, 因每日都有大量的申请案件, 在成本及人力考虑下, 自动化的决策能够节省不少成本及人力, 又能维持一定的决策质量,
4、 而随着计算机科技的快速演进, 信用评分与决策支持系统(decisionsupportsystem)结合, 使应用层面更广泛, 例如: 汽车贷款、 信用卡、 邮购、 直销、 房贷、 保单、 手机账户等皆可透过评分系统作客户管理。 贰、 信用评分原理(ThePrincipleofCreditScoring) 信用评分基本原理是借由分析技术, 由过去的资料来研发能预测未来授信客户表现的分数, 其假设在授信审核时有一些已知的客户特性(characteristics), 会与授信客户未来是否准时还款有关连, 一旦找出这些关连性, 在假设未来情况会与过去相类似的情形下, 能够套用现在的数据, 作未来
5、的预测。这些假设与早期授信人员大多运用过去授信审核的经验, 判断授信户未来是否还款的情形相同, 所不同的是现在许多数据可纪录在数据库中, 藉由软件及算法(algorithm)的辅助, 可使分析更精确。特别要注意的是, 信用评分模式是假设未来情况会与过去相类似(Thefuturewillresemblethepast), 但未必都是如此, 且一般时间经过越久, 信用评分模式预测力会越差, 因此评分模式建立完成后, 会持续监控(monitoring), 以确保评分模式能有效运作。 参、 信用评分模式研发步骤(CreditScoringModelDevelopmentProcess) 研发信用评
6、分模式, 要有熟悉市场分析、 风险管理及统计方法的人员, 并由信息部门提供数据库及程序开发等相关协助, 但要是否要自行研发, 并没有标准答案, 时间、 成本、 人员训练及未来维护都是考虑的重点。本中心就先前研发信用卡申请人评分的经验, 大致整理以下研发步骤, 或可提供有意自行研发的金融机构作为参考。 一、 研究目的及定义(ObjectiveandGood/BadDefinition) 要发展评分模式前, 必须先决定研究目的及想要预测的事件, 并要有明确定义, 未来在应用及解释上才不致混淆, 因此事件定义是经由讨论决定, 而非分析人员单独决定。例如: 研究目的为预测授信客户未来一年发生违约的
7、事件, 但违约事件有许多不同定义, 数据源也可能不同, 许多问题要逐一厘清, 讨论会变得冗长而没有效率, 因此在讨论前, 先决定想要达成的目的, 请信息部门提供数据库中相关的数据, 并由分析人员作初步分析, 开始讨论时会较有效率。值得注意的是, 越复杂的定义, 数据取得也越困难, 因此定义除了要明确, 也应尽量简化。另外, 模式未来应用目的不同, 定义也可能不一样, 例如: 同样是延迟缴款超过45天的客户, 若模式的目的是在增加获利或市占率, 较有可能定义为好客户(Good), 但若目的是减少损失, 较有可能定义为坏客户(Bad)。 二、 数据库与选择样本(DatabaseandSample
8、Selection) 本中心先前将过期数据保存在磁带中, 造成研究人员在资料撷取时的不便, 在去年开始建置数据仓储(DataWarehouse), 保存所有时点数据状态, 方便日后研究使用, 同时可避免占用在线数据库资源, 降低对日常营运所产生的影响。数据仓储因数据量庞大, 撷取较耗时, 建立数据超市(DataMart)可节省数据撷取的时间, 且在设计数据超市字段时, 请资深分析人员提供相关经验, 未来可节省数据整理及转换的时间。 抽样(Sampling)能够解决资料量过大的问题, 分析时更具效率, 但必须掌握研究目标群体(TargetPopulation)特性, 避免抽样时产生偏误。另外
9、 越大的样本会有越好的评分结果, 这种说法并非完全正确, 因一般好客户多于坏客户, 假设所有条件都相同的情况下, 100,000个好客户与500个坏客户所建立的评分模式, 正确判断力会低于只有10000个好客户与3,000个坏客户所建立的评分模式。将样本分为发展组样本(DevelopmentSample)与测试组(HoldoutSample), 模式研发完成后作验证(Validation), 可避免研究人员选样的偏差(bias)或忽略了某些重要的因子, 造成模式在实际应用时产生落差。 三、 清理资料(CleantheData) ”Garbagein,garbageout.”虽然大家都知道
10、这个道理, 但实际上要将数据清理干净, 却不是件容易的事。一般数据转入数据仓储(DataWarehouse)前, 信息人员所订定的准则大多是数据是否符合字段的定义, 但不保证分析时不会有问题, 以年龄为例, 在数据转入数据仓储时要符合数值型态, 且设定上限为120, 下限为0, 但经分析人员分析后, 发现18岁以下也有信用卡主卡, 甚至有许多数值集中在99, 显然这些年龄是有问题的。如果资料量不多, 对于分析结果不致影响太大, 能够直接删除或将数据作区隔, 但仍需了解资料从何处取得, 因为有问题的资料一般是来源相同。 四、 分析资料(AnalyzetheData) 分析的主要目的是找出隐含
11、在数据中的相关(Correlations)、 型态(Patterns)、 集群(Clusters)、 趋势(Trends), 资料虽经过前述的清理步骤, 一般还需要经过数据转换(DataTransformation), 才能进行分析。例如: 数据库中会纪录信用卡的发卡日期与停卡日期, 但分析时的变量可能需要信用卡持卡期间( Duration) , 这时候就要经过数据转换的过程。事实上数据转换有很多技巧, 有时还牵扯到一些复杂的数学运算, 如: Log、 SIN、 COSIN等转换, 但转换的主要目的是要能分析出有意义的结果, 分析人员除了了解数据转换及分析方法, 也要了解最初定义的研究目的,
12、才有可能得到最后的结果。 五、 建立模式(ModelBuilding) 建立模式可运用的方法非常多, 可分为统计方法(StatisticalMethods)与非统计方法(Non-statisticalMethods)两种类型, 常见的统计方法包含有鉴别分析(DiscriminantAnalysis)、 回归(regression)、 逻辑斯回归(logisticregression)、 分类树(ClassificationTrees)等; 而非统计方法有类神经网络(NeuralNetworks)、 基因算法(GeneticAlgorithms)、 专家系统(ExpertSystems)等。
13、不同的方法, 有不同的假设与限制, 选用之前必须先考虑清楚, 避免误用。在实务运用上, 选用逻辑斯回归(logisticregression)来建构评分模式, 结果可直接产生评分卡(Scorecard), 在模式实行(implementation)上成本较低也较快速, 是许多模式研发人员(Modeler)常选用的方法。 信用评分一般是将客户分为好客户(Good)与坏客户(Bad), 就应用而言, 回归模式虽简单易懂, 但已逐渐被逻辑斯回归模式所取代, 主要是受到以下两种因素影响: 1.回归模式所计算出来的条件机率估计值(Estimateofconditionalprobability),
14、 有可能会大于1或小于0, 违反机率须介于0与1之间的定义。 2.在回归模式中, 假设自变量(IndependentVariable)X与因变量(DependentVariable)Y之间的关系为线性, 则不论X值为何, 其对条件机率的边际影响都是恒定的, 显然与我们一般的认知不符。举例而言, 假设购买房屋决策(买或不买)与收入有关, 若收入太低, 即使增加20-30%的收入, 依然是买不起, 对决策没有影响; 另一种情况是收入已在某一水平之上, 购买机率趋近于1时, 收入再增加, 对于购买的决策也不再有影响。 回归模式一般X愈是趋近两端, 条件机率愈不易有明显变化, 而逻辑斯回归模式,
15、当X愈趋近-∞, 条件机率以愈来愈慢的速度趋近于0; 当X愈趋近∞, 条件机率以愈来愈慢的速度趋近于1。以图形来说明, 若研究收入与信用好坏的关系, 以横轴为收入, 好客户(Good)为1, 坏客户为0, 可描绘出图1。若同时配适(fit)回归与逻辑斯回归模式, 由图2可看出, 逻辑斯回归呈现S型, 会与实际观察值较接近。 图1回归与逻辑斯回归模式比较(1) 图2回归与逻辑斯回归模式比较(2) 模式建立最后步骤, 必须以测试组样本(HoldoutSample)作验证(Validation), 除可避免抽样偏误(Bias)的问题, 亦可检视模式过度配适(Over-fitting
16、)的问题。若模式运用发展组样本的预测力非常好, 但用另一组数据预测力却显著下降时, 显然模式不够稳健(Robust), 未来实际运用时, 会因数据不同而产生不一致的预测结果。 六、 模式部署及系统测试(DeploytheModelandSystemTest) 模式终究是帮助人做决策参考, 在模式经过验证后, 必须将模式产生结果写入日常使用的决策系统中, 提供未来作决策时参考。在此阶段, 信息部门(ITDepartment)扮演关键角色, 但熟悉业务、 风险管理及统计方法人员的配合也很重要。另外, 必须制作相关文件及作人员训练, 在系统测试时, 有助于评估系统运作是否与先前设定的目有一致性,
17、 也能降低未来使用时对于评分(Score)的误解或误用。 七、 持续监控(MonitoringandTracking) 评分模式的预测力会因时间不同而有变化, 透过定期及持续性的模式监控, 能够确认模式的预测力仍在合理范围内。若模式预测力与发展模式时有显著差异, 则必须调整评分模式的结果或重新建构新的评分模式。 评分模式能够预测未来发生客户违约的机率, 假设高风险有高获利, 同样的客户, 风险管理人员与市场分析人员可能会有不一致的看法, 将应用模式所产生的决策纪录下来, 并持续追踪, 适时调整决策, 较能取得风险与获利的平衡点。 肆、 结语 信用评分是将数据(Data)转换为可用知识
18、Knowledge)协助决策的过程, 对照现在许多企业使用数据采矿(datamining)的方法, 会发现两者的方法都相类似, 都是由数据为开端, 找出隐含于数据中的知识, 根据所得到的知识作决策, 不同的仅是应用领域不同, 而有不同的名称。 使用信用评分的优点有降低人事成本, 决策更有效率及一致性(Consistency)等。虽然有研发成本较高, 如: 购买软硬件设备及顾问费用, 评分结果可能会被误解或误用等缺点, 也有人批评某些建立评分模式的方法, 像黑箱作业, 无法解释清楚, 可是就如同一句谚语所说: ”Theproofofthepuddingisintheeating.”, 好坏试
19、过即知。 参考文献 1、 郭敏华( ),债信评等,台北:智胜文化 2、 LynC.Thomas,DavidB.EdelmanandJonathanN.Crook( ),CreditScoringanditsApplications,Philadelphia:SIAM 3、 ElizabethMays( ),HandbookofCreditScoring,NewYork:AMACOM 4、 DavidW.Hosmer,StanleyLemeshow( ),AppliedLogisticRegression,NewYork:JonhnWiley&Sons,Inc. 5、 ElizabethMays(1998),CreditRiskModeling:DesignandApplication,NewYork:AMACOM 6、 JohnB.Caouette,EdwardI.Altman,andPaulNarayanan(1998),ManagingCreditRisk,NewYork:JonhnWiley&Sons,Inc. 7、 RobertCole,LonMishler(1998),ConsumerandBusinessCreditManagement,NewYork:Irwin/McGraw-Hill






