资源描述
信息时代舞弊审计新工具
——奔福德定律及其来自中国上市公司的实证测试
【摘要】 奔福德定律是一个早在1881年就被人们发现的数学定律,该定律描述了整数1~9在数据首位出现的概率分布规律。近些年来,随着信息技术和调查与法务会计在北美会计领域的兴起,借助于现代计算机数值分析技术,人们发掘了这一古老数学规律在舞弊审计方面所具有的独特功效。本文在简要介绍奔福德定律的基础上,利用我国上市公司的财务数据资料对奔福德定律进行了测试,得出了一系列有意义的结论,提出了以奔福德定律作为信息时代舞弊审计新工具,查找上市公司财务舞弊征兆的新思路。
【关键词】 奔福德定律 舞弊审计 上市公司 测试 舞弊征兆
奔福德定律(Benford’s Law)是一个早在1881年就被人们发现,古老而有趣的数学定律。近些年来,随着XBRL技术和计算机辅助数据分析技术在审计领域的应用,借助于计算机数值分析技术,人们发现了这一定律在侦查财务舞弊征兆方面所具有的独特功效,使得沉睡了百余年的古老数学定律焕发出了新的生机。本文利用我国上市公司提供的公开财务数据,借助于数值分析技术手段,就我国上市公司公布的主要财务数据的数字的数值表现是否符合奔福德定律进行了验证性测试。
一、奔福德定律:古老而又有趣的数学规律
奔福德定律是由美国数学家、天文学家塞蒙.纽卡姆(Simon Newcomb)在1881年首次偶然发现的。1881年的一天在使用对数表做计算时,塞蒙.纽卡姆突然注意到了对数表的第一页要比其他页更为破旧。奇怪的现象激发了他的研究兴趣,当时他所能得到的唯一的解释是人们对小数字的计算量要大于对大数字的计算量。经过大量的统计分析,他发现了许多类型的数字都很好地符合这样的规律:以1为第一位数的随机数要比以2为第一位数的随机数出现的概率要大,而以2为第一位数的随机数要比以3为第一位数的随机数出现的概率要大,以此类推。当时塞蒙.纽卡姆关注这一数学现象完全是出于好奇,并没有对这一定律做出任何解释。由于当时的人们对这一规律的运用缺乏兴趣,塞蒙.纽卡姆的这一发现很快就被人们淡忘了。
1938年,美国通用电器(GE)的物理学家弗瑞克.奔福德(Frank Benford)注意到了同样的现象。他收集并验证了总数为20229个数字,其中包括篮球比赛的数字,河流的长度、湖泊的面积、各个城市的人口分布数字、在某一杂志里出现的所有数字。他发现在这些数字中,整数l在数字中第一位出现的概率大约为30%;整数2在数字中第一位出现的概率大约为17%,整数3在数字第一位出现的概率约为12%,而8和9在数字中第一位出现的概率约为5%和4%。这一规律因此也被人们称为“第1位数分布规律”。
以下是弗瑞克.奔福德在1938年推导出的描述奔福德定律的数学表达式:
E’[digit(n)]=log10(l+l/n)
式中:N为整数l,2,3,4,5,6,7,s,9……,E’[digit(n)]为整数N在数字首位出现的期望概率。我们分别将整数l,2,3,4,5,6,7,8,9代人上式,我们便可以得出各整数在正常分布的样本数据首位上出现的概率。表1和图1给出了整数1~9在数字首位上出现的期望概率数值与分布图。
在奔福德1938年对数据首位数出现的期望概率研究的基础上,后人又进一步研究与推广了这一理论,研究与拓展了数字0~9在数位的第二位、第三位、第四位以及前两位数和后两位数的分布概率。表2与图2给出了数字0~9在第二位、第三位、第四位数出现了期望概率值及其分布图。
奔福德定律揭示了数字0~9在呈自然状态下数据的不同位数上的概率分布的统计规律。利用这样的规律,我们可以通过检查各类财务数据是否符合奔福德定律来判定这些数字是否经过人为操纵。如果某类财务数据经过人为的操控,比如受到盈余管理或会计造假的非正常操作,而呈非自然状态,那么这类数据的数值分布就会与奔福德定律所描述的理论数值分布值存在一定程度的差异。鉴于此,我们可以将奔福德定律作为检查财务数字信息是否真实的检验器。
二、奔福德定律的验证性测试:来自中国上市公司的数据
(一) 样本选择与数据来源
本文选择了截止于2006年12月8日沪深两市发行A股的1447家上市公司公布的6项主要财务指标:资产总额、股东权益总额、资本公积、主营业务收人、利润总额和净利润为样本数据。
行业分类按照中国证监会对行业划分的方法,选取了信息技术、食品饮料、医药生物、房地产业、农林牧渔、普通机械、电器机械等14类行业。
板块类别按照ST公司、中小企业、中证100、沪深B股、沪深300和新富200选择样本数据。
财务报表舞弊样本公司选择在近年因提供虚假财务报告而受到中国证监会公开处罚的上市公司,包括银广夏、蓝田股份(ST生态)、西安达尔曼、大庆联谊和天津磁卡。样本数据取自这些公司自1999年至2005年以来公布的年度报告中的全部会计报表数据(不含蓝田股份与西安达尔曼自退市以来的数据)。
上述样本数据来源于大智慧证券信息平台、上海证券交易所网站( )、巨潮资讯网(.en )和中国证监会网站( )。
(二)测试假设
假设1:我国上市公司年度报告披露的财务数据总体上应符合奔福德定律。
假设2:我国上市公司不同的财务指标其总体的数值表现在符合奔福德定律方面应有所差别,其中“主营业务收人”与“资产总额”这两个最易于被上市公司操纵的财务指标的数值分布与奔福德定律理论分布值应该有一定程度的差异。
假设3:不同行业与不同板块的财务数据在符合奔福德定律的程度上会存在差异,其隐含的假设是不同行业与不同板块的上市公司在会计信息披露的客观性方面是存在差异的,其中ST板块的上市公司由于有“摘帽”的动机与操作会计信息的行为倾向,其披露的财务数据的数字分布与奔福德定律理论值应该存在一定程度的差异。
假设4:已经被证实披露过虚假财务信息的非诚信上市公司在会计造假年份的财务数据数值分布与奔福德定律的理论数值分布存在显著的差异。
(三)测试结果
1. 沪深A股公司
表3给出了截止于2006年12月8日沪深两市发行A股的1447家上市公司、沪市849家上市公司和深市598上市公司公布的主要财务数据的首位数分布情况以及与奔福德定律理论分布值的比较。
从表3我们可以看出,我国沪深两市A股上市公司的主要财务数据的首位数的分布明显呈现出了奔福德定律所描述的数据首位数出现概率递减的规律。
注1:表中相关系数(Correlation Coefficient )表示样本数据集合与奔福德定律理论数据集的相关程度该相关系数越是接近于l,表明该两个数据集越是相关。
注2:表中的样本数为有效样本数。在统计时笔者剔除了部分公司资本公积、主营业务收人与净利润为0的无效样本。表4、表5、表6与表7都有同样的情况。
表4、表5分布给出了沪市与深市A股上市公司公布的各主要财务指标的首位数分布的概率以及与奔福德定律理论值比较的结果。
2. 不同板块
表6列出了笔者对取自不同板块的样本数据进行测试以及与奔福德定律理论值比较的结果。
由表6所列的概率分布数值以及相关系数我们可以清楚地看出:不同板块的上市公司其财务数据数值分布与奔福德定律理论分布值间存在一定程度的差异,其中ST公司和中小企业板块的数值分布与奔福德定律理论值差异最大,而沪深300和新富200板块的数值分布与理论值最为接近。
3. 不同行业
表7给出了笔者对来自不同行业的样本数据进行测试以及与奔福德定律理论值比较的结果。
由表中不同行业的主要财务指标的首位数概率分布数值以及经过排序后的相关系数数值我们可以看出不同行业的财务数据的数值分布与奔福德定律理论值的一致性方面存在较大差异,其中信息技术、化学制品、农林牧渔和食品饮料这4个行业主要财务指标的首位数概率分布数值与奔福德定律理论值有较好的一致性,黑色金属、金属制品、建筑业和纺织业的财务数据数值分布与奔福德定律理论值存在较大程度的差异(截止笔者下载数据时,我国金属制品行业只有17家上市公司,样本数据较少有可能是造成数据偏差)。
4. 财务报表舞弊公司
表8、表9与图2列出了笔者对五家已经被证实曾经实施了财务报告舞弊的上市公司进行财务数据首位数分布的测试结果:
由上述图表我们可以看出:
(1) 银广夏(现为ST广夏,股票代码为000557)在除了2004年以外的其他年份里其相关系数均低于0.99。在银广夏会计造假最为猖獗的1999年和2000年里,其相关系数分别为0.9798和0.9833。值得注意的是在银广夏财务舞弊被揭露以后的2001年、2002年、2003年和2005年里,其相关系数依然较低,尤其以2002年为最低。
(2) 天津磁卡(现为*ST磁卡,股票代码600800)在1999年至2005年的7年间,除2002年的相关系数为0.988外,其余年份的相关系数均低于0.98,其中以2004年最低,达到了0.9110。在受到中国证监会处罚的2000年,其相关系数为0.9796。
(3) 大庆联谊(现为*ST联谊,股票代码600065)在7年间的相关系数的平均值为0.9378,在五家样本公司中处于最低水平。在该公司因虚假陈述陷人证券民事索赔的诉讼案的2003年与2004年,其相关系数依然为0.9384和0.9493在最高人民法院于2002年l月15日发布了《关于受理证券市场因虚假陈述引发的民事侵权纠纷案件有关问题的通知》之后,哈尔滨市中级人民法院于2002年和2003年分别受理了113位和494位投资者对大庆联谊的起诉。2004年,黑龙江省最高人民法院终审判决大庆联谊向456位投资者赔偿。
。特别值得注意的是在2005年,该公司的相关系数达到0.8831的最低水平。据此我们有理由推测大庆联谊在身陷股民民事索赔诉讼案的同时以及在随后的2005年中,依然明显存在财务舞弊的征兆。
(4) 蓝田股份(ST生态,600709,已退市)其相关系数在被刘姝威揭露会计造假的2000年度为0.9815。但是我们可以清楚地看到,在蓝田股份会计造假行径被揭露之后的第二个年度,其相关系数达到最低水平的0.9302。据此我们可以推测蓝田股份在其会计造假行为暴露以后并没有立即停下造假的步伐,而是在2001年进一步加大了造假的力度。
(5) 西安达尔曼〔达尔曼,600788,已退市)的相关系数自1999年起从0.9831下降,到2001年达到最低值0.9177。而据中国证监会2005年第10号处罚公告,达尔曼的会计造假年份是2002年与2003年。据此,我们有理由推测西安达尔曼自1999年就开始了会计造假,造假的程度在2001年达到最大。
三、结论与建议
本文在对奔福德定律做简要介绍的基础上,主要利用我国上市公司的财务数据对该定律进行了验证性测试。主要结论如下:
1. 从总体上看,我国上市公司所公布的主要财务数据较好地符合了奔福德定律,无论是沪市还是深市,其主要财务数据基本上都呈现出了奔福德定律所描述的数据首位数出现概率递减的规律,与奔福德定律所描述的数据首位数出现概率分布数值保持了高度的相关,其相关系数达到了0.9992。
2. 沪市与深市上市公司的各主要财务指标的数值表现在符合奔福德定律方面存在差异,其中符合程度较高的有沪市的净利润与利润总额,深市的主营业务收人与资产总额;符合程度较差的有沪市的资本公积与深市的股东权益总额。
3. 从区分板块的情况来看,处于不同板块的上市公司的财务数据的数值分析表现与奔福德定律理论数值分布的一致性存在一定程度的差异,其中ST板块与中小企业板块的测试结果与奔福德定律的理论值差异最大。
4. 按照分行业测试的情况来看,信息技术、化学制品、农林牧渔和食品饮料行业的主要财务指标的数值分布与奔福德定律理论值存在较好的一致性,而黑色金属、金属制品、建筑业和纺织业的财务数据数值分布与奔福德定律理论值的相关性较差。
5. 本文通过对5家财务报告舞弊样本公司的财务数据所进行的数值分析,证实了这些公司在1999年至2005年的7年间曾经实施过财务报表舞弊。在对这样财务舞弊公司进行数值分析时,我们可以将相关系数视为检验上市公司财务报表真实性程度的指数。该指数越是小于1,说明被检验公司的财务报表被人为操纵的程度越是大。从检验的结果可知,5家样本公司的相关系数,既财务报表真实程度指数由低到高的排列顺序依次为:大庆联谊-蓝田股份-天津磁卡-西安达尔曼-银广夏。除此以外,我们发现大庆联谊在1998年被首次揭露财务报表舞弊以来,并且于2003年8月起身陷股民民事索赔诉讼案的3年间,依然存在明显的财务舞弊的征兆。
下面笔者就奔福德定律在舞弊审计方面的应用谈几点体会与建议:
第一,运用奔福德定律进行财务舞弊审计具有保密性好、使用成本低、简便易行的优点,我们借助于Excel电子表格或专门的分析软件可以快捷有效地进行数值统计分析。目前,我国的上市公司的主要财务数据以及资产负债表、利润及利润分配表和现金流量表等明细财务数据的XBRL实例文档都可以在有关的网站方便地下载,上市公司的监管者、审计人员以及各类信息使用者都可以运用奔福德定律的数值分析软件对其进行专项的筛选与分析,为进一步深人进行舞弊审计提供线索。
第二,被审计单位的财务数据的首位数出现的概率分布与奔福德定律的理论分布存在显著差异是发生财务舞弊的必要条件。我们可以将奔福德定律及其有关的数值分析工具视为“财务舞弊检验器”,并将“相关系数”视为“财务数据真实性指数”。借鉴商业银行对不良资产的分级管理的思路,根据上述测试分析的结果,笔者将相关系数的测试值划分为“正常”、“关注”与“可疑”三个级别。舞弊审计人员可以根据实测的相关系数分别采取不同的舞弊审计对策。表10给出了在“正常”、“关注”与“可疑”三个区段的相关系的标准以及相应的审对。
第三,运用奔福德定律进行舞弊审计具有局限性。财务数据的首位数出现的概率分布与奔福德定律的理论分布存在较大差异只能说明存在财务舞弊的可能性,并不能充分地说明一定存在舞弊。如果用此方法发现有异常存在,审计人员还须以此为线索,做进一步深人的调查,以获取舞弊的证据。
主要参考文献:
张苏彤,2005,“奔福德定律:一种舞弊审计的数值分析方法”,《中国注册会计师》第11期。
Bogomolny, A. 2005. “Beoford’s Law and Zipf’s Law.”
http://www.cut-the-knot.org/do_you_know/zipflaw.shtml.
David Coderre.2001.Fraud Detection: Using Data Analysis Techniques to Detect Fraud. Global Audit Publications (GAP).
Malcolm W. Browne.1998.FollowingBenford’s Law,or Looking Out for No1. The New York Times,Tuesday,August 4.
T.P.Hill.1998.The First -Digit Phenomenon. American Scientist, July-August: 358~363.
推荐理由:
奔福德定律描述了自然状态下数字0~9在首位出现的概率分布,作为上市公司的财务数据正常情况下也应符合这一规律,如若不符,我们有理由怀疑上市公司财务作假。本文利用上市公司财务数据对奔福德定律进行了测试,并得出了很有意义的结论,为我们在法务会计及舞弊审计中发现上市公司是否存在财务舞弊可能性提供了一种简便易行的方法,值得推广应用。
来源:审计研究2007年第3期
展开阅读全文