收藏 分销(赏)

基于大数据的财务审计研究.pdf

上传人:自信****多点 文档编号:636809 上传时间:2024-01-21 格式:PDF 页数:4 大小:1.99MB
下载 相关 举报
基于大数据的财务审计研究.pdf_第1页
第1页 / 共4页
基于大数据的财务审计研究.pdf_第2页
第2页 / 共4页
亲,该文档总共4页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、Microcomputer Applications Vol.39,No.8,2023文章编号:10 0 7-7 57 X(2 0 2 3)0 8-0 2 0 5-0 4开发应用基于大数据的财务审计研究微型电脑应用2 0 2 3年第39 卷第8 期李晓,沈千琳(西安邮电大学,审计处,陕西,西安7 10 12 1)摘要:为了改善财务审计中数据维度高、特征复杂导致智能审计效率低、训练周期长等问题,提出了一种基于大数据的财务审计平台,为财政政策的实施和完善提供决策支持。针对财务审计数据特点,提出了应用于财务审计模型的卷积神经网络结构,从而增强特征多样性,提升模型鲁棒性。采用遗传算法对卷积神经网络相关

2、参数进行优化处理,从而增强模型的稳定性,提高模型的收敛速度。通过仿真分析,将所提模型与BP神经网络、多层感知器、卷积神经网络进行比较,基于mAP、F-s c o r e、精确度、敏感度等指标进行分析。仿真结果进一步验证了所提模型训练收敛速度更快,所提模型mAP为92.54%,且模型性能更优。关键词:数据挖掘;财务审计;卷积神经网络;遗传算法;参数优化中图分类号:TP393(Audit Office,Xian University of Posts and Telecommunications,Xian 710121,China)Abstract:In order to solve the pr

3、oblems of low efficiency and long training cycle of intelligent audit caused by the characteristicsof high data dimension and complex characteristics in financial audit,a financial audit platform based on big data is proposed toprovide decision support for the implementation and improvement of finan

4、cial policy.According to the characteristics of finan-cial audit data,a convolution neural network structure applied to financial audit model is proposed to enhance the diversity offeatures and the robustness of the model.Genetic algorithm is used to optimize the relevant parameters of convolutional

5、 neuralnetwork,so as to enhance the stability of the model and improve the convergence speed of the model.Through simulation anal-ysis,the proposed model is compared with BP neural network,multilayer perceptron and convolutional neural network,andanalyzed based on the indexes of mAP,F-score,accuracy

6、 and sensitivity.The simulation results further verify that the trainingconvergence speed of the proposed model is faster and the performance of the model is better,and the mAP is 92.54%.Key words:data mining;financial audit;convolutional neural network;genetic algorithm;parameter optimization0引言在大数

7、据时代的环境下,全球金融业1-3正在经历一场数据云化、信息云化的信息革命4-5,基于计算机的智能云工具正在逐步改变金融从业者的工作方式和交易模式。在信息层面电子金融数据的基础上,利用大数据理念设计新的审计方法,对于实现审计目标、创造审计云的新模式具有重要意义。随着财务活动的增加和频繁,财务数据也快速增长,依靠人力资源来处理大量财务数据的传统方法已无法满足现实需求。因此,数据挖掘6 方法成为了财务预测领域中常用的方法。目前,数据挖掘技术已广泛应用于股票、破产评估、汇率、期货等金融预测领域。使用数据挖掘方法可以从现有金融数据中挖掘出隐藏的规律或模式,而无需任何假设或更少的假设,并使用这些规律或模式

8、预测金融活动的未来趋势。目前金融预测领域中使用的数据挖掘方法主要包括人工神经网络、支持向量机、遗传算法和隐马尔可夫模型。文作者简介:李晓(198 0 一),女,硕士,工程师,研究方向为工程审计及财务审计;沈千琳(1992 一),女,硕士,助理会计师,研究方向为财务会计及财务审计。文献标志码:AResearch on Financial Audit Based on Big DataLI Xiaochuan,SHEN Qianlin.205献7 基于Apriori算法实现公司股东关联分析,为挖掘行业股东关联提供参考依据。文献8 基于数据挖掘对金融审计数据进行分析研究。然而传统数据挖掘方法或多或少

9、存在一些缺陷,如遗传算法9可用于解决高维和非线性问题,但由于编码机制的限制,对连续变量进行编码将很困难或太长。支持向量机10 1本质上是一种以结构风险最小化为准则,以特征空间分类超平面区间最大为优化目标的二元分类模型,然而该方法实现过程复杂。神经网络11预测模型能有效地捕捉数据中的非线性特征,适用于二元、多元和连续数据。但是,网络参数的设置会影响预测效果。如果训练过程未得到适当控制或参数设置不当,则很容易过度拟合。为改善传统审计存在的缺陷,本文基于数据挖掘技术,提出了基于大数据的财务审计平台。进一步,为解决卷积神经网络(CNN)存在训练效率低、过拟合等问题,采用基于遗传算法(GA)对CNN参数

10、进行优化处理,通过实验分析了模型性能,并与其他算法进行了比较,验证了算法的可行性。Microcomputer Applications Vol.39,No.8,20231系统介绍对于财务审计,此挖掘模式可用于收集基本财务信息。数据存储数据存储节点1管理节点数据存储数据存储节点n节点5财务审计数据互联网传输财务审计数据物联网管理基础服务器数据接口财务审计数据挖掘图形结构化数据分类挖掘关联挖掘聚类挖掘图1基于大数据的财务审计平台数据挖掘主要应用对象为海量数据,处理的数据类型包特征。本节将详细介绍基于参数优化的神经网络结构,并将括结构化数据和非结构化数据,如图像数据、文本数据和声其应用于财务审计模型

11、。像数据等。常用的数据挖掘方法有分类挖掘、关联挖掘、聚2.1卷积神经网络类挖掘和异构挖掘等方法。在财务审计中,可以对上述数据图2 所示为所提用于财务审计模型的卷积神经网络结挖掘算法进行建模和固化,从而依据不同数据具有的特点和构。卷积神经网络中特征提取阶段由多组卷积层和池化层审计要求个性化选取不同模型。共同组。分类器主要由全连接层构成。反卷积层主要为卷积层的逆过程,主要用来反演特征,而增强特征多样性。融2基于参数优化的财务审计模型合层主要将多尺度的特征进行融合而进一步增强特征学习卷积神经网络可以逐层提取数据的特征,学习更精细的的鲁棒性。门卷积层最大池化层开发应用无监督数据挖掘使用某种方法来发现数

12、据中的规律性或异常,并将其提交给用户,用户判断重要程度。基于大数据的财务审计平台如图1所示。数据存储数据存储节点2节点3节点4数据管理文本图像异构挖掘全连接层微型电脑应用2 0 2 3年第39 卷第8 期财务审计数据财务审计数据存储节点分析平台财务审计数据无线传感网络管理数据同步日志管理财务审计模型财务预算审计网络安全预算执行审计财务专项审计反卷积层融合层输入层2.1.1卷积层卷积层是网络的核心。卷积层的神经元将在前一层的特征图中提取相应区域的特征。首先,将输入层通过尺度为33的卷积核完成2 维卷积运算,并输出下一层的特征;其次,将下一层输出的特征层和上一层输人的特征层通过尺度为33的卷积核执

13、行卷积操作,并对当前输出层进行偏置操作。因此,令特征层大小为aa,通过尺度为bb,步长为1的卷积处理后,最终输出特征为C=(a-b+1)(a-b+1)式中,C为卷积层输出特征映射。2.1.2池化层池化层主要用来进行下采样操作。首先,将输入特征映射划分为Xh大小的子区域,并对每个子区域执行采样处输出层特征提取图2 财务审计模型的卷积神经网络结构理。同理,池化层输出特征的计算如下:O=II(I(i,j)P+1)II(G(i,j)1/P-1)式中,O为池化层输出特征映射,I为输入特征映射,G为高斯核,P为超参数,且有PE1,十)。当P=1时,池化层为平均采样;当P8时,该层应用最大样本。此外,以wh

14、的大小进行采样后,输出特征图的大小为(m/)(n/h)。2.1.3全连接层全连接层是一种特殊的卷积层,其将在卷积层和池化层(1)生成的神经元连接到更高层的所有神经元,从而执行预测和分类操作。2.1.4反卷积层反卷积层为卷积的逆过程,其作用是将提取出的特征还原成原始数据,从而增强数据的多样性,提高模型学习能力。.206.(2)Microcomputer Applications Vol.39,No.8,2023令s。为反卷积层输出的数据大小,si为输人反卷积层的特征大小,Sp为数据填充的大小,。为卷积核步长,S:为卷积核尺寸,则存在以下关系:S=s,(s;-1)-2 X sp+Sk2.1.5融合

15、层数据特征经过多次卷积、池化和反卷积操作,将形成众多不同层级的多尺度特征。融合层主要用来将众多不同尺度的特征进行融合,从而学习不同尺度特征,增强模型鲁棒性。本文主要采用concat特征融合操作。假设不同通道输人特征分为为(,2,)和(y,y 2,,y),则经过融合层后形成的单通道输出定义如下:22*K,+2:*KtZconcat=i=1式中,Zconcat表示融合输出,K表示卷积核,*表示卷积操作。2.2网络训练假设分类问题有C个类别,对于样本n,其损失函数计算如下:L(W,b);(a,y)=13=1式中,W和b分别表示网络的权重和偏差,和y表示训练样本数据和真实标签,t表示样本数据的预测值,

16、t表示预测值中的第k维分量,表示的真实标签中的第k维分量。令(I十1)为1十1层的误差,该层的权重和偏差记为W和6。若1层和1十1层完全连接,则有:8(l+1)=fz()(I)W(I)T式中,()为上采样函数。进一步,梯度计算如下:Vw()J(W,b);(x,y)=8(l+1)T.b(1)Vb()J(W,b);(,y)=8(l-1)T.b(1)如果1层是卷积层和池化层,则误差计算方法如下:(l;k+1)=fz(l,k+1)W(l,k)l,kT(9)式中,上采样函数f()将后一层计算的误差(l;k十1)转移到前一个卷积层,其中k表示卷积核。进一步,经过反向传播后,采用梯度下降法更新权值,具体如下

17、:0=T-VeJ(O,a,y)式中,为权重和偏差的超参数,为学习率。2.3基于遗传算法的参数优化目前神经网络训练时广泛应用的方法为梯度下降法,但该方法也存在一定缺陷,如网络训练时非常依赖初始参数选取。如果初始参数设置不当,则网络训练效果较差,严重时可能导致网络无法收敛。此外,网络的训练过程可理解为参数调整过程。然而许多超参数的选择,如学习率、学习率衰减周期、droupout率等基本上取决于个人经验,严重受主观影响。如果该值不理想,则网络可能无法收敛。为此,本文基于GA优化CNN相关参数,从而提高模型训练效率。遗传算法基本思路总结如下:对于初始群体,分别计算每个个体的适应度函数F,并根据F,的大

18、小评估其相应染色体。当F,越大,个体性能越优;反之,F,越小,个体性能越差。进一步,通过计算每个个体的适应度函数值,从第t代种群P(t)中选取具有最大适应度函数的个体,并将其遗传给开发应用下一代种群P(t+1)。根据GA对卷积神经网络进行参数优化的流程图如图3所示。根据上述算法执行过程,对卷积神经网络模型中参数(3)进行优化处理,从而提高训练效率,增强模型鲁棒性。开始计算均方误差找到可行解否立终止条件权重编码是初始化种群输出最优解i=1(4)1(5)(6)(7)(8)(10).207.微型电脑应用2 0 2 3年第39 卷第8 期产生新种群否终止条件适应度评估解码立立选择、交叉、计算与样本变异

19、误差图3基于遗传算法的参数优化3仿真与分析3.1仿真环境本节对所提财务审计系统及卷积神经网络模型进行验证,仿真时环境如表1所示。应用服务器和数据库服务器采用inter i711700KCPU,操作系统为LinuxUbuntu18.04。网络传输节点客户端采用interi511400FCPU,操作系统为Win10。仿真编译语言为Python,并利用tensorflow搭建深度学习框架。仿真时数据集利用MySQL5.7.32统一管理。表1仿真环境相关参数服务器CPUinter i7 11 700 KRAM32G操作系统LinuxUbuntul8.04数据库MySQL5.7.323.2数据集仿真时数

20、据集选取2 0 2 0 年在杭州运营的30 1家公司,共计6 32 份审计意见。数据集中的审计意见分为正负两类样本:正样本为充分符合审计准则的样本;负样本为不符合审计准则的样本。考虑到数据集中部分数据缺失,以及可能存在的统计误差,应用数据挖掘中数据清洗对数据进行预处理。删除部分缺失数据及合并相似数据,最终数据集中正样本数量为9 1,负样本数量为2 0 3,不同行业分类统计如表2所示。3.3模型评估与分析进一步,选取数据集中8 0%数据为训练集,2 0%数据作为测试集,并将数据带人基于遗传算法的参数优化深度学习网络模型。基于遗传算法的卷积神经网络优化算法相关参数统计情况如表3所示。图4为本文所提

21、模型与不带参数优化模型的性能对比结果。可以看出,所提模型(实线)在2 1代达到最优性能;不带参数优化模型(虚线)在115代达到最优性能。深度学习I是退出网络传输节点inter i511400F4GWin10Microcomputer Applications Vol.39,No.8,2023创意、艺术和娱乐活动食品饮料制造烟草平面艺术服装制造业木材造纸工业建筑和工程活动运输设备制造建筑空运和海运电信化学工业纺织工业安全和研究活动农业表3相关参数统计情况参数(深度学习网络)初始学习率学习率衰减周期学习率衰减倍数批处理大小最大送代次数Dropout 概率参数(遗传算法)种群大小最大送代步长交叉率变

22、异率0.2500.2250.2000.17550.1500.1250.100020406080100 120140选代步长(Epoch)图4参数优化模型训练对比结果进一步,表4为BP神经网络、多层感知器、卷积神经网络及所提模型平均准确度(mAP)、F-s c o r e、精确度、敏感度指标统计结果。可以看出,所提模型准确率最高,mAP为92.54%;BP神经网络模型mAP最低,仅为8 4.93%;多层感知器及传统卷积神经网络模型mAP次之,为8 7.2 6%和 91.6 7%。开发应用表2 不同行业分类统计行业-不带参数优化模型一所提模型微型电脑应用2 0 2 3年第39 卷第8 期表4不同模

23、型指标统计结果数量模型9BP神经网络14多层感知器3卷积神经网络0.91676310169272644729135值10-42510-5321500.25值10005000.20.01mAP0.84930.8726本文方法0.92544总结本文以智能审计为研究对象,构建了基于大数据的财务审计平台。为有效对财务审计进行分析,提出了一种基于遗传算法的参数优化深度学习网络模型,通过GA对深度卷积神经网络进行优化处理,从而网络鲁棒性,提高模型训练效果。未来研究方向包括财务审计中网络安全、高维数据特征提取、数据隐私保护等领域进行研究,提高用户户数据安全。此外,针对财务交易,财务管理等领域,可研究区块链、

24、加密算法、数字签名等技术提高财务信息管理安全性及可靠性。1余荣,中小皮革企业融资问题及解决对策J.中国皮,2021,50(9):75-78.2 崔耀元,刘雨露.中国金融发展和经济增长关系的实证研究J.中小企业管理与科技,2 0 2 1(2 8):46-48.3罗莎.浅谈互联网金融存在的问题及策略J.商展经济,2 0 2 1(15):46-48.4ZHANG P,YU K,YU J J,et al.Quant Cloud:Big Da-ta Infrastructure for Quantitative Finance on theCloudJ.IEEE Transactions on Big

25、Data,2017,4(3):368-380.5HASAN M M,POPP J,OLAH J.Current Landscapeand Influence of Big Data on FinanceJJ.Journal ofBig Data,2020,7(1):21.6 张旭.大数据技术在金融统计分析中的应用初探J.当代经济,2 0 2 1(7):2 6-2 9.7 李芳,郭进利,谭利明.基于Apriori算法的公司股东关联分析J.软件导刊,2 0 2 1,2 0(3):10 6-10 9.8 赵浏洋.基于数据挖掘的金融审计数据分析研究J.中国商论,2 0 2 0(2 0):55-57.9

26、ZHANG P,GUO Q,ZHANG S,et al.Pattern MiningModel Based on Improved Neural Network and Modi-fied Genetic Algorithm for Cloud Mobile NetworksJ.Cluster Computing,2017,22(2):1-10.10GOGAS P,PAPADIMITRIOU T.Machine Learningin Economics and FinanceJ.Computational Econom-ics,2021,57(2):1-4.11KUMAR J J,DAS R.Artificial Neural Network Algo-rithms based Nonlinear Data Analysis for Forecastingin the Finance SectorJ.International Journal of En-gineering&.Technology,2018,7(10):169.(收稿日期:2 0 2 1-10-2 2)208F-score0.79050.78210.88220.8926参考文献精确度敏感度0.75570.77630.75540.77780.95320.92560.95580.9483

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服