1、信息技术XINXIJISHU2023年第10 期大数据发展形势下财务信息交互方法张丹丹(广东财贸职业学院,广东清远51152 0)摘要:针对企业内部财务数据的分散、重复等不利因素造成的工作效率不高等问题,基于大数据技术,建立了企业财务信息管理和交互系统,对于财务信息中的非结构化数据,建立信息抽取的神经网络模型进行财务数据信息交互融合;在财务数据共享过程中利用多属性权威的属性加密技术,提高了数据加密能力。测试结果显示:系统对财务数据进行加密共享操作的时间低于10 s,数据交互时间最高为0.4 9s。关键词:财务信息;信息交互;非结构化数据;数据共享;属性加密中图分类号:TP37D0I:10.13
2、274/ki.hdzj.2023.10.016Financial information interaction method under the situation of big data developmentZHANG Dan-dan(Guangdong Polytechnic of Finance and Trade,Qingyuan 511520,Guangdong Province,China)Abstract:To tackle the problem of low work efficiency caused by unfavorable factors such as dis
3、persion andduplication of financial data within the enterprise,this study establishes an enterprise financial informationmanagement and interaction system based on big data technology,and establishes information extraction forunstructured data in financial information.The neural network model is bui
4、lt for the fusion of financial dataand information interactive.In the process of financial data sharing,the multi-attribute authoritative attrib-ute encryption technology is used to improve the data encryption capability.The test results show that thetime used by the research system to encrypt and s
5、hare financial data is less than 10s,and the data interac-tion time is up to 0.49s.Key words:financial information;information interaction;unstructured data;data sharing;attribute en-cryption文献标识码:A文章编号:10 0 9-2 552(2 0 2 3)10-0 0 8 4-0 60 引 言随着经济全球化趋势的加快,各企业经济规模不断扩大,大数据技术为企业财务系统提供了技术支持,简化了财务核算记账流程。
6、财务信息数据覆盖了大部分企业业务处理流程,数据量较大,且数据种类不统一。如果没有有效的数据交互方式,难以从不同的业务场景的财务信息中作者简介:张丹丹(198 0),女,博士研究生,副教授,研究方向为财务大数据、风险管理与内部控制、管理会计。一8 4 一获取到有效信息,使企业数据资源的利用变得极具复杂性。针对上述存在的问题,文献 3 系统提出一种polygen模型,以标记或注释的形式描述公司财务数据库中的多源异构数据查询结果和数据来源;文献 4 系统采用三维图表的形式显示财务数据的变化,并对Netflow的日志数据的特点进行分析,以数据可视化呈现时序图;文献 5系统提出基于贝叶斯网络的公司业务数
7、据可视分析,将不同业务场景中的数据源通过Web聚合在一起,大数据发展形势下财务信息交互方法使系统用户能够快速查询和理解业务信息;文献6系统基于 APACHE Luncene 设计出源数据的图形数据库,具有多种类型的元数据管理组件,提供了业务数据存储、财务数据分析和统计等功能。当前研究文献主要面向企业和公司系统中的财务信息数据集合的资源描述管理,对数据处理过程中元数据信息管理有所欠缺,数据解析出现异常将影响系统插件获取业务数据的速度,财务数据的可视化方式较少,系统与用户的交互能力不足。1基于大数据技术的企业财务信息管理和交互系统在当前大数据发展形势下,企业的财务数据具有数据规模大、流动快、类型多
8、样等特点,需要通过信息技术将各单位的财务信息集中起来进行统一管理。该研究建立企业财务信息管理和交互系统,应用大数据技术,通过数据交互对企业的各个部门的数据进行数据传输和数据共享,按照系统设定的标准进行数据采集、数据分类,为数据交互提供保障机制。系统对采集到的财务信息数据样本进行预处理,去除噪声数据,解决数据格式不统一、缺失的问题,将财务数据进行分类并存储到数据库中。系统架构如图1所示。系统基于SPRING开发框架进行设计开发,将企业运营过程中产生的业务数据和财务信息通过标准化的流程导人,并进行归类分析,得出相应信息,进行数据治理,使数据安全性和传输效率得到提高 7。系统使用了ANTV第三方用户
9、图表绘图库,将企业的财务信息进行可视化展示,对财务数据进行精确的量化表达,搭建核心构件图表,支持系统用户根据需求自行绘制各种类型的图表。系统在数据交互和可视化中应用了底层数据引擎G2,以大量的图形数据分析为基础驱动,提供了多种图形应用语句和交互式指令,使系统具有更好的交互性和可扩展性,用户通过系统的VIEW模块开发出个性化的多维财务数据分析图形和面向交互的可视化组件 8 2关键技术分析2.1面向非结构化财务数据的信息交互融合随着企业业务的增多,系统需要处理的数据量迅速增加,数据出现了越来越多不同的数据格一张丹丹用户授权预算管理核算管理信息反馈权限控制网关中心管理核心换机核心服务器交换机数据交财
10、务报表预算分析企业业务数据财务数据数据仓库工具数据库数据计算引擎图1企业财务信息管理和交互系统架构式。面对结构复杂且数据量庞大的非结构化数据,传统的数据分析方法的处理速度较慢。本研究提出一种财务数据信息交互融合的方法,构建财务信息抽取的神经网络模型。从大量原始数据中找出命名实体并识别出实体的具体类型,将抽取出来的信息作为数据层中的节点 。财务数据的信息交互融合过程如图2 所示。财务信息融合交互对非结构化数据进行矫正和整合,将抽取的信息与其他信息进行整合,得到正确且完整的信息。从原始数据中抽取出实体间的关系作为数据层的边,利用实体间的共性对实体进行分类。模型的输入为X=(x 1,x 2,x 3,
11、x,),输人向量组成一组变量Y=(Yi,Y,Ys,Y,),变量Y,和Y,之间如果存在相连的边则说明具有关联性 10,对于所有的变量Y,都满足于:P(Y,=tI xi,xn,Yi,Y,)=P(Y,=tI xI,xn,Y,E(Y,Y)(1)引人多个变量之间的相关关系节点,神经网络模型的随机变量间的相关性发生变化,随机变量与输入序列存在对应关系,x,与Y,之间相互关一8 5一财务应用数据共享决策管理exp(s(x;,q);=p(z=il X,q)N(4)式中,exps(i,)表示评估函数;X为输人的财大数据发展形势下财务信息交互方法结构数据半结构数据非结构数据图2 财务数据的信息交互融合过程联,可表
12、示为:P(XI Y)IlexpZws f(X,Y.)(2)式中,Z表示归一化常数;Y。表示随机变量的子集;w表示更新权重值;f.表示特征函数 。财务信息交互融合的神经网络模型在训练过程中不停更新权重值,计算获取对应的Y,值与数据集中的结果误差最小 12。将一组非结构化数据作为模型的输人,经过加权求和的方式把输人数据整合起来,再经过一个非线性激活函数来生成输出数据。不同时刻的输入x,与上一时刻的状态 st-1共同作为t时刻的输人数据,经过计算后可以获得t时刻的状态s,再计算出模型的输入ot。神经网络模型在正向传输过程中进行信息交互融合,可表示为:o,=g(V.f(U.x,+W.st-t)其中,g
13、(x)(x)表示激活函数;V、U、W 表示权重参数;x,为输人的财务数据;st-1表示状态参数 13。网络模型在实体信息抽取任务中的应用对抽取的准确性起到了一定的影响,利用抽取实体附近的上下文信息,将上下文信息与候选实体进行比较,在确定输入信息和查询向量的情况下,第个输入信息的概率为:一8 6 一张丹丹知识库实体抽取信息交互关系抽取信息融合属性抽取厂抽取实体务信息;9表示模型的查询向量;z表示输人信息位置。在财务信息融合交互任务中,融合交互模质量评估型会针对不同的业务场景灵活变化 14,将特征进行灵活的配置,对非结构化的财务信息进行融合本体构建交互,让信息在模型框架内紧密联系。72.2基于去中
14、心化层次属性加密的财务数据共神经网络层享方案现有的财务管理模块主要是预算管理、财务核算,只能够满足企业的基本预算执行和财务做账需求,但系统各模块功能互相独立,与数据管理候选实体系统无法进行数据信息共享。为了保证企业财务数据的安全性,防止财务信息泄露和被篡改,本研究利用属性加密技术,提出基于去中心化层次属性加密的数据共享方法,实现了可扩展的数据访问控制 15。财务数据属性加密和共享方案如图3所示。上传财务信息文件数据库1多层访问结构属性权威(3)图3 财务数据属性加密和共享方案财务信息所有者要共享两个文件M=im1,mzl到服务器中,其中ml为访问层最高的文件,m为最低层文件,数据用户属性集T需
15、要符合系统的访问结构 16。由于系统财务数据共享具有多层访问结构的特点,不同属性的用户所获取的对称钥也不同,解密能够获取到的对称钥AK,也不同。访间服务器香满足访间结构层山是A1用户1解密获取对称钥A2香满足访间结构层?山是工用户2自解密获取对称钥An是否满足访间结构层山香用户n访间失败大数据发展形势下财务信息交互方法属性权威将系统参数GP作为输入,为每一个属性权威A,生成相应的主密钥MSK,和公钥PK,。对于任意一个A,执行 KeyGen,以属性集 T,和数据用户CID、PK,和GP作为输入,生成用户的私钥SK,。进行解密时以公钥PK,、密文 CT、系统参数GP和属性集T,相关的私钥SK,作
16、为输人 17,经过 Decrypt算法运算后输出相对应的对称钥AK。当数据用户满足系统的访问层,可获取全部的对称钥AK,进行对称解密,依次获取共享财务文件M=(m1,m,m;。对于任意的A,运行算法生成相应的PK,和MSK,A,随机选取;EZ,可表示为:PK,=/e(g,g),(hi=gr)/LMSK,=(ga,i,l1式中,PK,表示公钥;MSK,表示主密钥;e、g 表示系统参数;,表示安全参数。为了给数据用户生成私钥,属性权威和用户执行交互运算,随机选取RMEZ,vMEZ,使用自身全局标识符GID计算 rm,并将(rm,Ym)发送到属性权威Aj。A,随机选取r,=Z,,计算k;并返回给用户
17、 18,利用x,恢复私钥k4i作为属性隐藏,最终获取私钥可表示为:SK,=(ki:=g%ht,2i=gH(i),ksn=hncra+p,k4i=H(i)B)其中,H(i)表示访问数的节点属性,h,表示密文参数。数据所有者共享l个文档M=1ml,m,,m,在访问树上就具有1个访问层,与文档对应生成对称钥AK=H(m),使用对称加密算法加密明文文档,依次获取验证钥,得到数据所有者相关的一组属性,最后算法输出密文和验证钥。3应用测试该研究的企业财务信息管理和交互系统要求各部门的数据必须按照统一的标准录入,字段编码必须保持一致。系统通过建立财务数据之间的级联关系提高控制效率,PROXXserver模块
18、将数据推送到系统界面进行显示。系统主界面如图4所示。为验证该系统的性能,分别使用文献 3 系统、文献 4 系统和该研究系统进行实验。首先张丹丹销售订单时信世理销生单图4 系统主界面对服务器和客户端进行配置,保证系统能够正常运行,再展示系统应用效果。客户端在Win-dows10操作系统上运行,采用的深度学习框架为(5)Pytorch1.1.0。实验环境如图5所示,实验环境软硬件配置参数如表1所示。(6)图5实验环境表1实验环境软硬件配置参数类型参数客户端处理器硬盘内存数据库编程语言数据库服务器型号内存容量内存类型CPUWeb服务器硬盘CPU操作系统库存状况AMDRyzen75800X1TB8GB
19、Mysql5.8PythonNF8465M432GBDDR3E7-4809V312TBE3-1220V53.0G4核4 线程Ubuntul8.4系统一8 7 一大数据发展形势下财务信息交互方法该研究使用CONLLO3作为实验的数据集,包括非结构化数据中的文本类数据集,数据集的信息来源主要是企业业务数据、销售数据和统计报表数据。实验数据集如表2 所示。表2 实验数据集数据集PRECON_TRAIN15487CON_TESTA3651CON_TESTB5214进行财务信息的加密共享测试时,共识节点作为权威机构,通过Pedersen秘密共享协议生成参数,用户私有身份密钥充当用户解密密钥,设定文件数量
20、为4,属性数量设为3 0,记录三种系统对财务数据文件进行加密共享时的时间,得到的数据如表3 所示,随属性数量的增加共享时间的变化如图6 所示。表3加密共享时间数据属性数量510本文系统3.24.46.1 7.58.0文献 3 系统4.97.89.310.312.1文献 4 系统4.56.5 7.39.811.014一本研究系统-文献 3 系统12.文献 4 系统10S/864205由图6 可知,随着财务数据属性数量的增加,系统进行加密共享的时间也在不断增加,同时进一8 8 一一一张丹丹LOCORG987410024625236527455452015201015属性数量图6 加密共享时间变化行
21、解密的时间也会增加,密文存储空间也会随着属性和文件数量的增加而增大。当共享的财务文件的属性数量为5时,文献 3 系统的加密共享时间为4.9 s,文献 4 系统所用时间为4.5s,本文系统所用时间为3.2 s;当属性数量增加到2 0 时,文献 3 系统使用的时间增加了10.3 s,文献 4 MSI系统时间上升到9.8 s,本文系统为7.5s。本文系8562统进行加密共享所花费的时间始终低于10 s,系8569统的综合运算效率更高,并且系统共享财务数据9637时具有一定的限制条件,未经授权的用户无法获取正确密钥进行访问。系统在进行数据交互测试时,通过数据交互任务配置参数,完成相应的设置,达到增量交
22、互的目的。数据量设定为0 10 0 MB,使用三种系统进行测试,记录到的财务数据交互时间如图7所示。本研究系统1.1一:-文献 3 系统1.0文献 4 系统0.925309.413.612.820250.80.70.60.50.40.30.20.100在数据交互过程中可能会因为系统网络和数据源不稳定的情况导致数据交互终止,文献 3 系统在数据量为6 0 MB80MB时出现任务执行终止的情况。当财务数据量达到10 0 MB时,文献3系统的交互任务执行时间为1.0 4 s,文献 4 30系统的数据交互时间为0.8 9 s,本文系统的数据交互时间为0.4 9 s,执行财务数据交互任务的时间较短,执行
23、器完成数据交互的效率较高,且执行数据交互任务系统稳定,没有出现任务终止和任务失败的情况。/72040财务数据量/MB图7 数据交互时间6080100大数据发展形势下财务信息交互方法4结束语8张家军,陈杰,常喜强,等.基于EMD与模型预测控制该研究建立企业财务信息管理和交互系统,算法的风电功率平抑 J.四川电力技术,2 0 2 1,4 4应用大数据算法、工具和计算引擎,对企业的财务(2):38 42.信息进行统一管理,将计算结果通过数据交互反9曾娜梅,霍志红,许昌,等.基于改进HHT的分钟级超短期风速预测 J.动力工程学报,2 0 2 1,4 1(4):3 0 9-馈到各部门,实时查看业务进度,
24、为企业的决策管理提供数据支撑。该研究的创新点在于:面对结构复杂且数量庞大的非结构化数据,提出一种财务数据信息交互融合的方法,构建信息抽取的神经网络模型。提出基于去中心化层次属性加密的财务信息共享方案,利用多属性权威的属性加密技术控制用户的数据访问,采用分层访问树对多个文件进行加密,并引入用户的全局标识符,提供验证钥和收敛密钥进行验证。但该系统在数据量过大时会增加对内存的消耗,任务调度时间增加,在接下来研究中还需优化系统的性能。参考文献:1祁乐,唐健,江平,等.考虑机组分类的海上风电短期功率预测校正模型 J.山东电力技术,2 0 2 1,4 8(5):16-22.2孙荣富,张涛,和青,等.风电功
25、率预测关键技术及应用综述 J.高电压技术,2 0 2 1,4 7(4):112 9-114 3.3叶林,赵金龙,路朋,等.考虑气象特征与波动过程关联的短期风电功率组合预测 J.电力系统自动化,2021,45(4):54-62.4孙改平,蒋传文.基于两级级联聚类的神经网络风电功率预测 J.太阳能学报,2 0 2 1,4 2(3):56-6 2.5闫庆友,朱敬尧,秦光宇.基于混合优化算法的风电功率预测方法研究 J.节能,2 0 2 1,4 0(4):3 2-3 5.6赵上懿,曾湘安,李文超,等.基于户外实证数据挖掘的光伏发电功率预测模型研究 J.环境技术,2 0 2 1,39(2):160-165
26、,169.7黄慧,贾嵘,师小雨,等.考虑机组动态特性的超短期风电功率预测及不确定性量化分析 J.电力系统保护与控制,2 0 2 1,4 9(8):10 9-117.一一张丹丹315,329.10刘俐利.基于门控递归单元神经网络的风速误差修正模型短期风电功率预测J.沈阳工程学院学报:自然科学版,2 0 2 1,17(2):11-17.11王一妹,刘辉,宋鹏,等.基于高斯混合模型聚类的风电场短期功率预测方法 J.电力系统自动化,2021,45(7):37-43.12袁智勇,白浩,黄安迪,等.基于EEMD-SSA和改进ELM的短期风电功率预测方法J.水利水电技术(中英文),2 0 2 1,52(S1
27、):323-331.13李昂儒,郑伟彦,赵京虎,等.基于分形理论的风电功率预测算法研究 J.计算机技术与发展,2 0 2 1,31(3):191 195.14李世昌,李军.基于稀疏表示方法的短期风电功率预测 J.测控技术,2 0 2 1,4 0(2):14 0-14 4.15卢继平,曾燕婷,喻华,等.基于改进AWNN的风电功率超短期多步预测 J.太阳能学报,2 0 2 1,4 2(1):166-173.16 Mja B,Sha B,Zw C,et al.Privacy-preserving distribu-ted parameter estimation for probability di
28、stribution ofwind power forecast error J.Renewable Energy,2021,163:1318 1332.17 Mja B,Sha B,Zw C,et al.Privacy-preserving distribu-ted parameter estimation for probability distribution ofwind power forecast error-Science Direct J.Renew-able Energy,2021,163:1318-1332.18 Hui L,Fang L,Dihuang C.A novel wind DC microgridenergy management strategy based on LSTM forecastmodelJ.Journal of Physics Conference Series,2021,1871(1):012014.(责任编辑:丁晓清)一8 9 一