收藏 分销(赏)

基于元素树的异质数据库间双向转换算法研究.pdf

上传人:自信****多点 文档编号:640439 上传时间:2024-01-22 格式:PDF 页数:5 大小:3.06MB
下载 相关 举报
基于元素树的异质数据库间双向转换算法研究.pdf_第1页
第1页 / 共5页
基于元素树的异质数据库间双向转换算法研究.pdf_第2页
第2页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、411第40 卷第6 期2023年6 月真机仿算文章编号:10 0 6-9348(2 0 2 3)0 6-0 411-0 4基于元素树的异质数据库间双向转换算法研究包空军,曹瑞?(1.郑州轻工业大学工程训练中心,河南郑州450 0 0 0;2.郑州轻工业大学计算机与通信工程学院,河南郑州450 0 0 0)摘要:为提升异质数据库双向转换效果,提升数据双向转换的安全性,研究基于元素树的异质数据库间双向转换算法。在异质数据库内引人概率数值,建立概率关系数据模型与概率可扩展标记语言数据模型,精准刻画异质数据库内数据的结构特性;依据元素树建立元素树与两个概率数据模型间的映射关系,并生成映射表;依据映射

2、表内的映射关系实现两个概率数据模型间的双向转换。仿真结果表明,上述算法可有效完成异质数据库间的双向转换;在交易发送频率分别为6 0 0 笔/s、40 0笔/s时,上述算法双向转换时的查询性能与写入性能达到最优;在不同恶意节点概率并承受不同攻击情况下,该算法双向转换的安全性较高。关键词:元素树;异质数据库;双向转换算法;概率数据模型;结构特性;映射表中图分类号:TP311文献标识码:BResearch on Bidirectional Conversion Algorithm BetweenHeterogeneous Databases Based on Element TreeBAO kong

3、-jun,CAO Rui?(1.Engineering Training Center,Zhengzhou University of Light Industry,Zhengzhou Henan 450000,China;2.College of Computer and Communication Engineering,Zhengzhou Universityof Light Industry,Zhengzhou Henan 450000,China)ABSTRACT:In order to improve the effect of bidirectional conversion b

4、etween heterogeneous databases and improvethe security of data bidirectional conversion,this article studied a bi-directional conversion algorithm between hetero-geneous databases based on element tree.At first,probability numeral values were introduced into heterogeneous data-bases.And then,a proba

5、bility relation data model and a probabilistic extensible markup language data model werebuilt to accurately describe the structural characteristics of the data in heterogeneous databases.Moreover,themapping relationship between the element tree and the two probability data models was established,an

6、d the mappingtable was thus generated.Finally,the bidirectional conversion between two probability data models was realized by themapping relationship in the table.Following conclusions can be drawn from the simulation results.The proposed algo-rithm can effectively complete the bidirectional conver

7、sion between heterogeneous databases.When the transmit fre-quency of the transaction is 600/s and 400/s respectively,the algorithm achieves optimal query performance andwrite performance.In addition,the bidirectional conversion of the algorithm has higher security under different proba-bilities of m

8、alicious nodes and under different attacks.KEYWORDS:Element tree;Heterogeneous database;Bidirectional conversion algorithm;Probability data model;Structural feature;Mappingtable基金项目:河南省自然科学技术(6 0 6 7 56 8 8)收稿日期:2 0 2 1-11-2 3修回日期:2 0 2 2-0 2-2 9412(3)KTK1引言数据集成的关键是各种类型数据库间的双向转换,确保集成后的数据为统一的标准化格式1,2

9、】,不会影响系统间信息的交换。传统的数据库转换算法,实现过程较为困难,且成本高,无法被广泛应用3.4,数据库转换算法欠缺,直接影响数据集成效果。因此,为确保异质数据集成效果达到最佳5-7 ,便需研究较优的异质数据库转换算法。赖欣等人分析了异质数据的结构特点,及异质数据库内数据的表达差异,依据分析结果设计异质数据库间的转换算法,实验证明了该算法的可行性8 ;刘稳等人依据异质数据间的差异,塑造异质数据关联转换的总体框架,完成异质数据的对接转换,实验证明该算法可有效转换异质数据,同时数据转换的一致性较高9;这两种算法均仅适合单向转换,并不支持异质数据库间的双向转换,且转换操作较为繁琐。为此研究基于元

10、素树的异质数据库间双向转换算法,提升异质数据库双向转换效果,确保双向转换过程中数据的安全性。2异质数据库间双向转换算法异质数据库指关系数据库与概率可扩展的标记语言(e x t e n s i b l e ma r k u p l a n g u a g e,XM L)数据库两种类型,在这两种数据数据库内引人概率数值描绘数据节点,可更加精准地呈现数据库的结构特性,提升异质数据库间双向转换效果2.1概率异质数据模型2.1.1概率关系数据模型现实世界内的对象由元组T的集合8,X82X.X8,描绘,属性阈值是8,那么关系R的集合是G(8,82.X8,)。关系数据库内概率属性代表和概率有关的一般属性,其

11、阈值8;是-8=0,1 8,因此概率元组P的集合是-8,782X.X8n0令Pr的属性i的概率为P(p r),投影计算符号是I,那么其值为Il(p r),令主键是k的概率关系数据PR的集合G(8 2 8),那么PR的键值是的全部p的集合为:-I,(pr)=(pr=1 Il,(pr)=)(1)PR内D,相应的Pr公式如下:8:|pR=(u E8;I(pr E pr)II(pr)=u)(2)与关系数据库不同,PR存在两个约束条件(VUEe PR)Z.(IIrc(pr)=1PTeIl,(PR)1in(VuES)IpR)(Vik)(Vpr,PrEII,(pr)II,(pr)=II,(pr)=G(pr)

12、=G(pr)依据可能世界模型的语义得知10 ,P的概率为IIG.(pT)(4)因为PwEPR,所以式(5)与式(6)成立,公式如下(Vu E 8:/pR)/II,(Pw)|=1(5)(Vpr EPR)(3pr EPw)II,(pr)(6)因此,PR的可能世界集合Pws,艮即概率关系数据模型PwS,=(Pw 代表PRIPw为可能世界(7)PR为1范式情况下,REG(8-2-8),其中,8,=0,18;,PR为3范式情况下,PRE8G-8,i=1,2,n。2.1.2概率XML数据模型以半结构化信息为出发点,设置概率数据在XML数据库内的表示方式,塑造概率XML数据模型定义1:半结构化信息单元(Se

13、mis-structuredInformationUnit,SIU)共有三种形式,分别是若元素名为q,元素值为w,那么 qw/q)为SIU;若元素名为9,元素值为w,属性名为,属性值为g,那么w也为 SIU;若元素名为q,S1,sm为SIU,那么s1,sm/q)也为SIU。半结构化的信息单元可描绘数据树,因此建立概率XML树,即概率XML数据模型,概率XML树的定义如下:定义2:令XML树X是五元组X=(N,Q,r,l a b l e,v a l u e),节点有限集合为N;X的根为r;边的集合为QCNxN;lable:Nname,代表N内各节点所分配的标签,叶子节点leaf(leafeN-/

14、r/)分配的数值是value。定义3:概率XML树pr的可能世界模型是二元组(t,P,)j=1,2,m的有限集合,XML树为t,正实数为p,,同时Pi+P2+.+pm=1。定义4:概率XML数据模型是PDTD=(Q,A,r u l e,a t t,str),有限元素集合为Q=q1,92,,9m,P内的元素为,(1jm),属性集合为A=a,a2,al,Pr内元素属性为a。(1o l),规则集合为rule(Q),Pr 内元素与相应取值的关系为att(qi,a11,Pu),q2,a2,P2),.),同时 P11+P12.+P1m=1,P21+P22+.+p2u=1,Q至A幂集内的映射为str。2.2

15、基于元素树的数据模型双向转换算法利用元素树E完成异质数据库概率关系数据模型与概率XML数据模型的双向转换,先建立E与元素节点C和各种类型数据模型间的映射关系,再以E与映射关系为前提,实现数据模型双向转换。2.2.1元素树E是具有数据模型内各元素间的关系树,包含E内各C相应数据模型内的各元素12 ;各C均具有概率属性列表h、概率子元素列表h与其余概率信息h;h 内存在该概率元素的全部概率属性;h内存在该概率元素的全部概率子元素13,各概率子元素均与各新节点相应;h内存在父亲节点与元素内容等。413E的生成步骤如下:步骤1:解析Pws,与PDTD,针对全部不存在其余概率元R素内容中的概率元素c,以

16、C为根节点,建立W;步骤2:塑造一个概率节点C;步骤3:按照已解析的Pws,与PDTD,得到c的h。,在CPR内添加h。;步骤4:分析c的概率内容模式14,得到C的hc,按照各概率元素内容的概率类型得到C的hc;步骤5:按照内各概率内容粒子的类型,构建概率节点的h。2.2.2异质数据库间双向概率映射关系以E为前提,建立E、Pw s与PDTD间的概率映射关系,PR先定义E与PwspPDTD结构间的概率映射规则,再通过概率映射规则自动获取WPws,,、PD T D 间的概率映射关系。PR以Pws,为例,元素树和Pws,间间的概率映射规则定义为:PRR定义5:E的概率根节点与Pws,内的一个概率表相

17、应,PR即概率根表Y。定义6:若某个概率节点的h或h不是空集15,那么该概率节点即是概率表节点Y,与Pws内的一个概率表相应。PR定义7:一个Y的各属性与子节点均与其所属表内的一个字段相应。定义8:PwspR内除Y外的其余概率表均需存在一个和其PR概率父表存在关系的外键。定义9:除Y与概率节点外的概率节点是概率字段节点,与概率父节点相应概率表内的一个概率字段对应。定义10:与Pws,内的全部概率对象均不对应。PR同理获取元素树与PDTD的概率映射规则,概率映射规则获取结束后便可自动建立元素树、Pws,、PD T D 间的概率R映射关系,存储于概率映射表内。2.2.3数据模型的双向转换实现PDT

18、D到pWS,R的转换步骤如下:步骤1:扫描PDTD,扫描方式为由上至下,针对PDTD内各简单概率元素,生成一个相应概率类表的概率属性列,若引用内概率操作符为可选的,那么该列可以存在空值;步骤2:依据简单概率元素类型的反复引用,可获取存在外键的h;步骤3:依据PDTD内各复杂概率元素类型,可获取存在主键的概率类表;步骤4:依据复杂概率元素类型的引用,可获取指向双亲的外键;步骤5:依据混合内容内已解析字符数据,可获取外键的h;步骤6:全部被引用的概率属性转换操作为:依据单值概率属性获取一列,若概率属性可选,那么该列可以存在空值;依据多值概率属性获取存在外键的h,若一个概率属性存在缺省值,那么将其当

19、成列缺省值。Pws,到PDTD的转换步骤如下:PR步骤1:为各概率表创建在一个概率序列引用的概率元素类型中;步骤2:为概率表内各不为键的概率数据列建立存在已解析字符数据的,移至相应概率表内,同时在该概率类型的概率序列内设置,令空值的列为可选引用;步骤3:为各概率表内的主键列建立存在已解析字符数据的,移至相应概率表内,同时在该序列内设置引用;步骤4:若存在外键,则存在外键的概率表是概率子表,外键相应的概率表是概率父表,转换策略是如果概率父表和概率子表为一对一关系,那么在概率父表u概率序列内设置一个概率子表元素的,令其为可选形式。在概率父表元素内移入概率子表所有概率内容,并在概率子表概率序列内设置

20、一条概率父表元素名的,且在概率子表元素内移人概率父表所有概率内容;如果概率父表和概率子表为一对多的关系,那么在概率父表概率序列内设置一条概率子表元素名的,令其为可选反复操作的形式,并依据概率父表元素概率序列的次序,在概率父表元素内移人概率子表的所有概率内容。3仿真分析以某销售公司的关系数据库与XML数据库两个异质数据库为实验对象,以Matlab仿真软件为仿真操作环境,利用本文算法将关系数据库内的shangpin表内数据和XML数据库内的goods表展开双向转换,源数据表内容双向转换前后保持原样。两个异质数据库内数据为完成双向转换会存在较多的数据冲突,分别是基本表内相应字段名称冲突、字段类型冲突

21、与相应列字段取值区间冲突。需要展开双向转换的shangpin表与goods表基本数据如表1所示。表1shangpin表与goods表基本数据表类型字段名称值1值2shangpinMC八宝粥方便面SCRQ2021/10/92021/10/22BZQ二十四个月六个月KC1006罐2139袋SCD天津市天津市goodsName薯片香肠The date of production2021/10/182021/10/14Shelf life九个月十二个月Inventory983袋2116根Producer山东省山东省414利用本文算法双向转换表1内的两个异质数据库内的数据,双向转换结果如表2、表3所示。

22、表2 shangpin表到goods表的转换结果字段名称值1值2值3值4Name薯片香肠八宝粥方便面The date of production2021/10/182021/10/14 2021/10/9 2021/10/22Shelf life九个月十二个月二十四个月六个月Inventory983袋2116根1006罐2139袋Producer山东省山东省天津市天津市表3goods表到shangpin表的转换结果字段名称值1值2值3值4MC八宝粥方便面薯片香肠SCRQ2021/10/92021/10/222021/10/18 2021/10/14BZQ二十四个月六个月九个月十二个月KC100

23、6罐2139袋983袋2116根SCD天津市天津市山东省山东省根据表2 与表3可知,本文算法可有效双向转换异质数据库间的数据内容,很好地解决了双向转换时包含的冲突问题,可为销售公司获取符合要求的业务数据。测试本文算法展开双向转换的查询性能与写入性能,测试方法为向网络发送8 0 0 0 笔交易,交易类型是查询与写入,测试本文算法在不同交易发送频率时的数据双向交换的查询性能与写入性能,交易发送频率代表每秒交易数(Transac-tions PerSecond,TPS),以吞吐量与平均时延为衡量查询与写人性能的指标,测试结果如图1所示。综合分析图1(a)与图1(b可知,当TPS为6 0 0 笔/s时

24、,本文算法进行异质数据库双向转换时的查询性能最优,当TPS为40 0 笔/s时,本文算法进行异质数据库双向转换时的写人性能最优。在不同恶意网络节点概率时,测试本文算法进行异质数据库间双向转换过程中的数据泄露概率,当数据泄露概率超过0.0 5时,说明数据双向交换的安全性较低,测试结果如图2所示。根据图2 可知,当恶意节点概率达到16%时,两种攻击下的数据泄露概率均趋于稳定,控制在0.0 5以内。仿真结果证明,本文算法在不同恶意节点概率并承受不同攻击情况下,进行异质数据间双向转换的安全性较高。4约结论依据元素树的数据映射方法,设计异质数据库间的双向转换算法,利用元素树获取异质数据库间的结构映射关系

25、,以该映射关系为前提,完成双向转换,确保双向转换过程中的数据不会泄露,仿真结果表明本文算法在理论上具有一定的指导意义。270查询吞吐量写人吞吐量240210180150120906030110100 200300 400500600700 800交易发送频率/(笔/s)(a)吞吐量测试结果查询时延6写人时延1.41.21.00.80.60.40.20100200 300400500600700800交易发送频率/(笔/s)(b)平均时延测试结果图1查询性能与写入性能测试结果0.05内容篡改攻击字典搜索攻击0.040.030.020.01024681012141618 2022恶意节点概率/%图

26、2双向转换过程中的数据泄露概率参考文献:1张璐璐,杨晟,史仁,等。本体支持的生物医学领域元数据异质性与可兼容性研究J.中国生物医学工程学报,2 0 19,38(3):324-331.2吴川徽,黄仕靖,储节旺,等.基于集成科研项目数据库的计量分析J.情报科学,2 0 19,37(6):151-156.3翟晓卉,史健勇.BIM和CIS的空间语义数据集成方法及应用研究J.图学学报,2 0 2 0,41(1):148-157.(下转第46 7 页)467上接第414页)参考文献:1文刘浩然,王星淇,覃玉华,等.具有抗毁性的无线传感器网络有向拓扑模型J.控制理论与应用,2 0 2 0,37(6):12

27、2 5-12 31.2朱文金,王罗昊估,蔡志强,等.考虑级联失效的可重构网络抗毁性研究J.西北工业大学学报,2 0 2 1,39(4):8 39-8 46.3周鹏,武延军,赵琛.一种Linux安全漏洞修复补丁自动识别方法J.计算机研究与发展,2 0 2 2,59(1):19 7-2 0 8.4关志艳,黄向生.随机障碍物下的有向传感器网络覆盖优化算法J.小型微型计算机系统,2 0 2 0,41(11):2 38 0-2 38 5.5王婷,隋江华.改进粒子群算法的传感器网络覆盖分布优化J.辽宁工程技术大学学报(自然科学版),2 0 2 0,39(3):2 8 0-286.6赵尚弘.航空激光/射频通

28、信网络技术研究进展J.空军工程大学学报(自然科学版),2 0 2 0,2 1(2):1-15.7蒋俊正,赵海兵.基于超级节点的分布式传感器节点定位算法J.控制与决策,2 0 2 0,35(12):2 8 9 8-2 9 0 6.8石元博,王建辉,方晓柯,等.基于HJB方程的无线传感器网络系统Minimax控制器设计J.控制与决策,2 0 2 1,36(4):9 47-952.9郑涛,张仕斌,孙裕华,等.基于贝尔态的半量子安全直接通信协议J.计算机应用研究,2 0 2 0,37(7):2 144-2 147.4刘江涛,杨伟明,魏杰,等.基于市政管线规划信息的排水管网模型数据转换方法研究J.中国给

29、水排水,2 0 2 1,37(10):2 8-33.5圣文顺,徐爱萍。基于行键的HBase大数据文件存储转换与快速检索研究J.计算机应用研究,2 0 19,36(12):38 0 6-38 10.6何丽丝,曹荣,王德禹.面向送审的船体结构三维模型转化数据技术研究J.中国舰船研究,2 0 2 1,16(5):2 0 6-2 15.7李国辉.火灾报告非结构化数据转换为结构化数据的信息提取技术J.消防科学与技术,2 0 2 0,39(7):9 2 6.8赖欣,曾纪炜.几何类航空数据与关系型数据库映射转换研究J.计算机科学,2 0 2 0,47(2):57 0-57 2,57 8.9刘稳,詹庆明,刘权

30、毅,等.地理国情监测成果与规划用地数据的关联转换方法J.地球信息科学学报,2 0 2 0,2 2(2):16 1-174.10孙竹梅,王琦,李俊杰,等.西门子PCS7与HART仪表通信的数据转换研发J.电子器件,2 0 2 0,43(5):112 8-1132.11王思明,李昭坊.基于特征向量变换GAN的多域图像转换方10乔鹏丽,吕英杰.基于SystemVerilog的数字基带通信芯片的验证J.南开大学学报(自然科学版),2 0 2 0,53(6):1-4.11任卓君,陈光,卢文科恶意软件的操作码可视化方法研究J.计算机工程与应用,2 0 2 1,57(18):130-134.12周其林,王旭

31、,刘旭东.基于神经网络融合模型的源代码注释自动生成J.空间控制技术与应用,2 0 2 1,47(2):42-48.13王茂秋,张江,张晶.基于斯坦纳树和泰森多边形的连通恢复算法J.计算机工程与科学,2 0 2 0,42(8):1352-1358.14刘燕,陈彬,张井超,等。植保无人飞机的抗风能力测试系统的研发J.江苏大学学报(自然科学版),2 0 2 0,41(3):346-352.15 舒坚,高素,陈宇斌.基于自适应广义回归神经网络的链路质量评估J.计算机研究与发展,2 0 2 0,57(12):2 6 6 2-2 6 7 2.作者简介张江山(19 7 7-),男(汉族),江西抚州人,硕士,

32、讲师,研究方向:安全防范技术、物联网技术(通讯作者)。熊哲源(19 8 2-),男(汉族),江西南昌人,博士,副教授,研究方向:无线传感技术、安全方法技术。法J.云南大学学报(自然科学版),2 0 2 0,42(6):10 8 0-1090.12冯国正,马耀昌,孙振勇,等.地面三维激光点云数据拼接与坐标转换方法研究J.人民长江,2 0 19,50(2):151-154.13蒋瑜。基于改进差别信息树的粗糙集属性约简算法J.控制与决策,2 0 19,34(6):12 53-12 58.14王丰,王亚沙,赵俊峰,等一种基于迭代的关系模型到本体模型的模式匹配方法J.软件学报,2 0 19,30(5):1510-1521.15刘建军,杨文韬,刘冰,等.铁路集装箱定位数据转换关键技术研究J.铁道运输与经济,2 0 19,41(3):10 6-110.作者简介包空军(19 6 4-),男(汉族),河南舞阳人,硕士研究生,副教授,研究方向:数据库与多媒体。曹瑞(19 6 8-),女(汉族),河南郑州人,硕士研究生,副教授,研究方向:数据分析与信号处理。

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服