收藏 分销(赏)

基于区块链技术的绿色证书核发流程实时半监督自训练算法.pdf

上传人:自信****多点 文档编号:2340094 上传时间:2024-05-28 格式:PDF 页数:7 大小:3.05MB
下载 相关 举报
基于区块链技术的绿色证书核发流程实时半监督自训练算法.pdf_第1页
第1页 / 共7页
基于区块链技术的绿色证书核发流程实时半监督自训练算法.pdf_第2页
第2页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、信息技术XINXIJISHU2023年第10 期基于区块链技术的绿色证书核发流程实时半监督自训练算法袁昊,杨振伟,罗发政,赵海萍,李娜,俞芙妍(1.国网甘肃省电力公司,兰州7 30 0 50;2.国网思极飞天(兰州)云数科技有限公司,兰州7 30 0 50)摘要:由于大型数据库存在绿色证书错误核发的现象,导致数据库安全性降低,机密数据存在丢失的风险。为此,提出一种基于区块链技术的绿色证书核发流程实时半监督自训练算法。从访问者身份信息、权限信息、行为信息以及生物信息等四个方面提取用户身份特征,构建自训练(Self-Training)特征库;以特征库中的特征作为对照,利用区块链技术中的智能合约规则

2、认证身份,判断是否给访问者颁发绿色通行证书;给通过认证的访问者,颁发绿色证书,允许其访问数据库,实现安全访问控制。实验结果表明,算法的数据查询平均准确率较高,平均漏报率和误报率较低,能够准确认证访问者身份,提高了数据库安全性,保证了绿色证书核发的准确性。关键词:区块链技术;绿色证书;核发流程;身份认证;半监督Self-Training算法中图分类号:TP391D0I:10.13274/ki.hdzj.2023.10.024Real-time semi-supervised Self-Training algorithm for green certificate issuance proces

3、s based onblockchain technologyYUAN Hao,YANG Zhen-wei,LUO Fa-zheng,ZHAO Hai-ping,LI Na,YU Fu-yan?(1.State Grid Gansu Electric Power Company,Lanzhou 730050,China;2.Guowangsijifeitian(Lanzhou)Cloud Number Science and Technology Ltd,Lanzhou 730050,China)Abstract:Due to the phenomenon of error issuance

4、of green certificate in large databases,the security ofthe database is reduced,and there is a risk of loss of confidential data.Thus,a real-time semi-supervisedSelf-Training algorithm based on blockchain technology for the issuance of green certificates is proposed.The user identity characteristics

5、are extracted from four aspects,including visitor identity information,per-mission information,behavior information,and biological information,and a self-training(Self-Training)feature database is built.Then,the features in the feature library are taken as a comparison,and the smartcontract rules in

6、 the blockchain technology are used to authenticate the identity,and determine whether toissue a green pass certificate to the visitor.Green certificates are issued to the authenticated visitors to allowthem to access the database to achieve secure access control.The experiment results show that the

7、 average da-tabase query accuracy rate of the studied algorithm is high,the average false negative rate and the false posi-tive rate are low,which can accurately authenticate the identity of the visitor,improve the security of the da-tabase,ensure the accuracy of green certificate issuance.Key words

8、:blockchain technology;green certificate;issuance process;identity authentication;semi-su-pervised Self-Training algorithm作者简介:袁昊(19 8 1一),男,硕士,高级工程师,研究方向为电力信息系统调度运行技术。文献标识码:A文章编号:10 0 9-2 552(2 0 2 3)10-0 12 9-0 7一12 9 一基于区块链技术的绿色证书核发流程实时半监督自训练算法0 引 言近年来,越来越多单位、企业依靠信息网络实现了智慧办公,过程中内部网络数据库存储了大量的机密信息,

9、这些信息对于单位或者企业的发展决策具有非常重要的作用,理论上是不允许泄露的 。然而,面对越来越升级的攻击手段,非法入侵、非法访问行为等攻击成功次数越来越多,数据安全问题成为各方关注的焦点,因此如何保证数据信息安全具有重要的现实意义。基于上述背景,相关学者提出了许多解决方法,如赵柳榕等2 在研究中以基于演化博奔的入侵检测结果为基础,通过防火墙技术阻止非法访问;曹震寰等3 通过设置访问控制列表,实现对Android用户的权限管控;岳静等4 基于访问者的生物统计信息获取多因子身份信息,以此完成身份验证。以上方法主要通过识别异常用户以及用户等级来给用户颁发相应的证书,以控制用户访问行为,但一旦用户身份

10、信息丢失或者被篡改、冒用,就会给非法者人侵的机会。而数据库系统一旦认定用户身份合法,就极有可能发生证书错误颁发或者颁发错误等级的证书,导致数据库安全性降低。区块链技术是近年来新出现的一种安全存储方法。通过该技术可实现用户身份的多重认证,使得用户证书颁发更为严格。在上述背景下,结合区块链技术,本文提出绿色证书核发流程实时半监督自训练算法用来阻止非法攻击,保证数据库安全。1基于区块链技术的绿色证书核发自训练算法智能办公、远程办公的发展,使得信息网络的利用率大大提升,很多有价值的信息不再以书面的形式存储,而是通过数据库系统保存起来,以方便信息查阅,但同时也带来了数据安全的问题5。本文利用自训练(Se

11、lf-Training)算法建立特征库,并结合区块链中的智能合约,审核访问者身份类型,判断是否该给用户发放绿色证书,确定其访问权限,以保证数据安全。具体包括自训练数据库建立、访问者身份识别与认证以及绿色证一13 0 一一一袁昊等书核发等三个部分。1.1自训练(Self-Training)特征库构建Self-Training算法是利用已有的数据训练一个模型,其本质就是一个标准的半监督模型,半监督学习利用大量的无标记数据,使用数据分布的模型,通过建立学习器,标记无标记数据,并借助标记数据进行模式识别。构建自训练特征库,为后期利用该模型对未标记的数据进行标记提供对比依据,以此确定未标记数据类型6 。

12、Self-Train-ing算法流程如下:步骤1:对有标签和无标签数据进行初始化;步骤2:采用已有标签数据训练模型,并对无标签数据进行预测;步骤3:利用最有把握的预测结果,对无标签数据进行标记;步骤4:将标记后的无标签数据加人到有标签数据训练集中,并去除原有的数据集;步骤5:假如训练集和模型均满足要求,那么输出当前训练集和模型结果,否则,回到步骤2。利用Self-Training算法对访问者进行身份认证的首要环节就是建立自训练特征库。自训练特征库中包含了能够描述各种访问者的特征。组成这些特征集合的具体过程如下:步骤1:确定能够描述访问者类型的特征参数,包括访问者身份信息A、权限信息B、行为信息

13、C、生物信息D等四种。其描述如下:Y=(A,B,C,DI式中,Y代表特征参数集合。步骤2:特征提取。针对这四种参数,进行特征提取。访问者身份信息和权限信息均为人为设定的,是由特征库呈现的。访问者在访问数据库时,可以查阅和了解特征库的基本信息和角色信息。由于访问者身份信息和权限信息可以直接获取,因此仅对访问者行为特征和访问者生物特征进行提取7 。访问者行为特征。访问者要想访问数据库中的数据,必定会进行相关的操作和浏览,而这些操作或者浏览行为(1)基于区块链技术的绿色证书核发流程实时半监督自训练算法会留下痕迹,存储在系统日志当中,访问者的行为H=特征提取过程如下:2第一步:在区块链分布式存储系统内

14、嵌入监式中,G代表最大灰度值,G,代表最小灰度值。控代码,爬取用户行为记录。接着利用H进行图像背景和图像目标分割。第二步:对爬取到的用户行为记录进行归一d.特征提取。利用LBP算子,提取五官纹理化处理。特征川。第三步:对爬取到的用户行为记录进行属性步骤3:根据上述提取出来的访问者特征,进划分,建立每一种用户行为属性库。行自训练,构建自训练特征库12 。具体过程第四步:按照下述公式计算属性的权重:如下:n假设训练类别数为T,每个类别包含了访问w;=log(2)(g;+h,)式中,w;代表第i个行为属性权重;g;代表该属性在同类非法访问中出现的次数;h;代表该属性在其他非法访问类型中出现的次数n代

15、表操作或者浏览行为总次数。第五步:计算第i个行为属性的亲和力:R,w;i=1P;=K,式中,P,代表第i个行为属性的亲和力;R,代表第i个行为属性;K,代表第i个行为属性与属性集合中其他属性的标准差;T代表惩罚函数。第六步:将P,与设定的阈值进行对比,将大于阈值的P,属性作为行为特征,加人行为特征集合国。访问者生物特征提取。访问者的生物学特征是指访问者的人脸特征。由于人脸具有很强的特征性,因此人脸识别在很多领域都作为通行凭证之一9 。为此,在本研究中,也将人脸的生物特征作为访问者身份认证的条件之一。对于人脸上的生物特征提取过程如下:a.人脸图像采集。b.人脸图像预处理。c.图像分割。将五官从整

16、张人脸图像上分割出来10 。具体过程如下:首先计算整张人脸图像的最大和最小灰度值,以此计算灰度门限H,公式如下:袁昊等Gi+G2(4)者 M个特征,F,代表第i类第j个特征向量,N,为第i类类别特征数量,则得到训练总样本数量N=N+N2+.+N,整个训练集表示如下:Fu,Fi2,FiM,Fa1,F2,F,。计算特征均值S和方差矩阵Q。NFNT(3)(5)22F,(F,-5)(F,-5)TNi1Q=式中,T代表矩阵转置。在Q中有q个特征值Li,Lz,L,及其特征向量C,C2,C。接着计算方差贡献率:2(L:-5)R,=鱼i=1式中,R,代表方差贡献率;q代表剩余特征数量。将R,与阈值B进行比较,

17、当 R。B,特征值以及特征向量删除,构建特征空间变换矩阵C=C1,C2,.,C,。接着,将F,投影到特征空间,投影公式如下13 1:P;=CF式中,P,代表第i类第j个特征投影后在特征空间中的一点。将所有特征都投影到特征空间,即可得到自训练(Self-Training)特征库。一 131 一(6)N(7)(8)基于区块链技术的绿色证书核发流程实时半监督自训练算法1.2基于区块链技术的区块访问者身份认证以上述构建的Self-Training特征库为参考,通过区块链技术认证区块数据库访问者的身份,开始一一袁昊等判断是否给该访问者颁发绿色通行证书。访问者身份分类与认证基本工作流程如图1所示。区块数据

18、库授予区块链管理员系统权限授予申请访权限访问者数字签名访问者身份信息访问者权限信息、访问者行为信息、访问者生物特征信息智能合约身份判断Self-Training特征库区块链管理者、权威管理机构等N共识认证是否合法?Y非法访问者区块访问结束图1基于区块链技术的访问者身份认证流程结合访问者特征,通过区块链技术中智能合约对访问者身份进行认证14,认证规则构建过程如下:步骤1:按照章节1.1的流程对访问者信息进行特征提取,组成未认证的访问者特征集合F。步骤2:将F投射到特征空间当中。步骤3:随机从F中选择一个特征点,计算该点与特征库中各特征点之间的距离15。计算公式如下:d=f.-fi2式中,d代表特

19、征之间的距离;f.代表未认证的访问者特征点;f,代表特征库中特征点。一132 一步骤4:按照从小到大顺序,排列距离,选择距离f,最近的K个特征点。步骤5:确定前K个点所在类别的出现次数。步骤6:将前K个点出现次数最高的类别作为用户身份类别,即是否是合法访问用户。通过区块链技术中的智能合约规则完成访问者的身份认证,只有合法用户才能获得绿色证书,才被允许访问,读取分布式区块中存储的数据。1.3绿色证书核发基于上一章节访问者身份认证结果,从数据(9)库管理者、管理机构等多个方面对认证结果进行审核,看结果是否达到共识,通过达成的共识来发放绿色证书16 。绿色证书核发流程如图2 所示。基于区块链技术的绿

20、色证书核发流程实时半监督自训练算法袁昊等(10)开始用户提出申请智能合约身份认证非法是访间者N合法Y结束图2 绿色证书核发流程2仿真测试与分析为测试所研究算法的应用效果,以 Androidvirtual device manager 作为仿真平台,以文献2 算法、文献3 算法、文献4 算法作为对比方法,进行基于身份认证的访问成功率测试。2.1仿真测试数据采用KDDCUP99数据集中五种非法访问数据集和一种合法访问数据集作为仿真测试样本,其中,非法访问训练集和测试集分别为16 51和1427个,合法访问训练集和测试集分别为2 9 5和257个。每个样本中访问者人数分布情况如图3所示。通过上述仿真

21、测试平台和测试数据设置,利用Self-Training算法,根据提取的访问者特征进行自训练,将所有特征都投影到特征空间,得到自训练特征库。将不同访问标签数据输入到自训练特征库中,计算得到初始化分类,再逐步加人无标签的数据,进行半监督学习。2.2仿真测试流程基于身份认证的访问成功率测试流程如图4所示。2.3评价标准对所研究算法质量进行评价,所选择的评价400350-300-250-注册中心200-150-签发中心人工审核生成证书颁发证书用户获取绿色证书,访间区块链数据库训练集357342295297252257100-50-0+合法R2LU2RDOSBEMAL非法访问数据集类型电话、邮件通知测试

22、集350366340236300238PRONOR图3仿真测试样本分布图开始导入数据集所研究算法实施合法访问与非法攻击访问控制N是否合法?Y颁发证书图4仿真测试流程指标有三个,相应的计算公式如下:准确率Y:Y=T,+T,+F,+FTp+TN确定检测方法防火墙技术权限限制技术身份认证技术非法访问结束一13 3 一合基于区块链技术的绿色证书核发流程实时半监督自训练算法误报率Z:Z=T+F,Fp漏报率U:FU=T,+F式中,Tp代表正确认证的非法访问记录;T代表正确认证的合法访问记录;F,代表错误认证的合法访问记录(误报);F代表错误认证的非法访问记录(漏报)。2.4结果与分析对每个数据集攻击10

23、次,每次时间为5分钟,按照(10 0 10 0 0)pkts/sec速率非法访问。分别取四种方法10 次的身份认证结果,计算平均值,得出平均准确率、平均漏报率以及平均误报率,结果如表1 所示。表1认证评测结果方法平均准确率平均漏报率平均误报率本文算法93.334文献2 算法71.457文献3 算法78.595文献4 算法81.253从表1中可以看出,相比其他算法,本文算法的平均准确率更高、平均漏报率以及平均误报率更低,说明本文算法对访问者的身份认证更为准确,可保证绿色证书核发的准确性,更能有效区分访问者的合法性,保证了数据库安全。为了进一步验证方法的优越性。在相同的仿真场景中,对不同方法进行仿

24、真对比,收集不同规模网络数据库的TC分组数量和包传递率,并对其进行对比分析,不同算法在网络数据库中TC分组统计量如图5所示。根据图5可知,在2 0 s之前,不同算法在 TC分组数量方面几乎没有差别,随着运行时间的增加,所提算法优势开始体现,降低了路由开销。在此基础上,使用不同算法,描述包传递率情134一袁昊等90(11)807060(12)504030201000况,结果如图6 所示。10095(%)90%/率轮2.3661.4558.6945.6626.2565.8847.2544.552一本文算法+文献2 算法日-文献3 算法一文献4 算法2040运行时间/s图5分组统计880757065

25、33353739311313315317319运行时间/s图6 包传递率对比根据图6 可知,本文算法与其他算法相比,在网络容量较小时,包传递率有一定程度的提高,但提高幅度较小。随着网络容量的增加,本文算法的包传递率有较大幅度提高,能够有效保证网络数据库的安全性和可靠性。在此基础上,进一步验证所提算法的数据库容量需求和执行效率,将数据库数据容量、数据库索引容量和算法执行时间作为评价指标。算法执行时间越短,表明算法执行效率越高。对不同方法进行仿真对比,结果如表2 所示。6080。本文算法+文献2 算法日-文献3 算法一-文献4 算法100基于区块链技术的绿色证书核发流程实时半监督自训练算法表2 仿

26、真对比结果验证协议J.南京理工大学学报:自然科学版,数据库数据数据库索引方法容量/MB本文算法1082文献2 算法1368文献3 算法1536文献4 算法1873从表2 中可以看出,相比其他算法,本文算法数据库数据容量和数据库索引容量较小,算法执行时间较短。说明本文算法对数据库容量需求更低,且能够有效提高算法执行效率。3结束语数据库中存储了很多有价值的信息,对于企业、单位决策和发展都具有重要的作用,因此必须保证数据库安全。基于上述背景,提出一种基于区块链技术的绿色证书核发流程实时半监督自训练算法。该算法通过自训练获取特征数据库,为访问者身份识别提供了基础对比数据,最后通过区块链当中的智能合约,

27、实现了对访问者身份、权限的认证。然而,本研究仍存在一些问题需要改进,即 Self-Training算法仅对访问者是否允许访问进行研究,并没有仔细划分访问者的等级,不同等级的用户应该核发不同等级的绿色证书,以便控制访问者权限,进一步加强控制。下一步将对用户等级进行研究。参考文献:1胡兆鹏,丁卫平,高瞻,等。一种基于区块链技术的多阶段级联无线安全认证方案J.计算机科学,2 0 19,46(12):180 185.2赵柳榕,朱晓峰.基于演化博奔的防火墙和人侵检测系统配置策略分析J.数学的实践与认识,2 0 19,49(10):97 105.3曹震寰,蔡小孩,顾梦鹤,等.基于访问控制列表机制的Andr

28、oid权限管控方案J.计算机应用,2 0 19,39(11):3316-3322.4岳静,邓利红.基于生物统计信息的多因子远程身份一袁昊等算法执行2019,43(1):41-47.容量/MB时间s18.3615.630.1522.346.8728.463.2132.55陈孝莲,虎啸,沈超,等.基于区块链的电力物联网接人认证技术研究J.电子技术应用,2 0 19,45(11):7 7-81.6王立国,刘佳俊.结合边缘采样与差分进化的高光谱图像半监督协同分类框架J.黑龙江大学自然科学学报,2 0 2 0,37(1):9 2-9 8.【7 李村合,张振凯,朱洪波.基于半监督学习的多示例多标签改进算法

29、J.电子技术应用,2 0 19,45(7):3235,39.8赵灵奇,宋宇波,张克落,等.基于区块链和分层加密的物流隐私保护机制J.应用科学学报,2 0 19,37(2):224-234.9付永贵,朱建明.基于区块链的电子档案信任保障机制J.情报科学,2 0 2 0,38(3):6 0-6 3,8 6.10李萌,刘文奇,米允龙.基于区块链的公共数据电子证据系统及关联性分析J.智能系统学报,2 0 19,14(6):1127-1137.11】吕婧淑,操晓春,杨培.基于区块链和人脸识别的双因子身份认证模型J.应用科学学报,2 0 19,37(2):164-178.12杨茜茜.基于区块链技术的电子档

30、案信任管理模式探析:英国ARCHANCEL项目的启示J.档案学研究,2 0 19(3):135-140.13黄穗,李健,范冰冰.IABC:一种基于区块链和布谷鸟过滤器的跨域认证方法J.小型微型计算机系统,2 0 2 0,41(12):2 6 2 0 -2 6 2 5.14】杨亚涛,蔡居良,张筱薇,等.基于SM9算法可证明安全的区块链隐私保护方案J.软件学报,2 0 19,30(6):1692-1704.15张利华,胡方舟,黄阳,等.基于联盟链的微电网身份认证协议J.应用科学学报,2 0 2 0,38(1):17 3-183.16 成丽娟,祁正华,史俊成.基于区块链的EHR数据安全存储共享方案J.南京邮电大学学报:自然科学版,2 0 2 0,40(4):9 6 -10 2.(责任编辑:丁晓清)一13 5一

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服