收藏 分销(赏)

基于差分隐私保护的电力线损数据共享研究.pdf

上传人:自信****多点 文档编号:634778 上传时间:2024-01-19 格式:PDF 页数:5 大小:1.51MB
下载 相关 举报
基于差分隐私保护的电力线损数据共享研究.pdf_第1页
第1页 / 共5页
基于差分隐私保护的电力线损数据共享研究.pdf_第2页
第2页 / 共5页
亲,该文档总共5页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第 卷第 期计算机应用与软件 年 月 基于差分隐私保护的电力线损数据共享研究项胤兴杨里陈伯建李国才(国网福建省电力有限公司电力科学研究院福建 福州 )(国网福建省电力有限公司福建 福州 )(四川大学电气工程学院四川 成都 )收稿日期:。国网福建省电力有限公司科技项目();四川省教育厅科研项目()。项胤兴,高工,主研领域:电网新技术。杨里,高工。陈伯建,工程师。李国才,副教授。摘要在电力线损的分析和降损措施研究中,大量用到电力营销、用电等数据,这些数据涉及用户隐私和商业秘密,如果开放应用将面临着较大的隐私泄露风险。结合区块链的不可篡改性和全流程可溯源的特点,考虑应用系统的安全等级差异和多方数据的

2、整合,提出满足差分隐私要求的电力隐私数据多安全层级的共享方案。该方案能够将隐私数据泄露的风险降低到可以控制的范围,从而消除数据持有方信息安全的担忧,对电力数据的大规模开发利用有借鉴意义。关键词电力隐私数据差分隐私保护区块链中图分类号 文献标志码 :(,)(,)(,),引言在对线损的分析和降损措施方法的研究中,针对用电信息的大数据挖掘将发挥非常大的作用 。但由于电力营销、用电等数据涉及用户隐私、商业秘密,对该数据的开放应用面临着较大的隐私泄露风险。同时线损和降损措施分析需要对多个区域、多个层次的线损数据进行挖掘,需要各层次数据源的协调数据发布共享。这亦是电力企业众多业务场景下电力数据开放和大规模

3、商业应用亟待解决的问题。一方面,电力企业各个业务与部门积累了海量数据,数据种类与数量持续增加;另一方面,由于数据源分布式分布、数据异构产生的孤岛现象使企业无暇进行针对性的数据挖掘 计算机应用与软件 年与利用,无法更好地为企业创造巨大的社会和经济效益。近年来,为了促进电力数据创新应用和数据商业化的同时有效保护隐私和商业秘密,涌现出了大量研究成果和信息保护方案:()标志信息移除替换,分析数据中个体的标志变量信息,利用对原始隐私数据进行去标志处理,将标志隐藏在信息中或者利用人工假名进行标志变量替换。()降低数据精度,该方法通过控制标识数据精度的方式进行调控。()数据聚合,该方法利用群组或者总体信息进

4、行聚合以减少隐私信息泄露。()匿名化,该方法通过加密技术处理数据以实现信息匿名化。()差分隐私算法 ,该算法其本质是一种利用随机添加噪声数据来实现隐私保护的方案,并且添加的噪声数据不会妨碍此后的数据挖掘 。差分隐私保护技术对数据记录的保护能够无视攻击者拥有的知识背景,是最具有应用前景的脱敏保护方法。这些方法能够将隐私数据发布的泄露风险降低到可以控制的范围 。但在面临区域电网级别的数据综合应用时,由于数据的分布式分布,数据发布分享系统还须考虑对隐私模型、隐私保护参数协商和存储、应用商识别数据追溯等安全问题。目前解决协商、存储和追溯等安全领域的前沿是区块链技术。区块链是按照时间顺序的数据块的链式结

5、构,数据都组织在树型的数据结构中,节点间通过下一级节点的散列值进行标记。区块链通过去中心化的密码学实现安全防篡改的分布式数据库,它的特点是安全、智能、公开可验证、可溯源、开放和透明。构成区块链的技术包括密码技术、分布式存储、共识机制和智能合约。智能合约是运行于区块链中用户自定义的程序,合同参与方以自执行的方式高效地构建其间关系。区块链技术在共享经济 和电力系统交易中已多有应用。黄虹等 针对电力自由双边交易,提出基于联盟链技术的电力交易方法以解决中心化电力交易模式中市场主体互信度不够、数据安 全 性 不 高 的 问 题。等 针对隐私数据在连续发布或者监测场景的需求提出了解决方案。等 通过引入贝叶

6、斯网络来解决高维隐私数据发布上的低效率问题。对此,本文针对线损综合业务系统的线损和用户用电数据挖掘的应用,在高维隐私数据联合共享发布且隐私数据连续发布的应用的场景下,提出一种基于区块链技术与隐私保护技术相结合、满足多层次隐私需求的差分隐私数据集发布方案。即在区块链中存储共享数据块的差分隐私技术参数、属性加密数据、数据应用模型及状态、数据的处理结果和处理交易的信息。通过对区块链中的智能合约的设计,完成数据源协商数据脱敏数据交易的全过程。原始数据块经过差分隐私脱敏后和数据应用模型及状态打包通过可信任执行环境交由第三方进行数据挖掘计算,计算结果通过智能合约记录到链中。该数据分发共享系统具有极高的安全

7、性,解决了电力数据发布共享应用中分布式数据源和数据应用商群体之间协调工作的问题,并且通过区块链的可追溯性可以进行正确的数据访问责任。基于区块链的电力线损大数据分析应用构架基于区块链的电力线损数据分析架构如图 所示。图 基于区块链的电力数据应用架构图 中业务数据源是各个地市的线损业务管理系统,部署在企业内网。业务数据源分布在企业内网各个地区,以数据流的方式提供电网结构特征、设备物理参数、电网运行特征、用电结构特征等各种因素构成的多元指标体系,这些指标 属性中大量包括用户 、地址等需要匿名处理的信息。大数据应用系统是各个独立的具有针对性的数据模型挖掘应用,可以是企业内部不同地区的应用系统,也可以是

8、承接数据处理和分析的第三方子系统。这些应用系统对业务系统有着不同的数据需求,系统以离线批处理方式或者是在线方式通过授权系统与区块链发生交互,交互流程如图 所示。图 基于区块链的电力线损数据应用流程第 期项胤兴,等:基于差分隐私保护的电力线损数据共享研究 该方案与现有数据共享和发布机制不同的是区块链建设在企业内部,在智能合约协助下,业务系统方流程为:()公布数据定义及算法等模型上链。()智能合约作为可信任的第三方将脱敏规则上链保存。()智能合约将处理模型和状态上链,并触发应用方获得数据下载模型和状态,通过授权的通道获得数据集,进行处理后,报告信息上链完成。()数据源(业务)系统通过处理报告进行分

9、析获得线损因素,进一步进行线损管理。在线损大数据挖掘分析中,各个地区的电网结构特征、设备物理参数、电网运行特征、用电结构特征等各种因素构成的多元指标体系具有相同的属性和较高维度,并且每组数据包含不同的个体,多个业务系统数据源分别拥有一组局部关系数据集。在智能合约辅助下,需要对常见的数据包括名称、地址、用户 等敏感数据进行脱敏操作,另外由于数据会进行修改,需要在数据安全的前提下尽可能减少数据的信息损失。由于线损数据是基于时间序列数据流,数据量非常大。因此本文的数据发布方案采用多种方案相结合,一方面采用数据匿名化技术对名称、地址、用户 等信息进行处理;另一方面采用数据脱敏技术对时间戳格式进行处理。

10、该处理流程能够成功阻止身份被公开,又不会显著影响数据分析挖掘的效果,如图 所示。图 基于差分隐私数据发布结构 基于差分隐私的线损数据动态发布技术 算法设计假设有 个业务系统分别是,其所有的局部地区数据集为,这些数据集具有相同的属性:(,)()显然 ,其中 为时间戳。业务系统对隐私的保护水平可以被分割为 个层级,记为:()式中:代表业务系统 在隐私层级 上使用的隐私预算。隐私等级越高(越小),隐私保护越严格,加入的噪声越多。根据应用场景,我们将应用系统对应不同的信用水平 ,可以得到其数据所使用的隐私预算。我们对时间戳采用分粒度的概化根据隐私等级划分粒度为 ,其中 为时间段内初始总的数据数目,为其

11、隐私预算。第一步时间戳概化后处在不同的时间段中在后续处理中维持不变。每一个时间段中包含的业务数据,在进行第二步隐私处理时根据时间段中的业务数据数目独立进行概化,得到最终的时间戳。参考文献 业务系统与智能合约在差分隐私条件下构建贝叶斯网络,然后分成以下 个阶段。()设第 个业务系统原始数据为,然后以属性和其候选父节点集合间的互信息作为参考,利用指数机制为每个属性 选取一组父节点,构建有向无环图 ,并使该图的互信息和 (,)最大。()计算每个属性 父节点集合对(,)的边际分布(,),通过在其中加入适量的拉普拉斯噪声。由于第一个属性的父节点集合为空,需要进行属性个数 次迭代,每次迭代分配的隐私预算为

12、(),根据该隐私预算和边际分布的敏感度,业务系统在统计信息中加入合适的噪声,这样保证了满足分层的 差分隐私保护,并将相关参数发送给区块链。()智能合约利用收到的各个业务系统的边际分布(,)进行统计,计算每个候选属性 父节点集合对中属性与其候选父节点集合的互信息 (,)。并选取其中最大值为该属性的父节点集合,这样就确定了贝叶斯网络 的结构。()业务系统在智能合约辅助下,先对时间戳进行第一层自适应概化,并且计算每个数学技巧父节点结合的带噪声的边际分布(,),并利用该边际分布,计算属性 在给定父节点集合 时的条件分布(,),。这个阶段使用拉普拉斯机制在边际分布中加入 预算的噪声,这样在联合发布阶段,

13、数据满足了 差分隐私保护。()基于(,),智能合约辅助计算数据集 近似的联合分布:()()()最后利用抽样方法生成一组新的数据 ,并对时间戳进行第二层自适应概化。技术分析基于差分隐私的组合性质,在智能合约计算属性 计算机应用与软件 年分组的边际分布时,通过对原始数据引入多方拉普拉斯机制在属性分组的边际分布中加入噪声,从而保证该阶段的 差分隐私保护。在贝叶斯网络 的结构初始化和更新阶段,业务系统利用局部数据集合通过迭代为属性的学习过程,满足 差分隐私保护。该过程对应用系统是透明的,这样可以降低隐私泄露的风险。在本文应用场景中,区块链智能合约作为可信的第三方,在应用程序的调用下操作账本将涉及的隐私

14、信息以安全的方式保留在链中,同时可以协调多个业务系统和应用商协同完成线损数据挖掘应用。系统实现及验证实验验证环境在实验室中实现,运行平台是 至强 ,主频 ,内存 。本文以联盟链 为区块链平台以 方式进行部署,实现数据源系统和大数据应用系统的双边模拟交易保证去中心化。数据处理平台采用 ,配置为本地方式。实验数据为带时间戳的用电消费数据。为了测试隐私处理性能,实验采用一个机器学习任务 分类,在整体生成数据集上训练分类器。实验中衡量分类数据的准确率,对每个任务多次重复运行,并记录结果的平均值。图 给出了不同数目数据源业务系统提供数据对算法的影响。其中隐私预算为,推荐的差分隐私保护方案和没有隐私保护下

15、生成的数据训练的二分类器的分类错误率。可见加入差分隐私保护后,分类器性能比未进行隐私保护的方案有一定程度下降,同时可以看出随着业务系统数目的增加,性能比较稳定。图 不同数目业务系统下的分类差错率曲线图 给出了方案在不同隐私预算要求情况下的推荐方案的分类错误率,可见随着隐私保护要求的加强,分类器性能逐渐变差。业务系统对隐私数据的分层处理也会影响最后分类器的错误率,图中给出了分别为 和 两种情况下对系统分类错误率的影响。图 不同隐私预算下系统方案性能曲线实验环境中区块链合约设置能够完成双边交易的协商功能,基本满足系统响应要求。通过隐私保护和分类训练结果表明该方案可以满足差分隐私保护要求,对业务系统

16、关键数据进行保护,同时也能够保证应用系统数据挖掘和机器学习的要求。结语本文提出一种基于区块链技术与差分隐私保护技术相结合的非信任多方数据共享模型。实验系统测试表明,通过对隐私数据共享策略和智能合约设计,该方案可以实现业务系统关键数据的分层隐私保护,满足差分隐私保护要求,整个数据交易都将在区块链中可追溯,达到了预期设计目标。该实验方案验证了该数据共享保护方案的可行性,下一步还将继续优化和项目方协调进行生成环境试运行。本文提出的方法有助于实现企业隐私数据的共享利用,为隐私保护下的大数据挖掘提供新的技术解决思路。参考文献吴雪峰,马路 数据挖掘技术及在制造业的应用 计算机应用与软件,():,颜飞,张兴

17、,李畅,等 基于差分隐私的海量数据发布方法研究 计算机应用与软件,():徐启元,陈珍萍,付保川,等 基于差分隐私的混合位置隐私保护 计算机应用与软件,():(下转第 页)第 期李泽慧,等:基于大数据的网络安全态势感知平台应用研究 图 网络安全的综合安全态势展示结果从图 中可以清晰地看到自然资源部信息系统所面临的安全威胁,主要体现在 个维度:资产态势、脆弱性态势、网络攻击态势、安全事件态势、外连态势和横向威胁态势。各类安全威胁依照系统设定的规则进行等级和分值划分。平台整合分散在管辖范围内不同区域的各类网络安全数据,经态势感知算法和大数据分析生成可视化的监测指标,展现在大屏上,并将预警信息实时推送

18、至平台管理员或运维人员,协助本单位实时掌握全网安全态势。当锁定产生安全事件的风险终端时,平台会进行相应的扣分,综合评分会随之降低并显示告警。当运维人员及时处理安全事件后,综合评分会相应回升。结语本文结合自然资源部对网络安全态势感知平台的建设需求,分析了平台建设所需要使用的关键技术。面向海量网络安全日志数据集,提出一种基于 并行处理的 算法,并通过实验仿真论证了该算法的适用性。设计并阐述了平台建设的逻辑架构。通过在外网各个关键区域节点旁路部署潜伏威胁探针的方式实现了平台的安装集成,形成了一套网络安全管控解决方案。平台运营至今,积极维护了自然资源部的外网网络安全,有效保障了信息系统的稳定健康运行。

19、考虑到外网网络攻击事件层出不穷,网络安全日志数据集的实际体量会逐渐庞大,平台的数据存储和计算能力略显不足,算法引擎的性能会受制于平台服务器的计算资源配置,自然资源部在未来的工作中会加强平台的规划建设,通过设备扩容和配置升级来不断完善平台的防护能力,以更好应对网络威胁带来的考验。参考文献王昌明 如何构建广播电视网络安全预警和态势感知系统 有线电视技术,():贾晓雷,郭军,王煜 有线电视网络安全态势感知技术研究 天津科技,():管磊,胡光俊,王专 基于大数据技术的网络安全态势感知平台研究 保密科学技术,():李宗伟 基于人工智能的网络安全态势感知技术研究 计算机与网络,():李腾飞,李强,余祥,等

20、 基于拓扑漏洞分析的网络安全态势感知模型 计算机应用,():,万斌,徐明 一种基于 算法的网络安全预测方法 电力信息与通信技术,():冯文静 基于安全态势感知 网络拓扑污染攻击防御系统设计 现代电子技术,():王伟,储泽楠,韩毅,等 基于 的 前后项约束关联规则改进算法 信阳师范学院学报(自然科学版),():张新淼 基于网络运维的大数据分析安全感知策略研究 网络安全技术与应用,():,胡绍勇 基于 的数据泄漏分析 信息安全与通信保密,():丁华东,许华虎,段然,等 基于贝叶斯方法的网络安全态势感知模型 计算机工程,():张小林,罗汉云,董甲东 基于海量异构数据的网络安全态势感知研究 牡丹江师范学院学报(自然科学版),():白雪,努尔布力,王亚东 网络安全态势感知研究现状与发展趋势的图谱分析 计算机科学,():,(上接第 页),:,():李静元,范祥辉,王颖 基于区块链的共享经济隐私保护机制的设计 计算机应用与软件,():黄虹,文康珍,刘璇,等 泛在电力物联网背景下基于联盟区块链的电力交易方法 电力系统保护与控制,():,(),():,:,():

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 学术论文 > 论文指导/设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服