融合信誉评估机制的区块链联邦学习平台设计.pdf

资源描述

1、现代计算机Modern Computer第 29 卷第 12 期2023 年 6 月 25 日融合信誉评估机制的区块链联邦学习平台设计魏博众*，廖政，郑开超（广东工业大学自动化学院，广州 510006）摘要：联邦学习存在中心化架构抗风险能力差问题、任务发布者与用户之间的信任问题、珍贵模型数据作为数字资产无法有效保护的问题。提出了一种融合信誉评估机制的区块链联邦学习平台架构设计，该平台以用户、任务发布者、以及验证委员会共同依托于公私链两层区块链搭建。任务发布者将联邦学习任务以智能合约的形式发放到公链网络上，用户通过与智能合约交互的形式参加任务，验证委员会将会对用户进行信誉评估并剔除恶意用户上传

2、的梯度。任务发布者可以设置用户信誉值阈值，在任务开始前剔除大部分恶意用户。智能合约中的记录将作为任务发布者的产权证明，保护全局模型的数字版权。实验结果表明，在存在恶意节点的环境中，该架构下发布的联邦学习任务，其全局模型可以达到更高的精度，对于正常用户和恶意用户有高准确率的判定，并且用户的信誉值将得到客观的评估。关键词：区块链；联邦学习；智能合约；信誉评估文章编号:10071423（2023）12006507DOI:10.3969/j.issn.10071423.2023.12.012收稿日期：20230302修稿日期：20230323作者简介：*通信作者：魏博众（1999），男，河南驻马店人，

3、硕士研究生，研究方向为区块链、联邦学习，Email：；廖政（1997），男，江西吉安人，硕士研究生，研究方向为区块链、区块链跨链、联邦学习；郑开超（1998），男，广西北海人，硕士研究生，研究方向为自动驾驶场景构建、自动驾驶仿真测试0引言人工智能模型往往需要大量的数据进行训练，但随着人们对于数据隐私的重视程度上升，有价值的训练数据被孤立在不同的独立数据库中难以共享。为了解决这个问题，谷歌在2016年提出了联邦学习架构，该架构允许在用户不上传涉及隐私问题的私有数据的情况下，利用用户的私有数据提高人工智能模型的精度1。然而，现有的联邦学习任务仍存在以下问题：中心化架构带来的抗风险能力差的问题，一旦

4、中心服务器被攻击，会存在联邦学习的流程被迫终止和珍贵的模型数据丢失或被篡改的风险2。用户和任务发布者的信任难题，一方面，任务发布者往往需要付出报酬，以激励更多的用户参与到其发布的联邦学习任务中3，但没有信用背书的任务发布者能否如约发放奖励，往往很难得到用户的信任，从而难以将任务参与范围拓展到一个大的范围。恶意用户攻击问题，任务参与范围越大，用户群体就越混杂，恶意用户对联邦学习任务的攻击如随机梯度攻击、便车攻击等往往会导致全局模型难以收敛4。任务发布者付出报酬后得到的珍贵模型数据，无法作为数字资产有效地保护起来。区块链技术已经在许多存在信任问题的、企求跨边界强协作的任务中发挥不可替代的作用5。通

5、过合理的系统架构设计，区块链技术可以解决联邦学习中存在的绝大多数问题。本文提出了一种融合信誉评估机制的区块链联邦学习平台架构，平台依托于公私两条区块链构成。公链的状态不由少数寡头把持，相较于私链更受用户和任务发布者信任，因此我们利用公链上的智能合约技术，奖励发放数据及信誉值的存储，结合星际文件系统（IPFS）进行模型参数存储。并且以智能合约中的记录作为凭据，将模型参数作为数字资产保护起来。由于私链比公链的时序一致性更强，因此在私链进行模型聚合和信誉评估，避免任务发生多次分叉而开发案例 65现代计算机2023年浪费大量的算力。此外，还提出了 Contract-PBFT协议，将 PBFT协议与公链

6、中的智能合约技术结合起来，增强了用户和任务发布者对私链平台的信任，且可以实时对外提供安全可靠的私链状态信息。1融合信誉评估机制的区块链联邦学习平台设计1 1.1 1平台架构设计平台架构设计如图1所示，融合信誉评估机制的区块链联邦学习平台由用户集合U=u1uiuI，任务发布者集合P=p1pjpJ，以及平台所有方构成的验证委员会集合C=c1ckcK共同依托于两层区块链网络和IPFS网络构建，黑色双向箭头代表数据传输通道。pjP可以在公链平台上以智能合约的形式发布联邦学习任务，记平台内进行中的任务集合为Task=Taskjt Task|0 0，Taskjt表示pj发布的第t个任务。uiU可以选择Ta

7、sk中的任一任务参与训练。C负责uiU和pjP的身份管理，执行信誉评估即对其上传的本地模型进行验证，并通过调用公链智能合约进行用户信誉值更新，C内部构成一条私链，通过ContractPBFT协议达成共识，通过元合约实时提供链内最新状态。.验证委员会.公链网络元合约任务合约IPFS私链网络用户集合任务发布者集合图 1融合信誉评估机制的区块链联邦学习平台架构1 1.2 2验证委员会初始化验证委员会初始化为了增强用户和任务发布者对私链平台的信任，且可以实时对外提供安全可靠的主节点IP地址和公链地址，我们提出了 ContractPBFT协议。在平台的初始化时期，C首先应该在公链网络上发布元合约并进行初

8、始化。元合约负责对外提供当前PBFT主节点所在的公网地址，并且向任务合约提供准确的PBFT主节点的公链地址。C中的各节点需要在更换视图的过程中与元合约交互。元合约中应当保存C=c1ckcK中各个节点对应的公链地址和公钥，PBFT网络当前的视图编号（首次发布合约时视图编号为0）、用户的信誉值信息，并应实现表1中的接口函数。表 1元合约接口函数接口函数名称getPrimaryAddresschangeViewaddTaskAddressgetPrimaryIpfinshTask调用方用户/任务发布者/任务合约验证委员会任务发布者用户/任务发布者/任务合约验证委员会getPrimaryAddress

9、负责向调用者提供当前视图下的验证委员会网络主节点公网地址。addTaskAddress负责向正在进行的任务集合中添加新的任务合约地址。getPrimaryIp负责向调用者提供当前视图下的PBFT主节点公网地址。finshTask负责结束当前正在进行的任务，并将任务添加到已完成的任务合约集合。1 1.3 3验证委员会视图变更验证委员会视图变更验证委员会在主节点失效的情况下需要执行视图变更6。由于主节点失效时，客户端最终会将请求发送到所有其他副本节点。每个节点收到客户端请求后，副本节点判断自己是否为主节点，不是的话就会把请求转发给主节点，同时启动一个定时器（假如之前没有启动过的话）。如果请求在定时

10、器时间间隔内执行完，则节点会停止定时器（不过如果此时节点恰好在等待执行另外一个请求，则会重启定时器）；否则，节点会尝试触发视图的变更。ContractPBFT协议更换试图的流程如下：当一个副本节点认定应当更换视图时，其应组装 viewchange消息并广播给全网其他所有副本节点。同时，66魏博众等：融合信誉评估机制的区块链联邦学习平台设计第12期新视图中对应的新的主节点将收集来自其他副本节点的 viewchange 消息。当其收集到 2f 个有效的对应新视图 v+1 的 viewchange 消息后，将组装并广播 newview 消息。每个副本节点收到针对 v+1 视图的 newview 消息

11、后会进行校验，校验通过后，副本节点将更新本地视图编号并调用元合约中的changeView接口，当有2f+1个副本节点调用元合约中的 changeView 接口后，元合约中的视图编号将自增。2基于平台的联邦学习流程2 2.1 1联邦学习流程联邦学习流程融合信誉评估机制的联邦学习框架中的联邦学习流程如图2所示。在TaskjtTask中，首先pj将初始模型Mglb,j,t0发送到IPFS网络上，然后将Taskjt以智能合约的形式发布在公链网络上。任务合约应提供的接口函数见表2。表 2任务合约接口函数接口函数名称stopuploadLocalModelgetAllLocalModelselectLoc

12、alModelupdateClobalModelupdateReputationgetGloablModel调用方任务发布者用户验证委员会验证委员会验证委员会验证委员会用户/任务发布者在Taskjt的第r轮中，uiU可以选择参与到任务中，如果ui选择参与到任务中，那么其需要依据第r-1轮的全局模型训练一个本地模型Gradloc,i,j,tr，然后调用任务合约中的 uploadLocalModel 接口将Gradloc,i,j,tr上传到 IPFS 网络，并将Gradloc,i,j,tr的IPFS地址上传到智能合约中的梯度账本上，并在梯度账本中标注自己对这条梯度的报价bidri,j,t。当智能合

13、约在Taskjt的第r轮中达到前轮的最大等待时间，C中的主节点将调用任务合约中的getAllLocalModel接口，依据任务合约中收集到的本地模型IPFS网络地址，获取本轮通信周期中收集到的所有本地模型。随后主节点对所有本地模型执行信誉评估，然后将执行结果向验证委员会网络广播。执行结果通过验证委员会网络共识之后，C中的主节点将执行调用 updateReputation 接口，更新元合约中的用户信誉信息，根据动态规划算法来在预算允许的范围内选择使模型发布者收益尽可能高的梯度。并调用selectLocalModel，将训练选中的本地模型的用户的公链地址添加到中标凭据集合中。随后C开始模型聚合，模

14、型聚合完成后，C中的主节点将新的全局模型上传到 IPFS 网络中，并调用 updateClobalModel 更新任务合约中的全局模型IPFS地址开启下一轮的迭代。uiU可以凭借中标凭据集合中的凭据在合约中领取奖励，并且可以调用 getGloablModel获得新一轮的全局模型。.验证委员会.公链网络元合约任务合约IPFS私链网络用户集合任务发布者集合1：任务发布者发放初始全局模型到IPFS网络，并发布任务合约到公链网络2：用户获取当前全局模型3：用户训练本地模型，将本地模型上传到IPFS网络，并在公链合约中标价。4：当前通信周期结束，主节点获取本轮通信周期中收集到的所有本地模型。5：主节点发

15、起信誉评估并进行验证共识。6：评估结果通过共识后，主节点更新元合约中用户信誉信息。7：主节点挑选梯度聚合新的全局模型，新的全局模型通过共识后，主节点将其更新到IPFS和公链合约中。图 2联邦学习流程2 2.2 2信誉评估信誉评估信誉评估模型的建立是为了对用户在平台内部参与任务的历史行为进行刻画7，任务发布者可以设定只有信誉值在一定阈值之上的用户才能参与到任务中，以此过滤掉大部分恶意用户。用户的信誉评估模型由直接信誉和间接信誉模型构成。信誉评估由C调用智能合约执行，信誉值保存在公链智能合约中。在Taskjt中，直接信誉取决于ui与pj的历史交互经验，设ei,j,t表示在已经结束的任务Taskjt

16、中C 67现代计算机2023年对ui的评分。如果ui未参与Taskjt，ei,j,t=0。ni,j表示ui参与的，在Task=Taskjt Task|j=j,t 0的任务个数。由此可得ui对pj的直接信誉，如公式（1）所示：ci,j=t=1t-1ei,j,tni,j（1）设置一个标量wri,j,t，当用户ui选择参与Taskjt第r轮迭代，并且其上传梯度被选中参与全局模型聚合时，wri,j,t=1，否则wri,j,t=0。用户ui在Taskjt第r轮迭代中上传的梯度为Gradloc,i,j,tr，全局模型Gradglb,i,j,tr可由公式（2）得出：Gradglb,i,j,tr=i=1Iwr

17、i,j,t()1+ci,j Gradloc,i,j,tri=1Iwri,j,t()1+ci,j（2）C会依据Gradloc,i,j,tr和Gradglb,i,j,tr之间的欧氏距离Dstri,j,t，得出ui在第r轮的得分qi,j,tr，如公式（3）所示：qi,j,tr=1-Dstri,j,t2Stdi,j,wi,j,r=10,wi,j,r=0（3）Taskjt在第r迭代后结束，ui在Taskjt结束的评分如式（4）所示：ei,j,t=r=1rqi,j,tr vrr（4）考虑距离第r轮越近的评分，应该对信誉评估有更大的影响，因此在r轮迭代中，vr可由式（5）得出：vr=1+r1+r（5）间接信

18、誉取决于用户与其他平台的交互经验，ui对pj的间接信誉值如公式（6）所示：qi,j=j=1j-1ci,j+j=j+1Jci,jj=1j-1ni,j+j=j+1Jni,j（6）因此，ui对于pj的信誉值可由公式（7）得出：Ti,j=ci,j+()1-qi,j（7）2 2.3 3模型聚合模型聚合在每一轮中，C会执行信誉评估，对每一个用户上传到合约中的本地梯度进行评分，当到达当前轮的最大等待时间，C当前的主节点需要发起聚合共识，C中的每一个节点需要执行动态规划算法计算出在当前轮预算限制条件下，使任务发布者收益最大的本地梯度集合。本地梯度Gradloc,i,j,tr带给任务发布者的收益Rewardlo

19、c,i,j,tr可由公式（8）得出：Rewardloc,i,j,tr=qi,j,trbidri,j,t（8）在对第r轮中，智能合约收集到的所有梯度计算收益后，C中的每一个节点会将收益保存在效益集合Rewardrall，每个节点需要依据动态规划算法计算在预算允许的情况下，使任务发布者收益最大的节点集合，这个问题可以被式（9）描述：maxi=1Iwri,j,t Rewardloc,i,j,trwri,j,t bidri,j,t Brj,twri,j,t0,1（9）这是一个经典的01背包问题，可以使用动态规划算法解决。Tasktj的第r轮中，所有被选中的本地梯度组合为Gradj,t,rclt，当有一

20、个Gradrclt通过验证委员会验证后，主节点会发起聚合共识，所有的节点计算新的全局模型Mglb,i,j,tr并广播出去，当Mglb,i,j,tr通过验证委员会验证后，主节点会将Mglb,i,j,tr上传到IPFS网络中，并调用updateClobalMode将Gradglb,i,j,tr的IPFS网络地址发布到合约上。3实验与结果分析本文基于WideResNet模型和cifar10实验集对提出的方案进行了验证，实验中参数设置如下：用户数量为 20，共训练 100 个通讯周期。每一轮通信周期中，任务发布者可提供的奖励数量为1000。在20个用户中，我们设置1520号用户为攻击节点，所有用户的具

21、体信息可见表3。68魏博众等：融合信誉评估机制的区块链联邦学习平台设计第12期表 3仿真实验用户信息用户id0102030405060708091011121314151617181920报价3211394110633679822781973923937471475311271用户类型00000000000000212211其中：用户类型为0表示用户为正常节点，用户类型为1或2表示用户为攻击节点。其中类型1用户会捏造数据并随机打乱标签进行训练，类型2用户会将现有数据的标签打乱进行训练。实验设置两个对比聚合方案：在预算允许的情况下，随机挑选梯度聚合，以下称为随机方案；在预算允许的情况下，挑选报价

22、最低的用户进行聚合，以下称为贪婪方案。三种方案的模型精度随通信周期变化的对比结果如图3所示。可以看出，本文提出的方案相比较于贪婪方案和随机方案，全模型收敛精度有明显提升。024、2549、5074、7599轮通信周期下，判断所有用户是否为攻击节点（得分小于0）的准确率如图4所示。可以看出，本文提出的攻击节点检测方案具有高且稳定的准确率。806040200模型精度/%通信周期020406080100本文提出的方案贪婪方案随机方案图 3模型精度随通信周期变化对比100806040200判断准确率/%通信周期0510152025（a）024通信周期253035404550100806040200判断

23、准确率/%（b）2549图 4用户判定准确率示意图 69现代计算机2023年通信周期505560657075100806040200判断准确率/%（c）5074通信周期7580859095100100806040200判断准确率/%（d）7599图 4用户判定准确率示意图（续）全部用户的整体得分随通信周期变化的对比如图5所示，可以看出，随着通信周期增加，类型1和类型2的用户参与此任务将会获得越来越低的负数得分，而类型0的用户将会获得越来越高的正数得分，所有用户都能获得客观的评分。100500-50-100-150-200-250-300用户评分通信周期020406080100类型0类型1类型2

24、图 5节点整体得分随通信周期变化的对比4结语本文提出了一种融合信誉评估机制的区块链联邦学习平台架构，该平台以用户、任务发布者、验证委员会共同依托于公私两层区块链搭建。任务发布者以智能合约的形式将联邦学习任务发布到公链网络上；用户通过与智能合约交互的形式参加任务。验证委员会在各个任务中对参与用户进行评分。任务发布者可以通过用户在平台内参与各任务的历史得分得出用户的信誉值，以此在任务开始前剔除大部分恶意用户。验证委员会在联邦学习每一轮任务结束时，对用户上传的本地梯度进行评分，并且估算其收益，并在任务发布者当前轮的预算限制下，由动态规划算法选择本地梯度进行全局模型聚合，并剔除恶意节点上传的攻击梯度。

25、在任务发布者没有信誉背书的情况下，区块链保证了用户可以相信任务发布者能够如约发放奖励。存在恶意节点的环境中，信誉评估机制可以保护联邦学习任务安全收敛。基于ContractPBFT协议运行的验证委员会，可以实时对外提供安全可靠的主节点IP地址，以增强用户和任务发布者对平台的信任。实验结果表明，在存在恶意节点的环境中，联邦学习任务在该架构下的全局模型可以达到更高的精度，对于正常用户和恶意用户有高准确率的判定，并且用户将会获得客观的任务评分。参考文献：1 KONEN J，MCMAHAN H B，RAMAGE D，etal.Federated optimization：distributed mach

26、ine learningforondeviceintelligence EB/OL.arXiv：1610.02527，2016.2 方晨，郭渊博.面向数据安全共享的联邦学习研究综述 J.信息安全与通信保密，2022（10）：6673.3 ZHANGJ，WUY，PANR.Auctionbasedexpostpaymentincentivemechanismdesignforhorizontal federated learning with reputation and contribution measurement EB/OL.arXiv：2201.02410，2022.4 陈大卫，付安民，

27、周纯毅，等.基于生成式对抗网络 70魏博众等：融合信誉评估机制的区块链联邦学习平台设计第12期的联邦学习后门攻击方案 J.计算机研究与发展，2021，58（11）：23642373.5 KOSBA A，MILLER A，SHI E，et al.Hawk：theblockchainmodelofcryptographyandprivacypreserving smart contractsCProceedings of the2016 IEEE Symposium on Security and Privacy（SP），San Jose，CA，USA，2016.6 ANGELIS S D，ANI

28、ELLO L，BALDONI R，et al.PBFT vs proofofauthority：applying the CAP theorem to permissioned blockchain C Proceedings ofthe Italian Conference on Cybersecurity，Milan，Italy，2017.7 REHMAN M H UR，SALAH K，DAMIANI E，etal.Towards blockchainbased reputationaware federated learning C Proceedings of the IEEE Con

29、ference on Computer Communications Workshops，Toronto，ON，Canada，2020：183188.Design of blockchain federated learning platform integrating reputationevaluation mechanismWei Bozhong*,Liao Zheng,Zheng Kaichao（College of Automation,Guangdong University of Technology,Guangzhou 510006,China）Abstract:Federat

30、ed learning faces problems such as poor resistance to centralized architecture risks,trust issues betweentask issuers and users,and the inability to effectively protect valuable model data as digital assets.An article proposes ablockchainbased federated learning platform architecture design that int

31、egrates a reputation evaluation mechanism.The platformis built on a duallayer blockchain consisting of a public and private chain,and relies on users,task issuers,and a verification committee.Task issuers issue federated learning tasks in the form of smart contracts on the public chain network,and u

32、sers participatein tasks by interacting with smart contracts.The verification committee evaluates user reputation and removes gradients uploadedby malicious users.Task issuers can set user reputation thresholds to eliminate most malicious users before the task starts.Recordsin the smart contract ser

33、ve as proof of ownership for task issuers,protecting the digital copyrights of the global model.Experimentalresults show that in an environment with malicious nodes,the global model of the federated learning tasks issued under this architecture can achieve higher accuracy and can distinguish normal and malicious users with high accuracy,while user reputation is objectively evaluated.Keywords:blockchain;federated learning;smart contract;reputation evaluation 71

展开阅读全文