ImageVerifierCode 换一换
格式:PDF , 页数:10 ,大小:5.19MB ,
资源ID:3134850      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/3134850.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
声明  |  会员权益     获赠5币     写作写作

1、填表:    下载求助     索取发票    退款申请
2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
7、本文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

注意事项

本文(科学数据“东数西算”组织机制与传输模式研究.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

科学数据“东数西算”组织机制与传输模式研究.pdf

1、数据与计算发展前沿,2 0 2 3,5(5)第5 卷第5 期2 0 2 3年10 月Vol.5No.5Oct.2023专刊:数据要素安全高效流通的关键技术Special Issue:Key Technologies for Safe and Efficient Circulation of Data ElementsChengdu,Sichuan 610299,ChinaISSN 2096-742XCN 10-1649/TPdoiePIcoPersistent IdentifiersforeResearch文献CSTR:32002.14.jfdc.CN10-1649/TP.2023.05.00

2、2文献DOI:10.11871/jfdc.issn.2096-742X.2023.05.002页码:13-2 2获取全文科学数据“东数西算”组织机制与传输模式研究方肖,胡正银,韩锐,郑亮31.中国科学院成都文献情报中心,四川成都6 10 2 9 92.中国科学院声学研究所,北京10 0 19 03.国家超级计算成都中心,四川成都6 10 2 9 9摘要:【目的 科学数据东数西算”是“东数西算”工程的重要组成部分,其顺利实施需要众多机构协同合作。研究其组织机制与传输模式,凝练出科学的技术方案,归纳典型的示范案例,对促进科学数据“东数西算”具有重要意义。【方法】本文首先从组织机制的角度分析了科学数

3、据处理的3种模式,然后探讨了科研联盟模式下基于联盟链理论的科学数据传输模型构建,最后结合基于科研联盟模式与科学数据传输模型开展的科学数据“东数西算”具体实践,总结开展科学数据“东数西算”的相关经验。【结果】科研联盟模式可以整合现有资源促进科学数据流通,可溯源的数据传输模型使各机构在确认权责利益时有据可循。【结论 建立科学的组织机制与传输模式能够减少科学数据“东数西算 过程中的资源投入,提高数据传输效率,促进科学数据安全流通与高效利用。关键词:科学数据;东数西算;联盟链;中国科技云成渝枢纽A Study on the Organizational Mechanism and Transmissi

4、onMode of Scientific Data under“East-WestComputing Resource TransferFANG Xiao,HU Zhengyin,HAN Rui,ZHENG Liang1.Chengdu Library and Information Center,Chinese Academy of Sciences,2.Institute of Acoustics,Chinese Academy of Sciences,Beijing 100190,China3.National Supercomputing Center in Chengdu,Cheng

5、du,Sichuan 610299,ChinaAbstract:Objective Scientific data is an important component of the strategic project that channelscomputing resources from the East to the West,and its smooth implementation requires the col-laborative cooperation of numerous institutions.Studying its organizational mechanism

6、 andtransmission mode,refining scientific technical solutions,and summarizing typical demonstra-tion cases are of great significance for promoting the“East-West Computing Resource Trans-基金项目:中国科学院战略性先导科技专项(C类)项目“SEANet网络系统研发、验证评估与示范应用”课题九“基于SEANet的新型传输技术验证与应用示范”(XDC02071000)*通信作者:胡正银(E-mail:)13数据与计算

7、发展前沿,2 0 2 3,5(5)方肖等:科学数据“东数西算”组织机制与传输模式研究fer related with scientific data.Methods We first analyze three modes of scientific data processing from theperspective of organizational mechanisms and then explore the construction of scientific data transmission mod-els based on alliance chain theory unde

8、r the research alliance mode.Finally,combined with the specific practiceof scientific data transfer based on the research alliance mode and scientific data transmission model,we summa-rized the relevant experience of carrying out scientific data transfer under the circumstance of“East-West Com-putin

9、g resource transfer.Results The research alliance model can integrate existing resources and promote theflow of scientific data.A traceable data transmission model can enable different institutions to have evidence tofollow when confirming their rights,responsibilities,and interests.Conclusions Esta

10、blishing a scientific organi-zational mechanism and transmission mode can reduce resource investment for processing scientific data with“East-West Computing Resource Transfer,improve data transmission efficiency,and promote the safe circula-tion and efficient utilization of scientific data.Keywords:

11、scientific data;East-West computing resource transfer;alliance chain;China Science and Technology CloudChengdu-Chongqing hub引言“东数西算”是国家重大发展战略,科学数据作为“数据”的重要组成部分,已成为国家科技创新发展和经济社会发展的重要基础性战略资源,科学研究也已步人数据密集型的“第四范式”时代。现阶段科学数据存储主要集中于东部地区 3,而东部地区资源紧张不能满足科学数据研究分析所需的海量算力、电力资源。科学数据“东数西算”具备较大的经济价值和推动西部地区产业发展的能力

12、,因此有必要对该过程的组织机制和传输模式进行研究,助力国家“东数西算”重大战略。1科学数据“东数西算”组织机制当前,国家“东数西算”工程重点关注布局在政务、金融、交通、企业、医疗、教育等能够快速转化数字经济价值的领域 4。科学数据“东数西算”在相关研究领域具有经济价值与迫切性,能够为科研机构节省大量科研经费,但科学数据偏向于基础研究,直接转化经济价值较低,拉动地方GDP的效果远低于其他数字经济领域。因此,地方政府会根据科学项目的影响力给予较多的政策支持,但直接资源投人相对较少。从组织机制的角度对科学数据的处理大致可以分为以下3种模式。1.1单机构模式单机构模式是指独立的研究机构依托国家财政支持

13、或自筹经费等形式,开展科学数据的生产、传输、处理。一些大型的基础科学项目、大科学装置例如5 0 0 m口径球面射电望远镜(FAST)5、锦屏地下实验室0 等多采用该模式。单机构模式的优点在于研究机构自建实验探测装置用于科学数据的生成,自建私有数据存储设施进行科学数据的存储和计算,科学数据自产、自存、自用,安全可控,效率高。但也存在一些问题,例如:(1)自建数据存储设施需要投人大量建设资源,消耗研究经费;(2)科学数据每年持续增长,自建的数据存储设施难以进行配套升级;(3)自建数据存储设施选址需考虑政策、安全、地理等多方面因素,如离实验装置所在地较远还需要投人数据传输资源;(4)需要配备专门的运

14、维团队,相关专业人才需要的培养周期较长;(5)每年需要消耗相应的运维经费,所依托的实验项目结题后,后续运维经费来源存在问题;(6)自建数据存储设施所服务的实验项目结题后,相关计算、存储资源难以转化再利用。从科学数据自主安全可控的角度出发,研究机构大多倾向于单机构模式,但该模式的局限性会制约大科学装置、大型基础科研项目的研究与发展。1.2公共科学数据中心模式公共科学数据中心模式是指汇集大量计算、14数据与计算发展前沿,2 0 2 3,5(5)方肖等:科学数据“东数西算”组织机制与传输模式研究存储、网络资源形成实体机构为科研用户提供一站式科学数据处理服务,通过集中存储计算、统一管理,高效利用软硬件

15、资源,避免资源闲置和数据孤岛。目前,我国已建成了包括国家地震科学数据中心、国家人口健康科学数据中心等2 0个国家级科学数据中心7,但这些数据中心多集中于我国东部。建立公共科学数据中心是科学数据共享、多学科融合发展的趋势 8 ,但也存在一些问题,例如:(1)资源投入巨大,如表1所示前期投入保守估计达数亿级别;(2)目前科学数据中心主要依托科学数据提供机构建立,研究机构将科学数据存入公共数据中心的意愿不高;(3)缺乏盈利模式,难以维系每年海量的运维费用。鉴于公共科学数据中心模式存在的问题,大多数地方政府对建立公共科学数据中心持慎重态度,希望充分整合利用现有资源,形成具体的Table 1 Inves

16、tment estimation for public scientific data centers名称建设用地购置费大楼建设费用标准化机房装修费用信息化硬件设备信息化网络、软件费用投人总计Table 2The roles and demands played by various institutions under“East-West Computing Resource Transfer角色名称科学数据所有者产生科学数据的机构,具备-定计算和存储能力科学数据传输者具备网络传输资源,以及将各方聚合起来的枢纽能力科学数据处理者具备闲置的计算资源或本身就是提供存储服务的运营商科学数据存储者具

17、备闲置的存储资源或本身就是提供存储服务的运营商科学数据使用者具备科学数据使用需求的机构或科研用户科研服务示范之后再逐步推动数据中心的实体建设。1.3科研联盟模式在科学数据“东数西算”过程中,可以通过众多机构利用各自现有的资源来完成科学数据的“东数西算”,各机构之间形成类似联盟的组织。如表2 所示,在这个过程中各机构扮演的角色大体可以分为五类,并且各角色的诉求也各不相同。科学数据使用者对科学数据以及相关计算资源服务的需求是促进科学数据在不同机构间流通的重要因素,科学数据的所有者在同意使用者的需求申请后通过传输者将数据传递给科学数据的处理者,处理者将数据进行计算之后将结果返回,存储者在这一过程中提

18、供协助。通过这一过程既利用了西部地区的资源优势,相对低成表1公共科学数据中心投入估算内容10亩8000平米(机房面积6 0 0 0 平米,辅助用房2 0 0 0 平米)按A级数据中心标准装修机房,共计6 0 0 0 平米数据存储设备(10 0 PB)高性能计算设备(5 万CPU核,10 Pflops)超高速网络环境(2 0 0 Gbps)资源调度和管理系统(统一资源调度、任务管理、使用计费、数据融合、SDN网络管理和网络安全)表2 科学数据“东数西算”中各机构扮演角色及诉求角色简况估算总价(单位:万元)8008,0002,0006,0005,0002,0001,00024,800角色诉求希望整

19、合各方资源进行科学数据“东数西算”,降低科研经费消耗,尤其关注科学数据的保密性和安全性提供网络服务产生经济收益参与国家重大科研任务获得影响力提供计算服务产生经济收益参与国家重大科研任务获得影响力提供储存服务产生经济收益参与国家重大科研任务获得影响力希望获得科学数据使用权限,以及相关计算资源服务15数据与计算发展前沿,2 0 2 35(5)方肖等:科学数据“东数西算”组织机制与传输模式研究本地完成了科学数据的计算需求,又为参与的各机构带来了经济收益盘活闲置资源,以较低的投人带动地方产业发展。科研联盟模式充分整合利用现有资源、前期投入较少、形成示范之后更容易逐步推动项目的升级和发展。相较而言,该模

20、式在科学数据“东数西算”过程中最具经济性和可实施性,当联盟成员较少时机构之间容易协调,但随着联盟成员的不断增多,需要研究构建一种传输模型保证科学数据流通过程清晰明确、可记录、可回溯,才能在界定各方的权责利益时有所依据,保证科学数据的安全可信,形成科学数据“东数西算”的顺畅链条。2科研联盟模式下的科学数据传输模型科研联盟的模式可以有效整合利用现有资源,实现闲置资源的再利用,在不增加大量投人的情况下,完成科学数据的“东数西算”。但是这个过程涉及很多不同的组织机构,需要建立信任机制,使科学数据流动的整个过程有迹可循,确保科学数据安全和权责清晰。本文基于联盟链的相关理论,结合科研联盟模式下科学数据“东

21、数西算”的具体应用场景,构建基于科研联盟的科学数据传输模型,以期促进科学数据安全流通与高效利用。2.1联盟链在科研联盟场景下的适用性分析区块链是一种计算机技术的新型应用模式,可以做到点对点传输、分布式数据存储、共识机制、加密算法等。其本质是基于互联网的一种新型的信息传输方式,即可以实现多个信息化系统间的广播式数据交互的技术。区块链技术的主要优势是分布式和去中心化,信息的不可篡改,基于共识机制的信息传输和共享,从而实现在各类型场景下均能确保信息安全的目的 0 。区块链大体上可以分为3类,公有链、私有链和联盟链。公有链各个节点可以自由地加人和退出网络,并参加链上数据的读写,读写时以扁平的拓扑结构互

22、联互通,网络中不存在任何中心化的服务端节点;联盟链各个节点一般会有与之对应的实体机构组织,必须通过授权后才能加入或退出网络,各机构组织组成利益相关的联盟,共同维护区块链的健康运转;而私有链的各节点写人权限则收归内部控制,而读取权限可根据实际需求选择性地对外开放。对于科研联盟这种由不同实体机构组成,且科学数据规模有限的情况,采取联盟链的方式进行科学数据传输模型构建是一种合适的选择。联盟链是一种部分去中心化的、参与节点事先确定好的区块链,其特点介于公有链和私有链之间,信息数据访问只在其内部,交易确认速度较快,其信息数据保有一定程度的隐私性2 。当前联盟链已经在金融领域、生命健康领域等多个领域有着广

23、泛的应用,根据联盟成员的权限和数据范围对上链信息数据进行监管,保证权责清晰和数据安全。当前比较流行的联盟链项目主要有:区块链服务网络BSN、企业以太坊联盟(EEA)、超级账本(Hyperledger)、中国分布式总账基础协议联盟(ChinaLedger)、R 3区块链联盟等 13。Yang等 11构建了联盟链的Hyperledger Fab-ric系统,如图1所示,该系统的逻辑架构主要分为成员管理、共识机制、智能合约三部分。成员管理可以对科研联盟内部成员的身份、权限进行管理确认,分配相应的登录方式和属性证书。共识机制在科研联盟的应用场景下可以采用BFT-DPoS共识机制进行轮流记账15 ,由联

24、盟的成员机构节点周期性地投票选举出受信任的数个超级节点,由超级节点轮流或者随机进行记账产生区块。同时,这些超级节点也将对产生的新区块进行投票,只有当通过的票数超过阈值才会达成共识。智能合约是一种特殊类型的程序,是情景对应型的计算机程序或事务协议,能够对交互数据开展接受、处理、存储、发送等操作,实现科研联盟内部数据灵活的管理与控制。智能合约需要自动化的数据、过程、系统的组合与相互协调,将科研联盟内部的协议、合约代码化嵌人计算机程序,具有自动化执行、去中心化、不可篡改性、无需信任和高效性等特征,能够部16数据与计算发展前沿,2 0 2 3,5(5)方肖等:科学数据“东数西算”组织机制与传输模式研究

25、应用接口身份管理分类账管理成员管理共识机制注册和登录注册和登录属性证书属性证书安全及密码服务分布式账本技术图1联盟链HyperledgerFabric系统逻辑架构Fig.1 Logical architecture of the Hyperledger Fabric system in the alliance chain署在数据区块、交互环节、有形或无形资产中,实现基于软件定义的可编程控制系统。在科研联盟的模式下,需要科学数据可以在不同机构之间根据预先设置的规则快捷地进行传输,数据的流通传递过程需要被记录下来,并且相关的记录数据要保证真实性和完整性,从而为界定各机构权责利益提供依据。同时,科

26、学数据的安全性至关重要,要保证数据提供者对数据的所有权以及数据不被随意篡改和泄露。联盟链技术将记录科学数据流通过程的信息数据按照一定顺序进行存储排列,可以清楚获取信息数据的源头以及科学数据的流通过程记录。信息数据以哈希值的方式存储于区块链上,具有不可逆性,可以保证上链的信息数据无法被随意篡改。通过该机制对数据流通的过程信息进行记录,使科研联盟模式下的科学数据流动具备溯源能力。联盟链具有非对称性加密算法、多通道隔离账本以及智能合约等技术,可以保证存储的信息数据不被篡改,科学数据传输是在联盟成员之间,减少了数据泄露和恶意篡改风险。因此,联盟链的相关技术特征十分切合科研联盟模式下的数据传输需求 7

27、。2.2基于联盟链的数据传输模型构建如图2 所示,HAN等U8I学者提出了一种基于联盟链的数据共享安全保护模型。在该模型下软件开发工具包事务管理订单服务背书确认不同的数据存储于不同的数据库,并且集中存放于存储层。区块的创建和广播在区块链服务层完成,接口层为各种信息交换提供接口的连接层。智能合约层为用户提供各种类型的合约服务,包括合约日志记录、数据记录等。应用层为用户成员提供各种服务,实现用户对数据的传输和共享。该模型为提高数据安全水平,进行了层级功能细分,构建出了通用数据传输模型的清晰整体架构,并着重解释了区块链的创建,利用多节点投票机制加强了区块链的抗风险能力。在科研联盟的应用场景下,涉及科

28、学数据的提供方式、按规则传输机制、数据获取索引上链、科学数据本体另行存储等特征,通用的科学数据共享模型并不完全适用。因此,本文结合通用科学数据共享模型与科研联盟应用场景下的具体特征,构建了科研联盟模式下基于联盟链的科学数据传输模型,以便科学数据在联盟内部能快速流通并且保证数据流通过程有迹可循。如图3所示,该模型主要分为4层,其中数据提供层描述了科研联盟中科学数据的来源,多是大科学装置、实验探测器等。科学数据的原始数据量庞大,无法上链进行存储,通常采用分布式本地存储方式,同时将数据的获取信息进行上链存储。数据处理者在联盟链内得到数据获取信息之后还需要数据提供者提供外部权限,才能最终访问到科学数据

29、,通过多层监控机制保证了数17交易业务智能合约智能合约服务安全执行环境安全镜象文件储存库数据与计算发展前沿,2 0 2 35(5)方肖等:科学数据“东数西算”组织机制与传输模式研究应用层授权中心访问控制系统文件索引系统资源共享平台业务流程智能合约智能合约层上传文件查询文件修改文件删除文件记录链接口层查询同步状态认证索引服务一致性管理区块链服务层创建并发送区块存储丢失的区块区块链数据库存储层记录链数据库)日志链数据库图2 基于联盟链的数据共享安全保护模型Fig.2 Data sharing security protection model based on alliance chain部署智能

30、合约智能合约服务投票接受交易记录链同步状态认证索引服务成员管理投票注册同步管理接收丢失的区块文件数据库执行智能合约创建日志查询日志日志链公私钥同步发送区块广播日志链认证本地区块长度广播属性数据库索引数据库管理据的安全。该层补充了通用模型中对科学数据来源部分的不清晰,以此体现原始科学数据的合理性、完整性和真实性。存储层通过云存储等网络存储形式以及加密存储等技术,对科学数据获取信息和联盟链信息进行存储。联盟链数据库分为协议合约数据库、科学数据获取路径数据库、联盟成员数据库、链上数据库,对不同的数据进行分类存储。其中的科学数据获取路径数据库保存了数据的获取信息,在通用模型的基础上进一步对获取路径进行

31、了设置,保证了数据的隐私性,为数据溯源和隐秘传输提供了支持。数据处理层基于联盟链理论构建,主要包括成员管理、共识机制、智能合约3部分,科研联盟中的机构成员通过联盟授权认证之后才能拥有区块链网络中信息的访问权限,可以凭借联盟成员的身份对联盟链的数据进行新增、使用、更新、维护。共识机制采用BFT-DPoS共识机制进行轮流记账,周期性地投票选举超级节点,由超级节点轮流或者随机进行记账产生区块。科研联盟内部机构之间的协议合约,通过程序化形成智能合约。智能合约是具体的计算程序,在数据流通过程中只有满足合约条件才会执行其中的代码,实现数据的流通、交互、获取等请求。应用层则是为联盟成员机构提供管理科学数据的

32、相关功能,包括了科学数据确权、科学数据溯源、科学数据获取、科学数据安全几个方面。机构成员可以通过以上功能对数据进行获取和处理,整个过程都会被记录下来,避免了数据被恶意篡改和滥用的风险,使数据的安全得到保证。2.3基于科研联盟模式的数据传输模型讨论成立科研联盟是希望整合各机构分散的资18数据与计算发展前沿,2 0 2 3,5(5)方肖等:科学数据“东数西算”组织机制与传输模式研究科学数据溯源科学数据确权应用层科学数据传输应用接口服务科学数据安全创世区块数据处理层联盟成员管理智能合约区块二Fabrie联盟链分布式记账系统BFT-DPoS共识机制区块三区块四多通道账本隔离联盟链数据库联盟用户数据库合

33、约数据库数据存储层链上数据库原始科学数据分布式存储私有数据中心存储存储路径数据库公共数据中心存储云端存储专用数据传输网络研究机构计算机模拟科学数据来源大科学装置实验探测器数据提供层科研组织科学数据提供者图3科研联盟模式下科学数据传输模型Fig.3 Scientific data transmission model under the mode of scientific research alliance源,共同实现科学数据的“东数西算”。当参与协作的机构较少时,可以通过互签协议等方式明确权责利益。但当参与机构数量众多时容易产生混乱,需要使科学数据的流动有迹可循,以避免不必要的纠纷。为描述科

34、学数据“东数西算”过程中原始科学数据的来源、存储方式以及记录科学数据在不同机构间流动的信息,构建了基于联盟链技术的科学数据传输模型。在这一模型中,科学数据的提供者、使用者、传输者、处理者均需要进行注册登记,基于智能合约进行必要的身份验证。每位机构成员都会获得注册证书和公私密钥,用于验证其在联盟链中的身份和访问权限。数据的提供者还会额外获取数据所有权密钥,用于数据确权。通过严格的成员身份认证,加强数据流通过程的安全性。由于科学数据体量庞大,难以进行上链存储,数据的提供者只需基于智能合约的标准将数据的获取信息上传至联盟链中进行存储。数据的使用者、传输者、处理者在与提供者协商一致后,可以通过联盟链进

35、行数据访问请求,该请求会被据实记录至联盟链中并启动广播。在数据请求广播之后,会对联盟链中的数据信息进行检索,找到相应的科学数据获取信息,并在广播之后将该信息发送给对应的数据申请者。整个过程都将被联盟链记录且不可篡改,这就使数据在各机构之间流通的过程清晰明确,为各机构间的权责界定提供了依据。数据申请者在访问科学数据时还需要科学数据提供者外部审核批准才能获取到数据,并且科学数据仅是经传输者提供的网络路径传输至处理者进行处理,处理结果再返回数据申请者。这一过程中,数据是以流的形式进行流通、处理、19数据与计算发展前沿,2 0 2 35(5)方肖等:科学数据“东数西算”组织机制与传输模式研究返回,杜绝

36、了大量实体数据拷贝外泄,进一步加强了数据的安全性。基于科研联盟模式的科学数据传输模型主要描述了科学数据的来源、存储以及如何记录数据流通信息。通过联盟链的相关技术对联盟内机构进行成员管理,记录不同机构之间数据申请、传输、使用的相关信息,以确保数据流通有迹可循,避免机构众多时产生纠纷。科学数据的实体传输在机构间达成一致且被联盟链记录流通信息后,由数据传输者通过实体网络及相关传输技术完成。3科研联盟模式下的示范案例基于理论研究,联合中国科技云成渝枢纽、中国科学院声学研究所、上海科技大学、国家超级计算成都中心,合作开展科学数据“东数西算”示范验证。并通过签署“合作协议”利用联盟链记录等方式,确保协作过

37、程权责利益清晰,数据流通有迹可循。中国科技云成渝枢纽作为中国科技云 19 “十四五”规划“四大枢纽”之一,是一项立足中国科学院,面向成都科学城,辐射成渝双城经济圈重要科研机构与大科学装置的战略性、基础性新型国家级科研信息化基础设施枢纽节点。在示范验证中作为数据传输者为科学数据传输提供节点中转和网络环境支持。中国科技云成渝枢纽SEANet20网络技术是中国科学院声学研究所主导研发的一种新型网络传输协议用来替代传统TCP/IP协议。它通过“一包一路由”的数据传输方式,使外部窃取监听数据流更加困难,最多只能截取到数据包片段,难以获取完整的数据信息,提高了数据传输的安全性。同时基于“一包一路由”,在数

38、据传输过程中可以选择最通畅的网络路径以及多网络路径传输,实现数据传输加速。在示范验证中声学所作为数据传输者为科学数据传输提供网络环境和安全传输技术加持。上海科技大学硬X射线自由电子激光装置 2 1作为科学数据提供者,在示范验证中提供大量相干衍射成像数据。国家超级计算成都中心,是西部地区首个国家超算中心,算力峰值性能30 0 PFlops,具备丰富算力资源和西部地区能耗优势,在示范验证中作为科学数据处理者。如图4所示,上海的科学数据通过网络经中国科技云成渝枢纽传输到国家超算成都中心进行运算。针对上海科技大学到国家超级计算成都中心的远距离、高通量数据传输需求,充分利用中国科技云成渝枢纽节点的功能,

39、发挥SE-ANet网络技术智能多路径传输优势,通过动态多路径优化保证数据传输始终处于最优网络路径,使硬X射线自由电子激光装置相干衍射成像数据日均TB级海量图像数据在广域网上稳定高效传输。如图5 所示,基于SEANet技术的传输网络路由节点上海硬X射线自由电子激光装置科学数据国家超算成都中心数据流经最优路径传输数据处理结果返回图4科学数据“东数西算”示范案例Fig.4 Demonstration case of scientific data“East-West Computing Resource Transfer20数据与计算发展前沿,2 0 2 3,5(5)方肖等:科学数据“东数西算”组织

40、机制与传输模式研究1,000传统900多路径(2 路)800多路径(4路)(sdaW)本7006005004003002001000图5 基于SEANet技术的传输速率比较Fig.5Comparisonof transmissionratesbasedon SEANet网络与传统网络进行了性能测试对比,在相同出入口带宽情况下,在UDP协议5 12 B数据包模式下,传统网络速率仅为9 0 Mbps,而采用SEANet独有的多路径传输后2 条路径可达到2 5 0 Mbps的传输速率,采用4路径可达到6 0 0 Mbps的速率;在UDP协议1,2 5 0 B数据包模式下传统网络速率仅为10 0 Mb

41、ps,而采用多路径传输后2 条路径可达到30 0 Mbps的传输速率,采用4路径可达到9 0 0 Mbps的速率。由此可见基于SEANet的传输网络传输性能优于传统网络。整个数据传输过程,充分整合利用现有的网络、计算、存储资源,在相对较少的投人下完成科学数据“东数西算”示范验证,为后续大规模科学数据“东数西算”,充分利用西部地区资源优势,带动西部地区产业发展做出了预研与示范。4结论与展望科学数据“东数西算”具备经济价值和推动西部地区产业发展的能力,通过众多机构整合利用现有资源共同完成科学数据“东数西算”的科研联盟模式最具经济性和可行性。基于联盟链理论构建的科学数据传输模型使得科学数据在各机构间

42、的流通过程清晰明确、可回溯、不可篡改,为机构间权责利益的明确提供了可靠的依据,能够提高不同机构参与科学数据流动的积极性。建立科学的组织机制与传输模式能够减少科学数据“东数西算”过程中的资源投入,提高数据传输效率,促进科学数据安全流通与高效900利用。当前理论模型的研究还不够深人,科学数据600“东数西算”示范验证也仅仅是在少数机构间完成,未来需要进一步优化理论模型,联合更多机30025090UDP512B构进行大规模科学数据“东数西算”,充分利用西100部地区资源优势,带动西部地区产业发展。UDP 1,250B利益冲突声明所有作者声明不存在利益冲突关系。参考文献1栗蔚,王雨萌,立言,等.“东数

43、西算”背景下算力服务对算力经济发展影响分析 J.数据与计算发展前沿,2 0 2 2,4(6):13-19.2 刘艳红,罗健.数据密集型科学环境下的情报服务与发展 .图书与情报,2 0 13(6):10 5-10 8.3黄铭瑞,李国庆,李静,等.国家科学数据中心管理模式的国际对比研究 J.农业大数据学报,2 0 19,1(4):14-29.4】李俊杰,姬浩浩.“东数西算 驱动西部地区经济增长的内在机理与对策 .中州学刊,2 0 2 2(9):2 3-30.5宁佳彦.中国天眼的数据是如何存储的 N.第一财经日报,2 0 2 1-10-2 0(A04).6邓晖.中国锦屏地下实验室:捕捉最“弱”的光

44、N.光明日报,2 0 2 2-0 4-12(0 0 1).7储节旺,杨婷婷.长三角跨区域科学数据中心建设研究 J.数字图书馆论坛,2 0 2 2(6):5 8-6 4.8石蕾,高孟绪,徐波,等.欧美建设发展科学数据中心的经验及对我国的启示 .中国科技资源导刊,2022,54(3):31-36.9冯云霞,王西贤.基于联盟链的工业物联网用户身份匿名环签名方案 J.中文科技期刊数据库(全文版)工程技术,2 0 2 2(3):32-37.10张新凤.区块链视域下医学图书馆科学数据共享机制研究 J.图书馆工作与研究,2 0 2 2(9):13-18.11 召邵奇峰,金澈清,张召,等.区块链技术:架构及进

45、展.计算机学报,2 0 18,41(5):9 6 9-9 8 8.12崔金栋,王胜文.区块联盟链视角下产学研信息平台框架构建研究 .现代情报,2 0 19,39(8):143-151.21数据与计算发展前沿,2 0 2 35(5)方肖等:科学数据“东数西算组织机制与传输模式研究13刘桂锋,钱锦琳,卢章平.国内外数据治理研究进展:内涵,要素,模型与框架 J.图书情报工作,2017,61(21):137-144.14 YANG Y T,LIN T X,LIU P H,et al.UCBIS:An im-proved consortium blockchain information systemb

46、ased on UBCCSP-ScienceDirectJJ.Blockchain:Re-search and Applications,2022,3(2):64-74.15王显斌.基于区块链的科学数据共享模型研究 .现代信息科技,2 0 19,3(2 1):15 6-15 8.16郝世博,徐文哲,唐正韵.科学数据共享区块链模型及实现机理研究 .情报理论与实践,2 0 18,41(11):57-62.17】陆丽娜,尹居峰,于啸,等.基于联盟链的农业科学数据共享模型构建研究 .图书情报工作,2 0 2 2,6 6(17):60-68.18 HAN D J,CHEN J Y,ZANG G Q,et

47、 al.DSSPS:AData Sharing Security Protection Scheme Based onConsortium Blockchain and Ciphertext-Policy Attri-bute-Based EncryptionC/ICBTA 2019:2019 2ndInternational Conference on Blockchain Technologyand Applications,2019:14-19.19综合科技日报、中国日报等相关报道.中国科技云:一朵为科学家量身打造的“云”J.今日科技,2 0 2 0(1):16-16.20王劲林,程钢,

48、尤佳莉,等.SEANet:一种现场,弹性,自治网络架构及技术 .网络新媒体技术,2 0 2 0,9(6):1-8.21齐争,黄楠顺,邓海啸,等.上海硬X射线自由电子激光装置光源性能参数与稳定性研究 .光学学报,2 0 2 2,42(11):2 0 8-2 15.收稿日期:2 0 2 3年4月19 日方肖,中国科学院成都文献情报中心,特别研究助理,主要研究方向为科学数据管理应用模式。负责论文初稿撰写。FANG Xiao,Special research assistant ofChengdu Library and Information Center,Chinese Academy of Sc

49、iences.His research direction is sci-entific data management application mode.In this paper,he is responsible for writing the first draft ofthe paper.E-mail:胡正银,中国科学院成都文献情报中心,知识系统部主任,中国科学院大学情报学硕士研究生导师,中国科学院西部之光人才培养计划人选,博士,研究馆员,合作出版专著(编著)3部、发表论文8 0 余篇、申请计算机软件著作权8项,主要研究领域为科技大数据分析方法与技术、科技情报知识挖掘与知识发现。负责

50、制定论文框架、论文修改与审定。HU Zhengyin,Director of the Knowledge System Depart-ment at Chengdu Library and Information Center,ChineseAcademy of Sciences.He is also a Masters supervisor inInformation Science at University of Chinese Academy ofSciences and supported under CAS Light of West ChinaProgram.With a Ph.

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服