1、 云存放技术规范 ——上海电信互联网部 7月 1、 总则 1.1 编写目标 为了愈加好推进网盘项目招标和工程规范实施,特此编写此技术规范,对系统各个特征和性能要求提出具体要求,起到规范统一作用。 1.2 建设背景和目标 伴随互联网急速发展和非结构化数据爆炸性增加,公众对高效,快速,分布式存放提出了更高要求。中国电信云存放方案基于这个需求被提出来。 1.3 适用范围 中国电信云存放项目 1.4 起草单位 中国电信股份上海分企业互联网部 1.5 解释权 中国电信股份上海分企业互联
2、网部 1.6 术语解释 1.7 参考文件 1.8 设计要求及使用条件 1.3.1 总体设计要求 要求系统布署合理,提供完善网络硬盘服务,提供完善开发接口,提供立即有效售后服务。 1.3.2 使用条件 满足通常条件下使用条件。 2、 技术要求及规范 2.1 平台架构 根据解耦和,多模块见解,要求系统各个模块结构清楚,功效相对独立,便于维护和升级。架构图能够参考以下模型(图3-1): ③ ① ② (图3-1) 图详解: ① 存放业务作为磁盘空间,为中国电信内部自有业务提供存放支撑; ② 存放业务为公众用户(关键是中国电信用户)提供丰富个人存放产品和服务;
3、 ③ 云存放系统必需提供丰富业务接口,以支持开发丰富上层应用。 2.2 组网结构 根据分布式组网需求,并充足使用中国电信CN2骨干网络,要求全国云存放采取分点组网,快速连接。 整个组网结构,请参考以下图(图3-2): (图3-2) 2.3 功效性要求 2.3.1 基础存放服务 云存放管理平台提供基础存放资源池,将多个物理设备上存放资源虚拟为统一存放资源池,供上层使用。 2.3.2 存放管理 设备管理:经过查询域内全部设备磁盘、CPU、内存、电源、风扇、网口等信息。让用户实时了解域内设备运行信息,运行状态,从而能够操控设备;同时立即了解运行有误设备,有必需能够采取合适方
4、法确保其正常运行。 资源管理:用户能够方便了解云存放系统各个节点服务情况,包含MDS主备、 MDS\OSN容量和性能(读IOPS、写IOPS、读流量、写流量)等信息,让用户实时了解域内资源信息,运行状态,从而能够操控这些资源;同时立即了解资源异常,有必需能够采取合适方法确保其正常运行。 2.3.3 策略管理 云存放平台提供灵活存放策略,包含文件副本数量、异地存放、加密存放、压缩存放、同时或异步存放。能够对用户不一样目录设置不一样存放策略。 2.3.4 多租户管理 云存放平台要求能支持对多租户管理,能够为每个租户设定存放空间、存放带宽、存放策略、用户数。租户能够设置管理子租户和孙租户,
5、形成目录树结构。 2.3.5 统计报表 云存放管理平台提供统计报表接口,能够完成用户存放容量、存放数据访问量等数据统计 2.3.6 多线程支持 云存放管理平台提供接口支持多线程及断点续传上传下载文件。 2.3.7 跨数据中心布署 云存放管理平台要求支持跨数据中心布署和管理,并支持跨数据中心用户访问调度、数据迁移、数据异地存放备份等功效。 支持集中管理,云存放管理平台布署在全国中心机房,存放节点能够布署在全国各机房中,管理平台对分点机房存放设备能够统一管理调度。 2.3.8 数据写多份 云存放平台要求能够针对不一样应用或用户可靠性和性能需求,灵活设置文件存放副本数。在满足数据可
6、靠性要求(要求支持同时坏任意两块磁盘数据不丢失)和读写性能要求前提下,尽可能提升存放空间利用效率,降低存放成本。 2.3.9 分级安全服务 ² 传输安全 云存放系统采取HTTPS(Secure Hypertext Transfer Protocol)安全超文本传输协议,是以安全为目标HTTP通道,简单讲是HTTP安全版。Https:URL表明它使用了HTTP,但HTTPS存在不一样于HTTP默认端口及一个加密/身份验证层(在HTTP和TCP之间)。这个系统提供了身份验证和加密通讯方法,现在广泛用于万维网上安全敏感通讯,比如交易支付方面。云存放提供业务接口及管理接口全部基于Https,从而
7、确保数据在传输层安全。 ² 存放安全 云存放系统在数据存放时,依据条带策略,将用户数据依据侧录进行分条,依据条带策略决定每个分条大小,数据分条存放物理位置等。数据全部分条及布局信息是元数据一部分内容,由元数据节点统一管理。即使任何一个磁盘、一个云存放节点被盗或被入侵。全部无法得悉具体数据内容。入侵者无法将零碎数据恢复成完整数据内容。从而确保数据在存放过程中安全。确保数据在存放过程中不被窃取。 支持用户指定目录和文件加密存放。 ² 用户和权限控制 云存放系统对每份数据全部提供丰富访问控制策略策略,对数据全部操作全部会进行权限检验。访问控制策略包含:用户和权限。 2.3.10 内容搜索
8、 支持按关键字搜索文件名和文件内容。 2.3.11 离线下载 关机后也能够雇佣服务器下载,支持HTTP多线程下载。 2.3.12 维护管理 设备管理、系统监控、日志、节点管理、域管理、异地灾备、负载均衡等等基础存放服务 2.3.13 应用接入接口 云存放管理平台提供基于HTTP(SOAP/REST)应用接入接口,包含对用户全部资源操作接口、用户容器、用户数据操作、数据访问控制和权限接口。 云存放管理平台提供资源分配、空间使用、空间回收等管理接口。 2.3.14 资源统计接口 云存放管理平台提供基于用户存放资源使用情况相关接口,满足计费要求。具体包含:用户使用空间统计、用户上
9、传下载数据流量统计、用户上传下载次数统计等。 2.4 扩展性要求 考虑到后期扩容需求,对系统扩展性要求十分关键。关键表现在以下多个方面: (1) 能够实时对容量进行扩充和升级; (2) 支持磁盘热插拔,新增资源能够立即被平台辨识,管理和分配; (3) 最低要求能够同时更换两块坏磁盘,更换上新磁盘自动进行数据填充修复,以保持数据完整性、一致性; (4) 新增磁盘空间要对磁盘总体负载要起到良好均衡作用; (5) 支持新增空间主动和被动数据备份作用。 2.5 容量要求 为了提供优异读取速度,稳定数据存放性能,对云存放系统整体容量和最小容量提出要求,具体以下: (1) 整体支持PB
10、级存放能力,含有快速布署一个PB能力; (2) 最小磁盘支持 1TB(7200rmp); (3) 整个云存放平台最大存放能力要求达成30PB以上; 2.6 性能要求 (1) 云存放平台吞吐能力要求能够伴随存放能力增加而线性增加; (2) 要求能够经过调整云存放平台硬件配置,灵活调整吞吐能力和存放能力比率,以适应业务改变对平台能力要求; (3) 要求支持用户端多线程并发上传下载文件,提供访问速度; (4) 要求支持大文件分片存放在多个存放节点,各存放节点能够完成对各分片并发读写能力,提升大文件访问速度; 2.7 可靠性要求 云存放一旦投入运作,是整年不停电无休系统,需要确保高度
11、可靠性。具体要求以下几点: (1) 整年不下电,不停机,不闪断; (2) 出现故障立即进行告警(声音、灯闪),告警分等级,界面可见,含有具体说明和修复手段提醒; (3) 要求有raid保护机制,在用户数据写单份情况下,要求数据访问可靠性达成99.999%,即对单个存放节点要求: 可访问时长/整年时长 >= 99.999% (4) 要求用户数据可靠性可灵活配置,支持设置用户数据副本数、是否异地存放,向用户提供不一样等级可靠性保护; (5) 要求任意两块磁盘或单个存放节点损坏,不会造成用户数据丢失; (6) 要求任意磁盘或存放节点故障,不影响云存放平台其它设备正常使用和用户访问。
12、2.8 安全性要求 2.3.1 硬件安全性 硬件安全性是指硬件在安装、调试、维护、更新等步骤,对人员和环境是安全,具体表现在以下几点: (1) 产品电位接地,预防触电事故; (2) 尺寸、规格、形状合理,以免倾斜倒伏,碰撞; (3) 产品材质耐温,散热; (4) 明确警示触电、有毒害、或其它危险发生可能; 2.3.2 系统安全性 系统安全性关键表现在: (1) 强有力加密手段和管理策略,确保管理员账户安全性; (2) 采取设置防火墙等手段,预防来自公网破坏; (3) 对于大规模访问量,异常访问等情况进行监控; (4) 强大系统管理能力,提供简练,高效,互动良好GUI界面
13、进行系统配置,这些配置项应该包含(但不局限于)以下部分属性: u 管理,监视,控制硬件资源; u 管理网络资源(IP分配和服务); u 管理每个结点(node)上运行软件; u 配置每个结点服务均衡; u 控制整体行为; u 设置异常或故障告警; u 释放结点或系统资源。 2.3.3 数据安全性 数据安全性,指用户存放数据不可被非法访问、复制、修改等,具体以下: (1) 提供加密接口,对用户数据进行加密; (2) 基于角色数据保护策略: 角色 等级 职责 备注 安全管理员 1 系统初始安装,创建账户,分配/删除系统管理员账户 系统新建时默认管理员,对“系统
14、管理员”进行授权 系统管理员 2 管理整个云存放系统:网段,存放群和节点;更换坏盘和硬件; 对“租户管理员”进行授权 租户管理员 3 在给定空间内进行策略配置,User ID分配等工作; 对“子租户管理员”进行授权 子租户管理员 4 在给定空间内创建用户,重构策略; 无 (3) 策略化数据管理,管理员经过可视化界面,进行策略配置,从而实现诸如: u 创建不一样策略等级(金牌,银牌,铜牌……); u 配置不一样用户对应不一样服务等级,或同一用户不一样数据对象拥有不一样服务等级; u 同时副本和异步副本数目策略配置,副本压缩,选择存放地权限 (4) 采取冗余手
15、段和版本管理,实现数据恢复和灾难备份: 副本种类 定义 属性 备注 同时副本 数据对象一个完全拷贝 每个数据对象全部有最少一个同时副本 同时副本数量,副本间距离,网络连接情况等全部影响响应速度 异步副本 基于某种策略数据备份 “尽最大努力”进行数据恢复 系统自动进行异步副本更新,以保持数据一致 2.9 磁盘利用率 磁盘利用率指磁盘在提供数据冗余备份功效前提下,能提供实际裸存放空间占总空间百分比,该指标反应系统有效利用率,对投入产出比含相关键参考意义。参考现在主流技术指标,要求云存放提供≥65%磁盘利用率。 A:能够被系统管理空间 B:系统自行耗用
16、空间(数据恢复,系统文件等) 要求:A/(A+B) ≥ 65% 要求支持反复数据删除技术,经过删除反复数据,深入提升存放空间利用效率。 2.10 维护和升级保障 伴随未来硬件技术和服务质量提升,考虑到产品有较长生命周期,故在此单独提出对维护和升级保障方面要求: (1) 单个磁盘损坏或故障时需使用新磁盘替换,系统需在4小时之内恢复数据到新替换磁盘; (2) 单个存放节点损坏或故障,需在二十四小时内处理并恢复用户访问 (3) 当存放空间使用率达成一定额度时,需对存放扩容,存放扩容工作从提出到完成上线,需在2个月之内完成。 (4) 工程实施质量、安全,效率有保障; (5) 主动发觉运行中出现隐形问题和风险,立即提出整改方案; (6) 完善资料,包含维护手册,版本升级指导书,方案提议书等。 2.11 环境保护功耗 考虑到低功耗,高节能,以取得最大投入产出比,需要对环境保护功耗做出一定规格要求,具体以下: (1) 产品硬件经过专业环境保护测试认证,标准化制作工艺,材质环境保护无害,使用耗材环境保护无害; (2) 参考主流耗电标准,要求每PB物理存放最大功率不超出30KW; (3) 伴随产品生命周期推进和未来技术发展,对功耗进行连续改善和优化,在未来功耗数据上动态表现该趋势; (4) 每个月给出产品功耗统计表,方便观察。






