资源描述
制造业MES产线IoT平台架构
Oracle全数据和云存储方案
甲骨文云技术
微信号 oracledbcloud
功能介绍 甲骨文官方数据库相关技术介绍,分享Oracle 数据库、公有云、混合云服务解决方案和大数据领域最新咨讯、前沿技术、专家视点,专家问答交流以及市场活动,第一时间发布甲骨文官方免费资源。
对于大多数的制造企业来说,在快速发展的同时对大量数据进行访问、分析及管理越来越关键。许多制造企业都在增强制造质量的同时寻找提升缺陷跟踪及对完善供应链的优化能力,从而改善其整体的运营效率。
全数据解决方案可以帮助提高制造及运营效率,同时提供对公司运作的全方位观察,从而引导更好更及时的决策。以全数据为基础的架构可以让企业有能力分析各类数据源以获得更好的洞察。这会开拓企业的分析及预测选项,并会取得更好的成果。
Oracle是企业级解决方案的领导者,在企业纷纷思考大数据如何转换为价值的过程中,Oracle也在结合自己的经验和能力思考,并且总结出了全数据管理解决方案。即对于结构化数据,Oracle建议采用关系型数据库来处理,其技术非常成熟,生态环境也比较完善。而对于非结构化数据,考虑到未来技术的发展和成本等因素,可以考虑基于Hadoop/NoSQL来处理,同时将关系型数据库成熟的经验和技术扩展到新技术平台。全数据管理平台构建模式应该是关系型数据库和Hadoop/NoSQL相结合,在企业级产品方面Oracle推出了Exadata + BDA的一整套全数据解决方案。
Oracle Exadata 数据库云平台采用集成设计,旨在为 Oracle 数据库提供卓越的性能、极好的成本效益和极高的可用性。Exadata 可以运行所有类型的数据库负载,包括联机事务处理 (OLTP)、数据仓库 (DW)、内存中分析以及各种混合负载。
Oracle BDA大数据机是一个灵活、高性能安全的平台,用于在Hadoop、Kafka和NoSQL 系统上运行不同的负载。凭借Oracle Big Data SQL,BDA将Oracle行业领先的SQL实现扩展至Hadoop/ NoSQL和Kafka系统。BDA将Hadoop生态系统的最新技术和强大的Oracle SQL功能整合到一个预先配置的平台上,因而支持快速开发新的大数据应用程序,支持与现有关系型数据紧密集成,这在业界堪称独一无二。
Oracle 存储云服务为您提供了一个通过互联网存储、管理和使用大量非结构化数据的易用的解决方案。您的应用程序可以使用 OpenStack Swift 兼容的 REST API 或 Java API 以编程方式访问 Oracle 存储云服务。您可以使用基于 web 的图形控制台监视关键存储量度并管理用户和角色。
下面以一个真实的案例向您介绍如何通过ORACLE全数据平台 + Cloud存储混合云架构设计,构建一个制造业MES产线IoT平台。
1. 典型案例——某制造业MES产品检测系统大数据需求分析
1.1. 数据源分析
· MES产品检测系统测试数据分为两类:
§ SUMMARY概要数据
§ DETAIL详细数据
o LOGFILE日志文件
o IMAGE测试图片文件
· 数据按RETENTION分类
§ 超热数据:当前生产数据:1天以内
§ 热数据: 1天至1月
§ 温数据: 1月至6月
§ 冷数据: 6月以上至2年
· 具体数据分析如下:
SUMMARY
LOGFILE
IMAGE
定义
测试数据的概要信息
测试日志文件(测试数据的详细信息)
测试图片文件(测试数据的详细信息)
格式
结构化数据
结构化数据
非结构化数据
数据大小(每条)
10KB
50KB
5MB
产生数量/分钟
1000条
10万条
1000条
数据量/分钟
数据量/天
数据量/月
数据量/半年
数据量/年
10 MB
14.4 GB
432 GB
2.592 TB
5.184 TB
5 GB
7.2 TB
216 TB
1.296 PB
2.592 PB
5 GB
7.2 TB
216 TB
1.296 PB
2.592 PB
数据访问性能要求
<= 5秒 (超热数据:1天内)
<= 10分钟 (热数据:1天至1月)
<= 4小时 (温数据: 1月至半年)
<= 24小时 (半年至2年)
数据保留期限
超热数据:当前数据 1天以内
热数据: 1天至1月
温数据: 6月
冷数据: 2年
超出2年则自动删除
存储位置
本地存储
本地存储+公有云
公有云
1.2. 数据采集
测试数据最初是分散分布在各个测试端本地电脑上,后汇总采集存储至 SQL数据库, SUMMARY 与 LOGFILE数据以表的形式存储。IMAGE则以文件的形式存储。
1.3. 数据分析
主要分析测试数据特征值,预测数据趋势
1.4. IoT闭环
大数据分析结果反馈至生产端,形成闭环,最终指导生产,提高生产效率。
例如通过良率分析,发现生产参数,时间,测试指标结果和良率的相关性,通过与MES结合,实时监控生产参数和测试指标,并且做出预测,一旦发现缺陷数量有增加趋势时,可以通知人为介入,避免大量缺陷件的密集产生。
1.5. 大数据分析处理流程图
2. Oracle全数据 + 云存储混合架构方案=> 构建企业级IoT平台
2.1. 超热数据处理阶段
· 不超过一天的超热数据(SUMMARY与 LOGFILE中间表数据)由EXADATA + ORACLE 12c实现快速处理,尤其是大量的JOIN操作。
· Exadata所特有的SMART SCAN、大容量智能缓存等功能,以及Oracle 12C的IN MEMORY列式内存计算、分区等功能可以实现非常高效地处理超热数据。
2.2. 热/温数据处理阶段
· Oracle中的SUMMARY/LOGFILE中间表数据实时同步至BDA大数据一体机平台
§ 文件导入至BDA中的HDFS, 表METADATA存储至HIVE
§ 导入工具为 OGG
· BDA存储半年以内的热/温数据
· 超出半年以外的LOGFILE数据则归档至公有云存储
2.3. 冷数据处理阶段
· BDA大数据一体机中超出半年以外的LOGFILE数据归档至公有云
· IMAGE数据归档至公有云
2.4. BDA方案整体架构图
基于客户需求理解,ORACLE建议如下:
超热数据的处理由Exadata来处理;Summary和Log文件都可以存放于BDA中,由于Summary文件较小,且包含Log文件的访问信息,Summary文件一直存放在BDA中;Log文件冷数据归档窗口保持为6个月。
整体方案架构图如下:
说明:
1 实时同步通过OracleGolden Gate进行实时同步。OGG可以按照配置将更新的记录同步到HDFS中的文件,并且可以指定文件分割的大小。
2 用户可以直接通过ClouderaHadoop平台进行数据访问,例如Impala、Hive等。同时考虑到现有人员技能复用,也可以通过任何一个Oracle 12c实例,通过Oracle Big Data SQL即可沿用Oracle数据库平台上的DBA管理和访问方法。
3 Summary一直保存在BDA中,根据Summary中文件的URI可以定位到公有云中的文件,需要的时候可以将文件从公有云中恢复和下载到本地的BDA中进行查询。IMAGE文件一直归档至公有云。
4 Oracle云中数据湖解决方案可以提供灵活的Hadoop集群云服务,通过Openstack Swift协议或者基于内存的大数据文件协议(BDFS)直接将Oracle存储云上的数据映射成Hive表通过SQL进行查询访问和分析,未来冷数据的批量查询分析可以通过该方式实现,分析结果再返回本地使用,提升云中海量数据综合分析能力,减少海量数据在本地和云中频繁移动。
3. 总结
通过采用全数据平台(Exadata +BDA)与归档云存储的混合架构,再加上GoldenGate 实时的集成技术以及Big Data SQL、Big Data Connect、R等一系列大数据技术,可分别快速有效地处理大数据处理的不同阶段、不同类型数据。该架构具体优势体现如下:
· 全数据平台
Exadata与BDA构成的全数据平台可支持各种结构化及非结构数据,支持SQL、NOSQL、HIVE、HDFS等各类数据平台。
· 性能最优
Exadata与BDA均为软硬高度优化的一体化设备。
· 统一SQL访问
Oracle Big Data SQL提供了跨Hadoop集群/NoSQL数据库/Oracle数据库统一访问数据的能力。
· 极具优惠价格的存储云
以Archive Storage为例:每月每GB容量价格为$0.0026,每月前10TB免费的下载优惠,相对于AWS、阿里等都极具吸引力。
11
展开阅读全文