ImageVerifierCode 换一换
格式:PPTX , 页数:23 ,大小:1.95MB ,
资源ID:10300139      下载积分:10 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10300139.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(大数据技术架构解析.pptx)为本站上传会员【精****】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

大数据技术架构解析.pptx

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/6/19,#,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2019/6/19,#,按一下以編輯母片標題樣式,按一下以編輯母片文字樣式,第二層,第三層,第四層,第五層,2019/6/19,#,第一課:大數據技術架構解析,目錄,一、,大數據建設思路,二、,大數據基本架構,三、,大數據的目標效果,四、課程總結,一、,大數據建設思路,大,數據,數量龐大,格式多樣化,。大量,數據,由家庭、製造工廠和辦公場所的各種設備、互聯網事務交易、社交網路的活動、自動化感測器、移動設備

2、以及科研儀器等生成。,它的爆炸式增長已超出了傳統,IT,基礎架構的處理能力,給企業和社會帶來嚴峻的資料管理問題,。因此必須開發新的資料架構,圍繞“,數據,收集、,數據,管理、,數據,分析、知識形成、智慧行動,”的全過程,開發使用這些資料,,釋放出更多,數據,的隱藏價值,。,1.,數據的獲得,1.,數據的獲得,大,數據,產生的根本原因在於感知式系統的廣泛使用,。隨著技術的發展,人們已經有能力製造極其微小的帶有處理功能的感測器,並開始將這些設備廣泛的佈置於社會的各個角落,通過這些設備來對整個社會的運轉進行監控。這些設備會源源不斷的產生新資料,這種,數據,的產生方式是自動的。因此在,數據,收集方面,

3、要對來自網路包括物聯網、社交網路和機構資訊系統的資料附上時空標誌,去偽存真,盡可能收集異源甚至是異構的,數據,,必要時還可與歷史,數據,對照,多角度驗證,數據,的全面性和可信性。,2.,數據的匯集和存儲,數據,只有不斷流動和充分共用,才有生命力。應在各專用,數據,庫建設的基礎上,通過,數據,集成,實現各級各類資訊系統的,數據,交換和,數據,共用。,數據,存儲要達到低成本、低能耗、高可靠性目標,通常要用到冗餘配置、分佈化和雲計算技術,在存儲時要按照一定規則對,數據,進行分類,通過過濾和去重,減少存儲量,同時加入便於日後檢索的標籤。,3.,數據的管理,大數據管理的技術也層出不窮。在眾多技術中,有

4、6,種數據管理技術普遍被關注,即分散式存儲與計算、記憶體數據庫技術、列式數據庫技術、雲數據庫、非關聯式的數據庫、移動數據庫技術。其中分散式存儲與計算受關注度最高。左圖是一個圖書數據管理系統。,4.,數據的分析,數據,分析處理:有些行業的,數據,涉及上百個參數,其複雜性不僅體現在,數據,樣本本身,更體現在多源異構、多實體和多空間之間的交互動態性,難以用傳統的方法描述與度量,處理的複雜度很大,需要將高維圖像等多媒體資料降維後度量與處理,利用上下文關聯進行語義分析,從大量動態而且可能是模棱兩可的,數據,中綜合資訊,並匯出可理解的內容。,大,數據,的處理類型:,批次處理,-,先存儲後處理,流處理,-

5、直接處理,數據,數據挖掘的任務:,關聯分析,聚類分析,分類,預測,時序模式,偏差分析,5.,大數據的價值:,決策支持系統,DDS,大數據,的神奇之處就是通過對過去和現在的,數據,進行分析,它能夠精確預測未來,;,通過對組織內部的和外部的,數據,整合,它能夠洞察事物之間的相關關係,;,通過對海量數據,的挖掘,它能夠代替人腦,承擔起企業和社會管理的職責。,6.,數據的使用,大數據有三層內涵:,數據量巨大、來源多樣和類型 多樣的數據集,;,新型的數據處理和分析技術,;,運用數據分析形成價值。,大數據對科學研究、經濟建設、社會發展和文化生活等各個領域正在產生革命性的影響。大數據應用的關鍵,也是其必要

6、條件,就在於,IT,與,經營,的融合,當然,這裡的經營的內涵可以非常廣泛,小至一個零售門店的經營,大至一個城市的經營。,二,.,大數據基本架構,基於上述大數據的特徵,通過傳統,IT,技術存儲和處理大數據成本高昂。,一個企業要大力發展大數據應用首先,需要解決兩個問題,:,一是,低成本、快速地對海量、多類別的,數據,進行抽取和存儲,;,二是,使用新的技術對,數據,進行分析和挖掘,為企業創造價值,。因此,大數據的存儲和處理與雲計算技術密不可分,在當前的技術條件下,基於廉價硬體的分散式系統,(,如,Hadoop,等,),被認為是最適合處理大數據的技術平臺。,Hadoop,是一個分散式的基礎架構,能夠讓

7、用戶方便高效地利用運算資源和處理海量數據,目前已在很多大型互聯網企業得到了廣泛應用,如亞馬遜、,Facebook,和,Yahoo,等。其是一個開放式的架構,架構成員也在不斷擴充完善中。,1.Hadoop,體系架構,Thrift,是一個軟體框架,用來進行可擴展且跨語言的服務的開發,最初由,Facebook,開發,是構建在各種程式設計語言間無縫結合的、高效的服務。,Zookeeper,在,Hadoop,架構中負責應用程式的協調工作,以保持,Hadoop,集群內的同步工作。,Sqoop,是為資料的互通性而設計,可以從關聯式資料庫導入資料到,Hadoop,,並能直接導入到,HDFS,或,Hive,。,

8、Hive,是,Hadoop,架構中的,數據,倉庫,主要用於靜態的結構以及需要經常分析的工作。,Hbase,主要作為面向列的,數據,庫運行在,HDFS,上,可存儲,PB,級的數據。,Hbase,利用,MapReduce,來處理內部的海量,數據,,並能在海量,數據,中定位所需的,數據,且訪問它。,Hadoop,的核心是,MapReduce,(,映射和化簡編程模型,),引擎,,Map,意為將單個任務分解為多個,而,Reduce,則意為將分解後的多工結果匯總,該引擎由,JobTrackers(,工作追蹤,對應命名節點,),和,TaskTrackers(,任務追蹤,對應資料節點,),組成。當處理大資料查

9、詢時,,MapReduce,會將任務分解在多個節點處理,從而提高了資料處理的效率,避免了單機性能瓶頸限制。,Hadoop,最底層是一個,HDFS,(Hadoop Distributed File System,,分散式檔案系統,),,存儲在,HDFS,中的檔先被分成塊,然後再將這些塊複製到多個主機中,(DataNode,,資料節點,),。,Hbase,是一個列式數據庫,存儲列式數據,2.Hadoop,核心設計,3.Hbase,分散式數據存儲系統,3.Hbase,分散式數據存儲系統,Client,:,使用,HBase RPC,機制與,HMaster,和,HRegionServer,進行通信,Zo

10、okeeper,:,協同服務管理,,HMaster,通過,Zookeepe,可以隨時感知各個,HRegionServer,的健康狀況,HMaster:,管理用戶對表的增刪改查操作,HRegionServer,:,HBase,中最核心的模組,主要負責回應使用者,I/O,請求,向,HDFS,檔案系統中讀寫數據,HRegion,:Hbase,中分散式存儲的最小單元,可以理解成一個,Table,HStore,:,HBase,存儲的核心。由,MemStore,和,StoreFile,組成。,HLog,:每次用戶操作寫入,Memstore,的同時,也會寫一份資料到,HLog,文件,4.,大,數據,平臺系統

11、功能建議,5.,大數據平臺系統功能說明,應用系統,對於大多數企業而言,運營領域的應用是大數據最核心的應用,之前企業主要使用來自生產經營中的各種報表數據,但隨著大數據時代的到來,來自於互聯網、物聯網、各種感測器的海量數據撲面而至。於是,一些企業開始挖掘和利用這些數據,來推動運營效率的提升。,數據平臺,借助大數據平臺,未來的互聯網路將可以讓商家更瞭解消費者的使用習慣,從而改進使用體驗。基於大數據基礎上的相應分析,能夠更有針對性的改進用戶體驗,同時挖掘新的商業機會。,數據源,數據源是指數據庫應用程式所使用的數據庫或者數據庫伺服器。豐富的數據源是大數據產業發展的前提。數據源在不斷拓展,越來越多樣化。如

12、智慧汽車可以把動態行駛過程變成數據,嵌入到生產設備裡的物聯網可以把生產過程和設備動態狀況變成數據。對數據源的不斷拓展不僅能帶來採集設備的發展,而且可以通過控制新的數據源更好地控制數據的價值。然而我國數位化的數據資源總量遠遠低於美歐,就已有有限的數據資源來說,還存在標準化、準確性、完整性低,利用價值不高的情況,這大大降低了數據的價值。,三,.,大數據的目標效果,1.,數據整合,統一數據模型,承載企業數據模型,促進企業各域數據邏輯模型的統一,;,統一數據標準,統一建立標準的數據編碼目錄,實現企業數據的標準化與統一存儲,;,統一數據視圖,實現統一數據視圖,使企業在客戶、產品和資源等視角獲取到一致的

13、資訊。,2.,數據質量管控,數據品質校驗,根據規則對所存儲的數據進行一致性、完整性和準確性的校驗,保證數據的一致性、完整性和準確性,;,數據品質管控,通過建立企業數據的品質標準、數據管控的組織、數據管控的流程,對數據品質進行統一管控,以達到數據品質逐步完善。,3.,數據共,享,消除網狀,接口,,建立大數據共用中心,為各業務系統提供共用數據,,降低,接口,複雜度,,,提高系統間,接口,效率與品質,;,以,即時或准即時,的方式將整合或計算好的數據向外系統提供。,4.,數據應用,查詢應用,平臺實現條件不固定、不可預見、格式靈活的,按需查詢功能,;,固定報表應用,視,統計維度和指標固定,的分析結果的展示,可根據業務系統的需求,分析產生各種業務報表數據等,;,動態分析應用,按關心的維度和指標對數據進行主題性的分析,動態分析應用中,維度和指標不固定,。,四,.,課程,總結,基於分散式技術構建的大數據平臺能夠有效降低數據存儲成本,提升數據分析處理效率,並具備海量數據、高併發場景的支撐能力,可大幅縮短數據查詢回應時間,滿足企業各上層應用的數據需求。,本課程主要學習內容,:,1.,大數據要做些什麽事,?,2.,與大數據平臺相關的技術是什麽,?,3.,大數據平臺要達到哪些目標,?,

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服