1、AI芯片行业研究报告2019年22019.6 iResearch I摘要来源:艾瑞研究院自主绘制。芯片行业具有资本和技术壁垒双高的特点,高昂的研发费用需要广大的市场进行支撑,对于AI芯片厂商来说除了核心软硬件技术开发实力外,市场洞察及成本控制亦是不可或缺的能力;行业当前接近Gartner技术曲线泡沫顶端,未来12年将会面临市场对于产品的检验,只有通过市场检验和筛选的优质团队才能够继续获得产业、政策和资本的青睐和继续支持。AI芯片主要适用于包括训练、推理在内的AI应用,擅长并行计算。主要应用于云端、边缘及物联网设备终端。市场空间在2022年有望超过500亿美元;边缘侧和终端对于AI芯片需求更加分
2、散,不同场景需要综合考虑芯片的PPACR。AI芯片作为协处理器难以单独实现应用功能,对厂家软件及系统开发交付能力同样有很高的考量。不同的应用场景中,拥有较高的固有行业壁垒,这需要AI芯片厂商能够加强与产业固有主体的合作,融入现有产业结构;AI芯片在云端主要为数据分析、模型开发(训练)及部分AI应用(推理)等提供算力支持。英伟达基于其完备的GPU+CUDA生态主导云端AI芯片市场,但其产品售价高昂,GPU计算效能及功耗不如FPGA及ASIC芯片,市场寻求潜在替代方案;SMSSMS3AI芯片行业概述1AI芯片应用场景及市场需求分析2AI芯片行业产业链及商业模式分析3AI芯片行业发展展望4企业推荐5
3、42019.6 iResearch I芯片工艺制程逼近物理极限;CPU芯片中大量晶体管用于构建逻辑控制和存储单元,用于构建计算单元的晶体管占比极小;为了保证兼容性,CPU构架演进发展受限。关于人工智能芯片(AI芯片)AI芯片:基于矩阵运算、面向AI应用的芯片设计方案1、定义:当前AI芯片设计方案繁多,包括但不限于GPUFPGAASICDSP等。目前市场上的对于AI芯片并无明确统一的定义,广义上所有面向人工智能(Artificial Intelligence,AI)应用的芯片都可以被称为AI芯片。2、当前AI运算指以“深度学习”为代表的神经网络算法,需要系统能够高效处理大量非结构化数据(文本、视
4、频、图像、语音等)。这需要硬件具有高效的线性代数运算能力,计算任务具有:单位计算任务简单,逻辑控制难度要求低,但并行运算量大、参数多的特点。对于芯片的多核并行运算、片上存储、带宽、低延时的访存等提出了较高的需求。3、针对不同应用场景,AI芯片还应满足:对主流AI算法框架兼容、可编程、可拓展、低功耗、体积及造价等需求。注释:DL:Deep Learning,指深度学习。来源:Deep LearningIan Goodfellow、Yoshua Bengio、Aaron Courville;英伟达官网。ControlALUALUALUALUCacheDRAMDRAMALU深度学习模型复杂度及规模对
5、芯片算力需求激增通过架构设计AI芯片跨越工艺限制,算力效能对CPU实现大幅超越工艺提升缓慢,面对大规模并行运算需求,需要对芯片架构进行重新设计;GPU:开发即面向图像处理等大规模运算需求;FPGA/ASIC:对缓存、计算单元、连接进行针对性优化设计。52019.6 iResearch IAI芯片实现算力提升AI芯片满足AI应用所需的“暴力计算”需求早在上世纪80年代,学术界已经提出了相当完善的人工智能算法模型,但直到近些年,模型的内在价值也没有被真正的实现过。这主要是受限于硬件技术发展水平,难以提供可以支撑深度神经网络训练/推断过程所需要的算力。直到近年来GPUFPGAASIC等异构计算芯片被
6、投入应用到AI应用相关领域,解决了算力不足的问题。下图以云计算场景为例,通过对全球几大科技巨头的代表性云端芯片产品计算性能对比,我们可以发现ASIC芯片相比起其他几种芯片,在计算效能、大小、成本等方面都有着极大优势,未来随着通用AI指令集架构的开发,预计会出现最优配置的AI计算芯片。注释:PPA:POWER、PERFORMANCE、AREA,指芯片的算力、功耗和面积。来源:Intel官网;英伟达官网;公开网络数据;艾瑞研究院。0.00181015.745Intel-XEONIntel/Altera-Stratix 10SoCNvidia-TESLA V100Google-TPUv2典型的云端计
7、算芯片算力表现比较Performance(TFLOPs)CPUFPGAGPUASIC优点:通用性好,串行运算能力强;适用于逻辑运算;缺点:开发难度最大,大量的晶体管用于构建控制电路和高速缓冲存储器,运算单元占比少,架构限制了算力的进一步提升。优点:相比CPU,由于其多线程结构,拥有较强的并行运算能力,与FPGA和ASIC相比通用性更强;缺点:价格、功耗等不如FPGA和ASIC,并行运算能力在推理端无法完全发挥。优点:可对芯片硬件层进行灵活编译,且功耗远远小于CPU和GPU缺点:硬件编程语言难以掌握,单个单元的计算能力比较弱,硬件成本较高,电子管冗余,功耗可进一步压缩。优点:针对专门的任务进行架
8、构层的优化设计,可实现PPA最优化设计、量产后成本最低;缺点:初始设计投入大,可编程架构设计难度较大,针对性设计会限制芯片通用性。62019.6 iResearch IAI芯片产品定位AI芯片对CPU并非替代,与CPU共同满足新时代计算需求目前来看,AI芯片并不能取代CPU的位置,正如GPU作为专用图像处理器与CPU的共生关系,AI芯片将会作为CPU的AI运算协处理器,专门处理AI应用所需要的大并行矩阵计算需求,而CPU作为核心逻辑处理器,统一进行任务调度。在服务器产品中,AI芯片被设计成计算板卡,通过主板上的PCIE接口与CPU相连;而在终端设备中,由于面积、功耗成本等条件限制,AI芯片需要
9、以IP形式被整合进SoC系统级芯片,主要实现终端对计算力要求较低的AI推断任务。来源:英伟达官网,公开网络数据。服务器级产品中通过PCB上PCIE接口与CPU组成异构计算单元通过SoC封装与CPU组成异构计算单元CPUGPUXPUDSPModemCamera ISP4K VideoHifi AudioLPDDR 4XUFSSensor ProcessorSecurity EngineSoC72019.6 iResearch IAI芯片应用场景AI芯片为AI应用落地提供了商业化可行的算力解决方案在人工智能发展初期,算法已经通过数据中心(云端)在大数据分析、精准营销、商业决策等方面实现了成功地应用
10、落地。而未来,智能化将会逐渐渗透进入能源、交通、农业、公共事业等更多行业的商业应用场景中,除了部署在云端进行数据分析等工作,人工智能还需要下沉到摄像头、交通工具、移动设备终端、工业设备终端中,与云计算中心协同实现本地化的、低延时的人工智能应用。考虑到任务算力需求,以及传输带宽、数据安全、功耗、延时等客观条件限制,现有云端计算解决方案难以独自满足人工智能本地应用落地计算需求,终端、边缘场景同样需要专用的AI计算单元。来源:艾瑞研究院自主绘制。算法下发计算下沉云端云端负责承载智能数据分析、模型训练任务和部分对传输带宽要求不高的推理任务。数据回传模型训练/推理边缘+终端基于对数据传输带宽压力、数据安
11、全等因素的考量,边缘和终端侧承载了需要本地实时响应的推理任务。需要独立完成任务涵盖:数据收集、环境感知、人机交互以及部分的推理决策控制任务。终端 SoC+IP:DSP/GPU/ASIC边缘智能服务器:GPU/FPGA/ASIC云数据机房智能服务器:GPU/FPGA/ASIC智慧安防超大数据量本地处理自动驾驶断网下独立本地处理其他物联网场景工业/农业等家庭数据安全、异构、实时响应移动互联网低功耗、数据安全云端与边缘侧人工智能应用场景对于AI芯片的需求82019.6 iResearch I20.2172.13.471.915.52108.1920172022e云端训练AI芯片(亿美元)云端推断AI
12、芯片(亿美元)边缘推断AI芯片(亿美元)AI芯片整体市场规模预测AI芯片市场规模近5年增长有望接近10倍1、市场根据AI芯片功能及部署场景将AI芯片分为:训练/推断、云端/边缘两个维度进行划分。训练端由于需要对大量原始数据进行运算处理,因此对于硬件的算力、计算精度,以及数据存储和带宽等都有较高要求,此外在云端的训练芯片应该有较好的通用性和可编程能力。推理端对于硬件性能要求没有推断端高,实证证明一定范围的低精度运算可达到同等推理效果,但同时这要求模型训练精度要达到较高水平。2、根据中金公司研究部数据显示,2017年,整体AI芯片市场规模达到39.1亿美元,其中云端训练AI芯片20.2亿美元,云端
13、推理芯片3.4亿美元,边缘计算AI芯片15.5亿美元;到2022年,整体AI芯片市场规模将会达到352.17亿美元,CAGR55%,其中云端训练AI芯片172.1亿美元,CAGR 54%,云端推断芯片71.9亿美元,CAGR 84%,边缘计算AI芯片108.2亿美元,CAGR 48%。注释:AI芯片细分市场规模单位:亿美元。来源:AI芯片:应用落地推动产品多样化中金公司研究部2017-2022年AI芯片细分市场规模预测CAGR:53.5%CAGR:84.1%CAGR:47.5%9AI芯片行业概述1AI芯片应用场景及市场需求分析2AI芯片行业产业链及商业模式分析3AI芯片行业发展展望4企业推荐5
14、102019.6 iResearch I应用场景:云计算云计算:共享规模化经济效益有效降低边际成本投入云计算是一种按使用计费的IT服务模型,实现对高可靠、可配置的计算资源池(服务器、存储、网络、应用程序和服务)的方便快捷的访问,资源可通过最少的管理工作快速的配置和发布。云计算具有:资源池、广泛的网络访问、按需自助服务、快速弹性膨胀、测量服务等5个基本特征。云计算服务模式主要包括:IaaS、PaaS、SaaS:1.IAAS-提供基本的计算(虚拟或专用硬件)、存储、网络资源,使用者在资源中部署运行任意应用程序和操作系统;2.PAAS-提供部署在云基础设施上的编程语言、库、服务和支持工具,为开发人员
15、提供了一个自助服务门户而无需管理底层基础设施;3.SAAS-提供在云基础设施上运行的应用程序,程序运行管理皆由服务提供商负责。相比起传统IT模式,云计算模式可实现:降低用户初始IT投资成本及IDC机房维护费用并实现资本效益配置最大化、IT资源快速弹性扩展、数据价值的有效挖掘以及业务的快速上线部署等。来源:IBM。传统IT应用数据运行中间件O/S虚拟化服务器存储网络IaaS应用数据运行中间件O/S虚拟化服务器存储网络PaaS应用数据运行中间件O/S虚拟化服务器存储网络SaaS应用数据运行中间件O/S虚拟化服务器存储网络云厂商管理客户自行管理云计算服务模型112019.6 iResearch I2
16、019.6 iResearch I889.7 952.5 967.2 988.7 1009.1 1107.9 1110.3 1145.1 18%7%2%2%2%10%0%3%201020112012201320142015201620172010-2017年全球服务器出货量及增速全球服务器出货量(万台)同比(%)490046006700101001243168225494756-6%46%51%270%298%296%20142015201620172014-2017年 Amazon&阿里巴巴云计算建设资本支出Amazon(百万美元)阿里巴巴(百万美元)Amazon(%)阿里巴巴(%)云计算中
17、心服务器及硬件市场规模云计算发展带动上游硬件市场需求近些年云厂商巨头快速扩张带动了上游数据机房建设热潮,虽然这会抵消部分企业自建机房及采购服务器的需求,但是这部分需求并没有消失而是转移到了对云数据中心IT资源的需求上。中国云产业比美国发展晚24年左右,在全球云计算市场中,美国占比达到54.1%,中国仅为5%。2017年中国IT支出为2.4万亿人民币,仅占全球IT总支出金额的9.92%,对应中国GDP水平仍有较大的提升空间。中国虽然起步较晚但发展迅猛,对比亚马逊及阿里巴巴云计算资本支出数据,可以看到阿里巴巴在云计算领域支出总金额绝对值虽然少于亚马逊,但增速却显著超过了亚马逊的资本支出增速,这显示
18、了近年来国内加大对于计算资源基础设施的建设力度,将极大受益于服务器厂商及上游芯片厂商业绩。来源:AMAZON、阿里巴巴公司年报披露数据。来源:Wind。122019.6 iResearch I云计算与人工智能服务云计算为AI开发部署提供多元化服务支持云计算服务供应商可以向客户提供包括计算、存储、数据库、分析、移动、物联网和企业应用等一系列多层级服务。在人工智能应用方面,由于人工智能(以深度学习为代表)的开发及应用对于算力、数据有较大的需求,而云计算服务可以为开发者提供AI计算芯片以及基于其开发的智能服务器集群等强大算力设施的租用,同时也可以为开发者提供PaaS级的开发平台或是直接提供已训练好的
19、人工智能功能模块等产品。通过多元化的服务模式,可以降低开发者的开发成本和产品开发周期,为客户进行方便快捷的AI赋能。注释:AI服务器:指搭载了AI芯片、计算板卡并用于人工智能相关运算的服务器。来源:AWS官网。云计算核心产业链及云端人工智能服务模式AI InfrastructureAI FrameworksAI PlatformsAI ServicesDL-aaS:以云服务的形式提供高效的深度学习开发平台AI-aaS:以云服务形式提供人工智能技术应用软件零售媒体游戏制造业金融房地产广告物流医疗教育通讯科技公共云厂商服务器芯片客户132019.6 iResearch I云计算与人工智能云计算服务
20、模式可显著降低AI应用开发、部署成本任务硬件收费:$/h构建标准实例0.056.45GPU实例1.2634.27训练标准实例0.136.45GPU实例1.2634.27模型部署标准实例0.076.45GPU实例1.2634.27云计算发展自互联网厂商提升服务器使用效率(考虑为应付黑色星期五、双11等特殊日期访问量激增而添置的巨量服务器资源)而逐渐开始的服务器Web租赁服务。在云计算产业链中,云厂商负责基础设施和云组织架构的搭建,并为客户提供PaaS、SaaS服务,具有极高的资本和技术门槛,在产业链中享有极大的话语权。如前文所述,在AI开发中,由于深度学习模型开发及部署需要强大算力支持,需要专用
21、的芯片及服务器支持。开发者如选择自购AI服务器成本过高。通过云服务模式,采取按需租用超算中心计算资源可极大降低项目期初资本投入同时也省却了项目开发期间的硬件运维费用,实现资本配置效率的最大化提升。来源:英伟达官网、亚马逊官网、公开网络数据、专家访问。服务器AI芯片CPU售价:$DGX-216*Tesla V1002*intel Xeon Platinum8168$399,000DGX-1(Volta)8*Tesla V1002*intel Xeon E5-2698 v4$149,000DGX-1(Pascal)8*Tesla P1002*intel Xeon E5-2698 v3$129,00
22、0云计算AI服务收费(AWS)部分云端AI智能服务器售价芯片功能售价:¥V100(GPU)训练10万元,包含硬件+软件(驱动、许可、保修)P4(GPU)推断2万元,包含硬件+软件FPGA推断45000元部分云端AI芯片售价142019.6 iResearch I云计算与AI芯片GPGPU+CUDA方案提供丰富的AI开发SDK及广泛适用性英伟达除了在传统独立显卡领域有近7成的市场份额,其在云计算智能服务器领域市场份额更是一家独大。英伟达为客户提供了支持AI应用开发的完备的TESLA GPU产品线,相比于传统CPU服务器,在提供相同算力情况下,GPU服务器在成本、空间占用和能耗分别为传统方案的1/
23、8、1/15和1/8。除了优秀的硬件性能外,英伟达开发了基于GPU的“CUDA”开发平台,为开发者提供了丰富的开发软件站SDK,支持现有的大部分的机器学习、深度学习开发框架,开发者可以在CUDA平台上使用自己熟悉的开发语言进行应用开发。公司花费大量时间培养自己的开发生态,包括与高校合作培训专业人才、开展专业竞赛,培养、发展英伟达“GPU+CUDA”的开发者群体,形成了相当可观的产品使用人群,构建了当前英伟达在人工智能领域的霸主地位。来源:英伟达公司官网。英伟达云端软硬件一体解决方案CUDA英伟达-Datacenter AI purpose GPUsLanguage Support:英伟达TES
24、LA P4AI-INFERENCE英伟达TESLA P40AI-INFERENCE/GRAPHICS英伟达TESLA V100AI-TRAINING/ACCELERATERDeep Learning Framework Support:Deep LearningMath/Linear AlgebraSiganl/Imge/VideoParallel AlgorithmNVgraphcuBLASCUDA MathcuRANDcuFFTcuFFT152019.6 iResearch I2019.6 iResearch I6.7 13.7 35.3 62.5 87.5 0.0 3.4 18.3 57
25、.0 105.9 6.3 14.8 35.7 66.0 98.8 0.0 0.8 5.3 19.7 37.0 201620172018e2019e2020e2016-2020年全球AI服务器及AI芯片市场规模AI训练服务器(万台)AI推断服务器(万台)AI训练芯片市场规模(亿美元)AI推断芯片市场规模(亿美元)云计算中心AI芯片市场规模及份额GPU并非完美,市场期待替代GPU的云端AI芯片解决方案当前全球云计算AI芯片市场英伟达一家独大(尤其是训练端),主要原因是英伟达GPU产品线丰富,编程环境成熟,产品支持市场上主要的开发框架和语言,产品广受AI开发者好评。但同时其产品也存在着功耗偏大、价格
26、昂贵等问题(V100芯片售价达10万元,DGX系列服务器售价过百万元)。基于此,各大云厂商纷纷提出自己的AI芯片开发计划以摆脱上游AI芯片供货商一家独大的垄断市场情况。此外根据数据显示,推断市场未来增速和空间将会高于训练端市场,而GPU芯片并不善于推断任务,因此,在当前智能服务器渗透率尚低,GPU产品并非完美解决方案的情况下,我们认为对于其他AI芯片厂商云计算中心市场依然存在着较大的市场空间可以进入。来源:IDC,Gartner。来源:IDC。90.0%90.0%80.0%75.0%70.0%65.0%60.0%60.0%50.0%40.0%35.0%30.0%30.0%20162017201
27、8e2019e2020e2021e2022e2016-2022年全球云端AI芯片GPU市场份额占比云端训练GPU占比(%)云端推理GPU占比(%)162019.6 iResearch I云计算AI芯片发展趋势看好基于AI专用指令集的可编程ASIC芯片及配套开发平台如前文所述,当前在云端场景下被最广泛应用的AI芯片是英伟达的GPU,主要原因是:强大的并行计算能力(相比CPU)、通用性以及成熟的开发环境。但是GPU也并非是完美无缺的解决方案,明显的缺点如:高能耗以及高昂的价格。目前包括创业公司、科技巨头等都在积极寻找GPU的替代方案,希望实现:既具有GPU通用性、又具有更好的能效和算力表现的通用、
28、可编程产品。当前市场上典型的替代方案包括Google的TPU系列以及寒武纪的MLU系列产品。来源:艾瑞研究院自主绘制。云计算场景AI芯片设计思路及发展趋势XPU forCloud算力更大的存储及更高的数据访存效率云端开发平台软件开发工具链芯片间实现高速互联,灵活应对访问计算力需求的弹性变动功耗通用性、可编程调整存储单元与计算单元之间的距离,降低数据运算功耗为开发者提供易使用的开发平台降低对片外存储依赖、尽量使用片上存储(SRAM、Cache)通用性,对多数AI开发模型及编程框架形成通用支持架构设计:通过对主流算法模型进行细粒化,抽象出基础算子,总结运算逻辑,对硬件进行针对性优化设计,实现对主流
29、算法模型的支持指令集开发:开发专用的MLNNs指令集,降低开发者编程难度采用新的存储技术,如片内计算172019.6 iResearch I应用场景:边缘计算边云协同共同实现万物互联时代计算任务需求边缘计算:在靠近数据源头的网络边缘侧,融合网络/计算/存储/应用等核心能力的分布式开放平台,就近提供边缘智能服务,具有海量联接、实时业务处理、数据优化、应用智能、安全与隐私保护等特点。边缘计算对软硬件系统提出了:1)海量异构联接、2)计算任务在边缘节点实时处理响应、3)硬件功耗/成本/空间/抗干扰等有严格要求、4)分布式资源的动态调度与统一管理、5)支持联接/数据/管理/控制/应用/安全等方面的协同
30、等要求。边云协同放大边缘计算及云计算价值:边缘计算承担数据采集和部分的数据处理任务,支撑云端应用,而云计算通过大数据分析,优化输出的业务规则或模型,下发到边缘侧,为终端提供运行规则/模型。来源:边缘计算与云计算协同产业白皮书工业互联网产业联盟云计算层SaaSPaaSIaaS边缘层EC-SaaSEC-PaaSEC-IaaS现场设备设备接入协议解析数据回传处理(*部分场景下的数据处理需要在边缘侧完成)边缘网关边缘控制器边缘云边缘传感器预测维护能效优化质量提升vFWvLB服务协同业务管理协同应用管理协同智能协同数据协同资源协同应用实例应用部署软硬件环境分布式智能/推理数据采集与分析链接数字世界物理世
31、界业务编排应用开发管理数据分析/训练边云协同组织架构图182019.6 iResearch I边缘计算场景与人工智能芯片边缘侧场景繁杂,综合考量AI芯片“PPACR”在边缘计算场景,AI芯片主要承担推断任务,通过将终端设备上的传感器(麦克风阵列、摄像头等)收集的数据代入训练好的模型推理得出推断结果。由于边缘侧场景多种多样、各不相同,对于计算硬件的考量也不尽相同,芯片可以是IP in SoC,也可以是边缘服务器,对于算力和能耗等性能需求也有大有小。因此不同于云端场景的“高端、通用”,应用于边缘侧的计算芯片需要针对特殊场景进行针对性设计以实现最优的解决方案。来源:网络公开数据、艾瑞研究院自主绘制。
32、物联网场景移动互联网智能安防自动驾驶任务描述:机器视觉语音识别/自然语义处理1、图像检测2、视频检测3、语音识别4、语义理解1、照相-场景识别2、照相-美化3、AR应用4、语音助手1、图像检测2、视频检测1、图像语义分割2、数据融合3、Slam定位4、路径规划性能要求算力Performance1TOPs18TOPs420TOPs204000TOPs(L3L5)能耗Power接入设备部署现场电源消费级聚合物锂电池2,0005,000mAh接入设备部署现场电源动力级硬壳锂电池(组)200,000500,000mAh面积Area高(SoC)极高(SoC)高低(SoC、Server)中(PCIE co
33、ntains multiple SoC Chips)成本控制Cost高极高高低(IPC,NVR)中可靠性Reliability高(工业)/中(家用)中高极高代表厂商不同边缘计算场景对AI芯片“PPACR”性能考察要求192019.6 iResearch I2019.6 iResearch I28921589181136611341-25%42%-24%172%112%6%481%-8%1349%-82%2018年城市级安防项目招标统计招标金额(亿元)招标同比(%)55276684123018883458110001380017100205002360026600402%148%80%53%83
34、%25%24%20%15%13%201720182019e2020e2021e2022e2017-2022年摄像头AI芯片市场空间AI摄像头出货(万个)IP摄像头出货(万个)AI摄像头同比(%)IP摄像头同比(%)应用场景1:智慧安防市场当前国内基于G端需求最明确的边缘计算AI应用场景在国内,安防市场是最为确定的边缘侧AI应用场景,主要原因是大量的监控视频数据分析对人力的需求与当前基层人力缺失、人力成本上升之间的显著矛盾。需求端来自于包括政府、大中企业以及个人安防需求,主要市场需求来自于政府,包括平安城市、智慧交通管控、智慧城市、雪亮工程等,其中公安部“雪亮工程”提出到2020年实现“全域覆盖
35、、全网共享、全时可用、全程可控”,智能摄像头的应用可以有效解决基层数据传输带宽压力以及基层警力人员缺失等问题,预计“雪亮工程”等政府项目将会对智能安防摄像头市场带来较大的驱动作用。来源:AI智道,不完全统计。来源:IDC。202019.6 iResearch I智慧安防与AI芯片AI芯片为摄像头提供边缘智能解决方案降低数据回传需求安防摄像头发展经历了由模拟向数字化、数字化高清到现在的数字化智能方向的发展,最新的智能摄像头除了实现简单的录、存功能外,还可以实现结构化图像数据分析。安防摄像头一天可产生20GB数据,若将全部数据回传到云数据中心将会对网络带宽和数据中心资源造成极大占用。通过在摄像头终
36、端、网络边缘侧加装AI芯片,实现对摄像头数据的本地化实时处理,经过结构化处理、关键信息提取,仅将带有关键信息的数据回传后方,将会大大降低网络传输带宽压力。当前主流解决方案分为:前端摄像头设备内集成AI芯片和在边缘侧采取智能服务器级产品。前端芯片在设计上需要平衡面积、功耗、成本、可靠性等问题,最好采取低功耗、低成本解决方案(如:DSP、ASIC);边缘侧限制更少,可以采取能够进行更大规模数据处理任务的服务器级产品(如:GPU、ASIC)。来源:艾瑞研究院自主绘制。前端:ISP核心芯片,对原始图像信号进行降噪、曝光调整,决定最终成像效果的好坏;模拟监控系统 后端:DVR SoC将模拟音频信号数字化
37、、编码压缩与存储(A/D芯片和视频编解码芯片)。数字/网络高清 前端:IPC SoC集成CPU、ISP、高压缩比视频编解码模块、网络接口、加密模块、内存子系统等;后端:NVR SoC接收摄像机的IP码流进行编解码、存储,适用于环境复杂和分散的大型监控系统。智能化升级 前端:IPC SoC+AI-IP/独立AI芯片-在现有IPC上集成算法实现识别任务;-SoC中集成协处理器或增加独立AI芯片进行结构化分析或运行DL算法提升检出率;后端:GPU/ASIC智能服务器将智能推理功能集成在边缘的服务器级产品中,实现更大规模的人工智能应用。如:GPU服务器或最新ASIC服务器方案。公安交通智能楼宇金融能源
38、司法文教卫结构化分析摄像机智能网络摄像机深度学习摄像机AI芯片在智能安防摄像头中的应用212019.6 iResearch I智慧安防芯片市场市场考验厂商综合服务能力,海外厂商逐步退出国内市场78%22%2016年安防芯片市场份额前端IPC芯片市场份额后端DVR/NVR市场份额摄像头由于任务相对单一,行业内产品同质化程度较高,导致行业竞争激烈。智能安防芯片领域参与者包括国际一线厂商如:英伟达、华为、安霸、TI等,还有创业公司如:比特大陆、地平线、云天励飞等,以及北京君正、国科微等传统安防半导体企业,甚至下游的安防厂商如海康威视、大华股份也开始自研AI芯片产品。英伟达作为AI巨头在安防领域有前、
39、后端完整软硬件解决方案,国内诸多安防厂商均采购其产品;华为推出了Hi3559等智能芯片,虽然算力性能表现暂时不如英伟达,但作为在国内传统IPC市场有近7成市场份额的企业,基于其深厚的市场积累,能够为客户提供完善的、高性价比的解决方案。在面临越来越多的企业涌入安防芯片市场的情况下,行业客户倾向于采购完整的方案,因此除了考察单一芯产品性能以外,更加考察企业的行业积累及整体解决方案设计及交付能力。来源:CPS中安网、IHS、公开网络数据。62%8%7%3%20%2016年IPC视频编解码芯片市场份额海思AmbarellaTINXP其他厂商产品算力前端英伟达JETSON TX1-GPU1TOPs华为海
40、思Hi3559AV1004TOPs北京君正T01-ASIC地平线旭日1TOPs后端英伟达TESLA P45.5TFlops比特大陆BM16823TFlops主要安防AI芯片解决方案222019.6 iResearch I应用场景2:移动互联网市场AI芯片为移动互联网消费电子类产品带来新增市场空间13.0 14.3 14.7 14.7 14.9 15.0 15.2 15.2 15.2 0.4 1.5 3.0 4.6 6.1 6.8 10%3%0%1%1%1%0%0%237%102%51%33%13%201420152016201720182019e2020e2021e2022e2014-2022
41、年全球智能手机出货量全球智能手机出货量(亿部)AI手机出货量(亿部)智能手机 CAGR(%)AI手机 CAGR(%)智能手机在经历了近10年的高速增长后,市场已趋于饱和,出货增速趋近于0,行业逐渐转为存量市场。近年来,一批国产厂商在产品质量上逐渐达到了第一梯队的水平,进一步加剧了头部市场的竞争。为实现差异化竞争,各厂商加大手机AI功能的开发,通过在手机SoC芯片中植入AI芯片实现在低功耗情况下AI功能的高效运行。随着未来竞争进一步加剧,以及产量上升所带来的成本下降,预计AI芯片将会进一步渗透进入到中等机型市场,市场空间广阔。移动端AI芯片市场不止于智能手机,潜在市场还包括:智能手环/手表、VR
42、/AR眼镜等市场。AI芯片在图像及语音方面的能力可能会带来未来人机交互方式的改变并进一步提升显示屏、摄像头的能力,有可能在未来改变移动端产品。来源:IDC。232019.6 iResearch I移动互联网与AI芯片智能手机:SoC内嵌AI IP实现手机AI功能的高效执行通过云数据中心做手机端AI推理任务面临网络带宽延迟瓶颈的问题,严重影响用户使用体验,而CPU适合逻辑运算,但并不适合AI并行运算任务,目前市场上流行在SoC中增加协处理器或专用加速单元来执行AI任务。以智能手机为代表的移动互联网终端是一个多传感器融合的综合数据处理平台,AI芯片需要具备通用性,能够处理多类型任务能力。由于移动终
43、端依靠电池驱动,而受制于电池仓大小和电池能量密度限制,芯片设计在追求算力的同时对功耗有着严格的限制,可以开发专用的ASIC芯片或者是使用功耗较低的DSP作为AI处理单元。来源:艾瑞研究院自主绘制。当今手机电池电容量普遍在20005000mAh。有限的电量需要被被分配到AP、CP中的射频、CPU、GPU、ISP等诸多电子元器件,用于信号接发、编解码、摄像头、图像处理/渲染等多类型任务,对电子元器件功耗设计提出了极高的要求。通过设计专用的AI加速运算单元并植入在SoC中,在功耗可控的情况下可实现高效的执行AI运算任务。个人助理照相-人脸识别照相-场景识别照相-智能防抖照相-翻译通话-降噪A/VRA
44、I功能IP厂商CPUGPUDSPISPAI-IPMemory消费级聚合物锂电池SoC外围设备/传感器手机/SoC厂商242019.6 iResearch I2019.6 iResearch I厂商SoCAI技术性能SoC厂商高通骁龙845Hexagon 685 DSP+CPU+GPU骁龙855Hexagon 690 DSP+CPU+GPU7TOPs,比上一代提升3倍苹果A11Neural Engine0.6TOPsA12Neural Engine5TOPsMTKP60APU0.56TOPsP90APU2.02.25TOPs华为Kirin970NPU 1A0.512TOPsKirin980NPU
45、 1H5TOPsIP厂商ARMN/AML/OD ProcessorCadenceN/AP5/P6/Q6/C5SynopsysN/AEV5x/6xCEVAN/AXM6/XM4移动互联网芯片市场传统手机芯片厂商技术实力强劲,行业壁垒较高目前手机芯片市场存在以下情况:1)、AI应用场景、功能有限;2)、AI芯片厂商一般向SoC厂提供IP并收取授权费,需要AI-IP与整块SoC进行良好的匹配,而创业公司缺少与SoC厂商合作经验;3)、传统手机SoC厂商和IP厂商都在开发自己的AI加速器,传统IP巨头可以采取IP打包销售的方式推广其AI-IP产品。相比之下新进厂商在成本、功能、产品线、匹配度等都不占优的
46、情况下很难在该领域存活。新进厂商应加强其软件方面优势,并加深与手机厂商合作共同进行手机AI功能开发。来源:公开网络数据,艾瑞研究院。来源:CounterPoint,中金研究部。主要手机AI芯片解决方案2017年手机SoC芯片市场份额41%21%18%8%6%5%1%QualcommAppleMediaTekSamsungHisiliconSpreadtrumOthers252019.6 iResearch I应用场景3:自动驾驶前景广阔,但510年内L45进入乘用车平台困难较大根据美国汽车工程师协会(SAE)将自动驾驶按照车辆行驶对于系统依赖程度分为L0L5六个级别,L0为车辆行驶完全依赖驾驶
47、员操纵,L3级以上系统即可在特定情况下实现驾驶员脱手操作,而L5级则是在全场景下车辆行驶完全实现对系统的依赖。目前商业化乘用车车型中仅有Audi A8、Tesla、凯迪拉克等部分车型可实现L2、3级ADAS。预计在2020年左右,随着传感器、车载处理器等产品的进一步完善,将会有更多的L3级车型出现。而L4、5级自动驾驶预计将会率先在封闭园区中的商用车平台上实现应用落地,更广泛的乘用车平台高级别自动驾驶,需要伴随着技术、政策、基础设施建设的进一步完善,预计至少在2025年2030年以后才会出现在一般道路上。来源:IHS,,天风证券研究所,艾瑞研究院。95811346620010302194100
48、84832054330595236359566620687347056573278755727867610.0%14.0%21.0%30.0%40.0%45.0%48.0%49.0%48.0%47.0%43.0%39.0%35.0%31.0%30.0%0.2%0.4%0.6%1.0%1.8%2.8%4.4%7.0%10.0%12.0%14.5%16.0%18.0%20.0%21.0%0.0%0.3%0.6%1.2%2.3%4.0%7.2%10.5%13.0%15.0%10.0%14.0%21.0%31.0%41.0%48.0%53.0%57.0%59.0%61.0%62.0%62.0%63.0
49、%64.0%66.0%201620172018e2019e2020e2021e2022e2023e2024e2025e2026e2027e2028e2029e2030e2016-2030年全球汽车市场自动驾驶渗透率预测L1-L5总车辆数(千辆)L1/L2渗透率(%)L3渗透率(%)L4/L5渗透率(%)L1-L5总渗透率(%)262019.6 iResearch I自动驾驶与汽车电子发展趋势目前汽车电子控制系统是分布式ECU架构,不同的信息娱乐、车身、车辆运动和动力总成系统及其细分功能分别由不同独立的ECU单元进行独立控制,部分高档车型上的ECU数量超过100个。未来随着汽车进入L3级以上的高
50、级别自动驾驶时代,随着车载传感器数量及其所产生的数据量剧增,分布式电子系统难以满足对大量、多元的传感器数据进行高效融合处理,并综合所有传感器数据做出车辆控制决策等一系列操作需求。要满足以上功能需求,汽车电子系统由需要向着域控制器(DCU)、多域控制器(MDC)等集中化方向发展,未来,汽车电子操控系统将会进一步向着集中化、软硬件解耦及平台化方向发展,汽车将会由统一的超算平台对传感器数据进行处理、融合、决策最终实现高级别的自动驾驶功能。高级ADAS/自动驾驶需要中央“CPU+XPU”异构处理器传统:分布式ECU汽车电子操纵系统未来:中央计算单元+操作平台硬件层中央处理器(冗余设置)硬件抽象层HAL