1、2019年人工智能发展白皮书风起云涌:人工智能关键技术不断取得突破 相得益彰:人工智能赋能产业与应用场景 百川归海:人工智能开放创新平台逐步建立 各领风骚:全球人工智能公司一览目 录01020304前言人工智能是一个很宽泛的概念,概括而言是对人的意识和思维过程的模拟,利用机器学习和数据分析方法赋予机器类人的能力。人工智能将提升社会劳动生产率,特别是在有效降低劳动成本、优化产品和服务、创造新市场和就业等方面为人类的生产和生活带来革命性的转变。据Sage预测,到2030年人工智能的出现将为全球GDP带来额外14%的提升,相当于15.7万亿美元的增长。全球范围内越来越多的政府和企业组织逐渐认识到人工
2、智能在经济和战略上的重要性,并从国家战略和商业活动上涉足人工智能。全球人工智能市场将在未来几年经历现象级的增长。据中国产业信息网和中国信息通信研究院数据,世界人工智能市场将在2020年达到6800亿元人民币,复合增长率达26.2%,而中国人工智能市场也将在2020年达到710亿元人民币,复合增长率达44.5%。我国发展人工智能具有多个方面的优势,比如开放的市场环境、海量的数据资源、强有力的战略引领和政策支持、丰富的应用场景等,但仍存在基础研究和原创算法薄弱、高端元器件缺乏、没有具备国际影响力的人工智能开放平台等短板。此份报告不但对人工智能关键技术(计算机视觉技术、自然语言处理技术、跨媒体分析推
3、理技术、智适应学习技术、群体智能技术、自主无人系统技术、智能芯片技术、脑机接口技术等)、人工智能典型应用产业与场景(安防、金融、零售、交通、教育、医疗、制造、健康等)做出了梳理,而且同时强调人工智能开放平台的重要性,并列举百度Apollo开放平台、阿里云城市大脑、腾讯觅影AI辅诊开放平台、科大讯飞智能语音开放创新平台、商汤智能视觉开放创新平台、松鼠AI智适应教育开放平台、京东人工智能开放平台NeuHub、搜狗人工智能开放平台等典型案例呈现给读者。最后,列举国内外优秀的人工智能公司与读者共勉。随着技术的进步、应用场景的丰富、开放平台的涌现和人工智能公司的创新活动,我国整个人工智能行业的生态圈也会
4、逐步完善,从而为智慧社会的建设贡献巨大力量。风起云涌:人工智能关键技术不断取得突破/01八大人工智能关键技术选取标准:技术相对取得较大突破;应用场景相对明确;在产业界、学术界、投资界引起较大的关注。计算机视觉技术自然语言处理技术跨媒体分析推理技术智适应学习技术群体智能技术自主无人系统技术智能芯片技术脑机接口技术1.计算机视觉技术计算机视觉(Computer Vision)是一门研究如何使机器“看”的科学,更进一步地说,是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量的科学。近几年计算机视觉技术实现了快速发展,其主要学术原因是2015年基于深度学习的计算机视觉算法在ImageNet数据库上的
5、识别准确率首次超过人类,同年Google也开源了自己的深度学习算法。计算机视觉系统的主要功能有图像获取、预处理、特征提取、检测/分割和高级处理。图像获取预处理特征提取检测/分割高级处理提取二维图像、三维图组、图像序列或相关的物理数据,如声波、电磁波或核磁共振的深度、吸收度或反射度对图像做一种或一些预处理,使图像满足后继处理的要求,如:二次取样保证图像坐标的正确,平滑去噪等从图像中提取各种复杂度的特征,如:线,边缘提取和脊侦测,边角检测、斑点检测等局部化的特征点检测对图像进行分割,提取有价值的内容,用于后继处理,如:筛选特征点,分割含有特定目标的部分验证得到的数据是否匹配前提要求,估测特定系数,
6、对目标进行分类国际计算机视觉大会(ICCV 2019)欧洲计算机视觉会议(ECCV 2018)ImageNet大规模视觉识别挑战赛(ILSVRC)国际计算机视觉与模式识别会议(CVPR 2019)其他近年来,计算机视觉在产业界和学术界不断取得突破。国际计算机视觉大会(IEEE International Conference on Computer Vision,简称ICCV)是全球计算机视觉领域三大顶级会议之一,2019年该大会共收到4328篇论文投稿,相比上一届 ICCV 2017,数量翻了一倍不止。其中,中科院和清华大学的投稿数量在所有机构中遥遥领先。欧洲计算机视觉会议(Europeon
7、 Conference on Computer Vision,简称ECCV)是全球计算机视觉领域三大顶级会议之一,2018年该大会共收到论文投稿2439篇,涵盖对抗性机器学习,对人、物体和环境的超快三维感知、重建与理解,面部追踪及其应用,行人重识别的表征学习,视觉定位等主题。国际计算机视觉与模式识别会议(Computer Vision and Pattern Recognition,简称CVPR)是全球计算机视觉领域三大顶级会议之一,2019年该大会共录取来自全球的论文1299篇,其中腾讯公司的腾讯优图和腾讯AI Lab有超过58篇论文被接收,相比过去两年成绩大幅提升。ImageNet大规模视
8、觉识别挑战赛(ILSVRC)从2010年开始举办,一年一度,至2017年终结,有力推动了计算机视觉的发展。截至2016年,ImageNet中含有超过1500万由人手工注释的图片网址,标签超过2.2万个类别,图像识别错误率已经达到2.9%,远远超越人类(5.1%)。清华大学研究团队提出了一种全新的卷积神经网络架构DenseNet,显著地提升了模型在图片识别任务上的准确率;北京大学和微软亚洲研究院研究团队提出了一种新的硬感知深度级联嵌入方法来考虑硬水平的样本;1.计算机视觉技术传统翻译采用人工查词的方式,不但耗时长,而且错误率高。图像识别技术(OCR)的出现大大提升了翻译的效率和准确度,用户通过简
9、单的拍照、截图或划线就能得到准确的翻译结果。翻译计算机视觉还有助于比赛和策略分析、球员表现和评级,以及跟踪体育节目中品牌赞助的可见性。体育赛事半自动联合收割机可以利用人工智能和计算机视觉来分析粮食品质,并找出农业机械穿过作物的最佳路径。另外也可用来识别杂草和作物,有效减少除草剂的使用量。农业计算机视觉也可以帮助制造商更安全、更智能、更有效地运行,比如预测性维护设备故障,对包装和产品质量进行监控,并通过计算机视觉减少不合格产品。制造业自动驾驶汽车需要计算机视觉。特斯拉(Tesla)、宝马(BMW)、沃尔沃(Volvo)和奥迪(Audi)等汽车制造商Y已经通过摄像头、激光雷达、雷达和超声波传感器从
10、环境中获取图像,研发自动驾驶汽车来探测目标、车道标志和交通信号,从而安全驾驶。交通中国在使用人脸识别技术方面无疑处于领先地位,这项技术被广泛应用于警察工作、支付识别、机场安检,甚至在北京天坛公园分发厕纸、防止厕纸被盗,以及其他许多应用。安防由于90的医疗数据都是基于图像的,因此医学中的计算机视觉有很多用途。比如启用新的医疗诊断方法,分析X射线,乳房X光检查,监测患者等。医疗计算机视觉技术的典型应用案例2.自然语言处理技术自然语言处理(Natural Language Processing)是一门通过建立形式化的计算模型来分析、理解和处理自然语言的学科,也是一门横跨语言学、计算机科学、数学等领域
11、的交叉学科。自然语言处理,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。自然语言处理的具体表现形式包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及两个流程,包括自然语言理解和自然语言生成,自然语言理解是让计算机把输入的语言变成有意思的符号和关系,然后根据目的再处理;自然语言生成则是把计算机数据转化为自然语言。实现人机间的信息交流,是人工智能界、计算机科学和语言学界所共同关注的重要问题。从2008年到现在,在图像识别和语音识别领
12、域的成果激励下,人们也逐渐开始引入深度学习来做自然语言处理研究,由最初的词向量到2013年word2vec,将深度学习与自然语言处理的结合推向了高潮,并在机器翻译、问答系统、阅读理解等领域取得了一定成功。深度学习是一个多层的神经网络,从输入层开始经过逐层非线性的变化得到输出。从输入到输出做端到端的训练。把输入到输出对的数据准备好,设计并训练一个神经网络,即可执行预想的任务。RNN已经是自然语言护理最常用的方法之一,GRU、LSTM 等模型相继引发了一轮又一轮的热潮。自然语言处理技术的技术层次自然语言处理技术的发展历程语音分析词法分析句法分析语用分析语义分析20世纪70年代 理性主义方法 基于统
13、计的方法20世纪50年代 图灵测试 经验主义方法 基于规则的方法2008 深度学习未来2.自然语言处理技术自然语言处理的研究可以分为基础性研究和应用性研究两部分,语音和文本是两类研究的重点。基础性研究主要涉及语言学、数学、计算机学科等领域,相对应的技术有消除歧义、语法形式化等。应用性研究则主要集中在一些应用自然语言处理的领域,例如信息检索、文本分类、机器翻译等。由于我国基础理论即机器翻译的研究起步较早,且基础理论研究是任何应用的理论基础,所以语法、句法、语义分析等基础性研究历来是研究的重点,而且随着互联网网络技术的发展,智能检索类研究近年来也逐渐升温。近年来,计算机视觉在产业界和学术界不断取得
14、突破,取得代表性成果的组织有谷歌、阿里、百度、搜狗、科大讯飞等公司,清华大学、Allen人工智能研究所等高校/研究所以及其他多种类型的组织或个人。谷歌科大 讯飞2018年谷歌AI团队发布BERT模型,该模型是2018年最火的自然语言处理模型,在模型开源后的短短几个月时间里,已经有学者表示BERT为人工智能的发展带来了里程碑式的意义。2019年6月,CMU与谷歌大脑提出新的NLP训练模型XLNet,该模型在SQuAD、GLUE、RACE等20个任务上全面超越了BERT。科大讯飞早在2016年就推出了全新的深度全序列卷积神经网络(DFCNN)语音识别框架,该框架的表现比学术界和工业界最好的双向RN
15、N语音识别系统识别率提升了15%以上。2019年,讯飞输入法的语音识别准确率已达到了98%,并采用记忆增强的全端到端语音识别模型,开启语音输入“免切换”时代,即中英、粤语和普通话以及离线与在线语音之间不切换直接输入。2019年,百度、搜狗的语音识别的准确率已达到了97%。搜狗更是在2017年底就推出了“黑科技”唇语识别技术,当时针对日常用语的识别就可以达到50%60%的准确率,针对命令词的识别可达到85%90%,较早地做了唇语识别的技术储备。阿里阿里巴巴人工智能实验室推出的天猫精灵是目前全球唯一通过语音识别技术实现声纹购物功能的人工智能产品。2019年前三季度,天猫精灵AI智能音箱销量超104
16、7万台,销量排名在国内第1、世界第3,是全球最大的中文人工智能音箱。百度、搜狗Allen 研究所清华大学清华大学自然语言处理小组开发出THUMT神经机器翻译开源工具包。THUMT 在 Theano 上层实现了标准的基于注意的编码器-解码器框架,并且支持三种训练标准:最大似然估计、最小风险训练和半监督训练。它的特点是有一个可视化工具,演示神经网络和语境单词隐藏态间的关联,从而帮助分析 NMT 的内部工作机制。在中英数据集上的实验显示 THUMT 使用最小风险训练极大的超越了 GroundHog 的表现,它也是 NMT 的一个顶尖工具包。Allen人工智能研究所于2018年年初提出了ELMo(Em
17、beddings from Language Models)模型,提供了从深度双向语言模型(biLM)中学习的单词嵌入思路。该模型主要在大型文本语料库上进行预训练,从而使迁移学习和这些嵌入能够在跨越不同的NLP任务。2018年12月,Facebook开源了自己的NLP建模框架PyText,每天处理超10亿个NLP任务。Facebook更多3.跨媒体分析推理技术以往的媒体信息处理模型往往只针对某种单一形式的媒体数据进行推理分析,比如图像识别、语音识别、文本识别等,而越来越多的任务需要像人一样能够协同综合处理多种形式(文本、音频、视频、图像等)的信息,这就是跨媒体分析与推理。跨媒体是一个比较广义的
18、概念,既表现为包括网络文本、图像、音频、视频等复杂媒体对象混合并存,又表现为各类媒体对象形成复杂的关联关系和组织结构,还表现在具有不同模态的媒体对象跨越媒介或平台高度交互融合。通过“跨媒体”能从各自的侧面表达相同的语义信息,能比单一的媒体对象及其特定的模态更加全面地反映特定的内容信息。相同的内容信息跨越各类媒体对象交叉传播与整合,只有对这些多模态媒体进行融合分析,才能尽可能全面、正确地理解这种跨媒体综合体所蕴涵的内容信息。跨媒体分析推理技术主要包括跨媒体检索、跨媒体推理、跨媒体存储几个研究范畴,可应用于网络内容监管、舆情分析、信息检索、智慧医疗、自动驾驶、智能穿戴设备等场景。近年来,跨媒体分析
19、推理技术在产业界和学术界也不断取得突破。IBM的智能问答系统谷歌利用搜索模式来预测流感的传播情况百度的知识图谱Netflix字节跳动百度知识图谱依托海量的日志数据、互联网数据和垂类数据,综合运用语义理解、知识挖掘、知识整合与补全等技术,提炼出高精度知识,并组织成图谱,进而基于知识图谱进行理解、推理和计算等,帮助人工智能更好地理解和建模客观世界。字节跳动成立于2012年,公司的主要产品“今日头条”“抖音”“tiktok”都是基于数据挖掘技术做个性化推荐引擎的产品,致力于帮助用户在移动互联网上方便快捷地获取最有价值的信息,它会根据用户的兴趣为其推荐内容,这是对传统信息分发方式的一次巨大颠覆。Net
20、flix提供互联网随选流 媒 体 播 放,定 制DVD、蓝光光碟在线出租业务。Netflix解构了几乎所有的电影,用精细、准确的微标签和评级推荐系统去给电影重新分类,形成个性化推荐。4.智适应学习技术作为教育领域最具突破性的技术,智适应学习技术(Intelligent Adaptive Learning)模拟了老师对学生一对一教学的过程,赋予了学习系统个性化教学的能力。和传统千人一面的教学方式相比,智适应学习系统带给了学生个性化的学习体验,提升了学生的学习投入度和学习效率。采用了智适应学习技术的学习系统能够针对学生的具体学习情况提供个性化学习解决方案,包括定位学生的知识漏洞、持续性地评估学生的
21、学习能力水平和知识状态、实时动态提供个性化学习内容。智适应学习技术让教育领域一直困扰的质量、成本、可获取性三大矛盾因素变成了历史。智适应学习技术体系包括知识状态诊断、能力水平评测和学习内容推荐等。知识状态诊断技术是指通过少量试题,在较短时间精准诊断出学生的知识漏洞,这一技术较常用的算法是知识空间理论。能力水平评测技术是指评测出学生的知识掌握情况,分析出学生得到提升的学习能力、学习思维和学习方法,这一技术较常用的算法是项目反应理论、贝叶斯知识追踪。学习内容推荐技术是指依据学生学习情况,推荐合适的学习内容,这一技术较常用的算法是机器学习算法,该算法以学生的所有信息为输入,输出是学生接下来需要学习的
22、内容,达到最大化学习效率的目的。在2010年之后,智适应学习技术得到了快速发展,这背后的推动力有强大的计算力和海量的数据,更重要的还有贝叶斯网络算法的应用。学生知识状态的建立是一件高成本的事,传统模式下判断学生的知识状态需要针对每一个知识点出题考察,有了强大的计算力后,就能够快速模拟出学生的知识状态空间,并且定位到学生的知识状态;海量的数据有助于机器学习算法发挥更大的价值。采用了贝叶斯算法之后,智适应学习系统能够实时持续性地评估学生当前的能力水平、并且及时动态调整学习内容,这在之前是没有实现的。4.智适应学习技术目前在全球已有一亿多学生在使用智适应学习系统,覆盖了各个年龄段,从小学、初中、高中
23、,到高等教育、职业教育和成人教育,已应用到文、理、工、医等不同学科领域。大量学生的使用数据显示,智适应学习系统的教学效果好于传统教学模式。其他学术成果:2018年上半年最新国际学术研究成果,再一次有效验证了智适应学习系统的学习效果优于传统授课。其中,发表在国际知名学术会议International Conference on Learning Analytics&Knowledge上的论文“Studying Adaptive Learning Efficacy using Propensity Score Matching”的研究发现使用智适应系统ALEKS数学课程的学生的课程通过率比未使用A
24、LEKS学生高出15个百分点。人机大战:几年前,美国进行了一系列关于智适应教育的人机大战。在这场人机大战中,智适应教育表现出了三个亮点:采用智适应教育的学生平均分高于接受人工教学的学生成绩,提升效果显著;及格率普遍提升,对基础较差的学生效果尤为明显;学生能够提前完成学习任务,学习效率显著提高。大学:亚利桑那州立大学引进Knewton推出的数学智适应辅助课程后,学生通过率提高了17%,课程退学率降低56%,且45%的学生提前四周完成课程。在东北伊利诺伊大学,运用过Knewton制定的学习计划的学生比没有使用的同学取得了更好的考试成绩。美国雷丁区社区学院中使用Pearson MyMathLab的智
25、适应学习产品的学生,比未使用的学生数学分数高出12.5%。中国:自2014年,以松鼠AI 1对1为智适应领域领军企业、新东方、好未来等公司开始投入智适应领域。其中,松鼠AI 1对1自主研发的智适应学习系统能够模拟教师给孩子一对一量身定做教育方案,并且一对一实施教育过程,比传统教育效率提升5-10倍。松鼠AI 1对1成立实验室,与斯坦福国际研究院(SRI)进行联合技术开发,并且与卡内基梅隆大学(CMU)、中科院自动化所成立了AI智适应教育联合实验室,机器学习教父、CMU前任计算机院长Tom Mitchell教授任其首席AI科学家,CMU计算机及心理学系教授、Cognitive Tutor创办者K
26、en Koedinger任首席学习科学家。小学:佛罗里达州的Wynnebrook学校的小学生每天用Waggle复习准备佛罗里达州统一测试,该校三年级到五年级学生在这次测试中比同地区其他学生表现更优异。迈阿密一所小学的小学生每天用智适应学习系统Waggle复习准备佛罗里达州统一测试,在2015年一次全新的并且难度更大的测试中,该校三年级到五年级学生比同地区其他学生表现更优异,英语和数学学科平均高出10%。中学:City Springs初级中学,是一所非常贫困的公立学校,然而在使用Knewton的Waggle后在学业成绩上有了很大提高。在阅读学科,在NEWA MAP评估测试中,达到预计进步的三年级
27、到八年级学生比例比没有开始Waggle学习的2014年高出25个百分点。在数学学科,除了七年级学生分数预计提高13%,其他年级同学分数均提高超过20%。5.群体智能技术阿里巴巴研究团队提出了一个多智能体双向协调网络BiCNet,智能体可以通过该网络进行交流以达到协同工作的目的,研究中使用暴雪娱乐公司的一款知名战略游戏,模拟游戏中各种单位之间的协同合作。群体智能(collective intelligence)也称集体智能、群智。群体智能是一种共享的智能,是集结众人的意见进而转化为决策的一种过程,用来对单一个体做出随机性决策的风险。对群体智能的研究,实际上可以被认为是一个属于社会学、商业、计算机
28、科学、大众传媒和大众行为的分支学科,研究从夸克层次到细菌、植物、动物以及人类社会层次的群体行为的一个领域。群体智能最早源于对以蚂蚁、蜜蜂等为代表的社会性昆虫的群体行为的研究,自1991年意大利学者Dorigo提出蚁群优化(Ant Colony Optimization,ACO)理论开始,群体智能作为一个理论被正式提出,并逐渐吸引了大批学者的关注,从而掀起了研究高潮。1995年,Kennedy 等学者提出粒子群优化算法(Particle Swarm Optimization,PSO),此后群体智能研究迅速展开。目前群体智能的研究主要包括智能蚁群算法和粒子群算法,智能蚁群算法主要包括蚁群优化算法、
29、蚁群聚类算法和多机器人协同合作系统。其中,蚁群优化算法和粒子群优化算法在求解实际问题时应用最为广泛。随着群体智能算法在诸如机器学习、过程控制、经济预测、工程预测等领域取得了前所未有的成功,它已经引起了包括数学、物理学、计算机科学、社会科学、经济学及工程应用等领域的科学家们的极大兴趣。目前关于群体智能计算的国际会议在全世界各地定期召开,各种关于信息技术或计算机技术的国际会议也都将智能进化技术作为主要研讨课题之一。群体智能的四项原则开放对等共享全体行动群体智能技术的应用案例华为京东阿里华为公司以智能路由器为核心打造了HiLink智能家居生态,与多家顶级家居硬件厂商合作,致力于构建一个协调各种家居智
30、能行为的平台。京东宣布完成全球第一个无人配送而且可以自提的物流站点,该站点能实现全程无人配送中转,无人机将货物送到无人智慧配送站顶部,并自动卸下货物后离开,从入库、包装到分拣、装车,配送,全程由机器人进行操作。6.自主无人系统技术自主无人系统是能够通过先进的技术进行操作或管理而不需要人工干预的系统,是由机械、控制、计算机、通信、材料等多种技术融合而成的复杂系统。自主无人系统可应用到无人驾驶车辆、无人机、服务型机器人、空间机器人、海洋机器人、无人车间、智能工厂等场景中,并实现降本增效的作用。自主性和智能性是自主无人系统最重要的两个特征。人工智能无疑是发展智能无人自主系统的关键技术之一。利用人工智
31、能的各种技术,如图像识别、人机交互、智能决策、推理和学习,是实现和不断提高系统这两个特征的最有效的方法。2018年9月,阿里人工智能实验室团队开发了业界领先的单车智能系统,包括全天候、全场景的厘米级定位,也包括了大规模的仿真平台,每天能够运营上万公里的测试和模拟。2019年12月,百度Apollo自动 驾 驶 开 放 平 台 升 级 到Apollo5.5版本,开放“点到点城市自动驾驶”能力,另外Apollo还全新发布了车路协同、智能车联两大开放平台。国家自然科学基金委员会举办“2019中国智能车未来挑战赛”,比赛相比于前几年,包括无人驾驶智能车真实综合道路环境测试、复杂环境认知水平能力离线测试
32、两部分,以赛促研。2018年7月,沈阳新松发布了蛇形臂机器人,蛇形臂机器人拥有12个关节24个自由度,可以平稳、灵活地避开障碍物,并支持远程遥控,适合核检修、航空航天装配以及狭小领域勘察应用。2019年9月,大疆创新发布了多项产品更新,尤其加强了无人机技术在全球农业市场的应用,包括:精灵4多光谱版无人机、T16 植保无人飞机等。2018年7月,哈工大机器人集团自主研发的爬壁机器人和管道检测机器人亮相第五届中国俄罗斯博览会,该校是我国第一台电焊机器人、弧焊机器人、爬壁机器人、空间机器人、月球车的诞生地。7.智能芯片技术目前,关于智能芯片的定义并没有一个严格和公认的标准。一般来说,运用了人工智能技
33、术的芯片都可以称为智能芯片,但是狭义上的智能芯片特指针对人工智能算法做了特殊加速设计的芯片,现阶段,这些人工智能算法一般以深度学习算法为主,也可以包括其它机器学习算法。智能芯片可按技术架构、功能和应用场景等维度分成多种类别。近年来我国学术界和产业界都加大了对芯片技术的研发力度,国内智能计算芯片技术不断取得新的成果。一些基于传统计算架构的芯片和各种软硬件加速方案相结合,在一些人工智能应用场景下都取得了巨大成功,但由于市场需求的多样性,很难有任何单一的设计和方法能够很好地适用于各类情况。因此,学术界和产业界涌现出多种专门针对人工智能应用的新颖设计和方法,覆盖了从半导体材料、器件、电路到体系结构的各
34、个层次。按技术架构分类按功能分类按应用场景分类GPU(图形处理单元)半定制化的FPGA 全定制化ASIC 神经拟态芯片训练 推断服务器端(云端)移动端(终端)智能芯片的分类智能芯片技术的进展浙江大学和杭州电子科技大学合作研制出了国内首款基于硅材料的支持脉冲神经网络的类脑芯片。清华大学微电子系团队依靠长期积累的可重构计算芯片技术,研发了Thinker芯片,这种芯片基于采用可重构架构和电路技术,突破了神经网络计算和访存的瓶颈,实现了高能效多模态混合神经网络计算。Thinker芯片具有高能效的突出优点,其能量效率相比目前在深度学习中广泛使用的GPU提升了三个数量级。西井科技推出了自主研发的深度学习类
35、脑神经元芯片深井(deepwell)和可模拟5000万级别的“神经元”的类脑神经元芯片深南(deepsouth)产品。中国科学院计算技术研究所的寒武纪公司推出了寒武纪1A处理器(Cambricon-1A),成为全球首款商用深度学习专用处理器,在运行主流智能算法时性能功耗效率大幅超越CPU和GPU,被世界互联网大会评为全球十五项“世界互联网领先科技成果”之一;此后,寒武纪相继发布了面向视觉领域的寒武纪1H8、性能更强的寒武纪1H16,面向智能驾驶领域的寒武纪1M,首款云端智能芯片MLU100。华为发布AI芯片麒麟970,麒麟970选择了高能效的异构计算架构来大幅提升AI算力,特别设计了HiAI移
36、动计算架构。8.脑机接口技术教 育医 疗健康娱乐帮助ICU病人、脑卒中和肌萎缩侧索硬化症等患者与看护者和外界沟通,通过脑控鼠标移动、脑控键盘输入来实现;帮助(高位)截瘫患者恢复取拿物品、喝水等一般自理能力。2014年巴西世界杯上,29岁的截瘫青年Juliano通过脑控外骨骼“机械战甲”成功开球。为传统休闲娱乐产品提供附加值和新卖点、为消费者接触新兴脑科技提供触点,主要通过脑控音乐播放、脑控电子绘画、脑控点灯等实现。脑机接口技术可以通过其对大脑的连接,对大脑施加刺激或根据信号分析对其进行反馈训练,从而达到恢复其功能的目的。比如帮助残疾人通过安装可控的智能化义肢恢复常态生活,帮助自闭症、抑郁症等疾
37、病患者实现行为症状背后脑功能的改善。BrainCo自闭症研究组康谱睿启利用该技术,对自闭症儿童社交动机的改善有效率超过85%(初步试验结果)。能够实现认知负荷、注意力水平、情绪状态等高级思维活动的实时测量,为学习者或教师根据测量结果调整学习策略或教学策略支持。可通过帮助开展学习过程中的脑信号控制,帮助学习者调控自身的情绪、注意力状态,提升学习效果。浙江强脑科技运用神经反馈训练学生认知功能,已积累超过30000名案例,有效改善率达到75%以上。2013年 美国“脑计划”2013年4月,美国奥巴马政府宣布启动美国脑计划,欧盟几乎同时宣布“人脑工程”作为其未来10年的“新兴旗舰技术项目”。2016年
38、 中国“脑计划”在“十三五”国家科技创新规划中,脑科学与类脑研究被列为“科技创新2030重大项目”。自2018年以来,国家先后批准北京、上海、深圳等地成立国家级脑科学研究基地2017年 Facebook“脑打字”Facebook秘密研究团队Building 8首次公布研究成果,希望在2年内实现通过大脑-计算机交互界面、每分钟输出100个单词。2018年 浙江强脑“人工智能义肢”浙江强脑科技推出人工智能义肢,通过识别残疾人的运动意图,控制假肢与钢琴演奏家郎朗四手合奏。拥有6个自由度,可帮助残疾人恢复日常生活80%的运动需要。2019年 马斯克“大脑缝纫机“Neuralink创始人马斯克发布脑机接
39、口系统,可通过一台神经手术机器人向大脑内快速植入大量4-6微米粗细的线,通过 USB-C接口直接读取大脑信号,并可以用 iPhone 控制。脑机接口(Brain-Computer Interface,BCI)是在人或动物脑(或者脑细胞的培养物)与外部设备间建立的直接连接通路。通过单向脑机接口技术,计算机可以接受脑传来的命令,或者发送信号到脑,但不能同时发送和接收信号。而双向脑机接口允许脑和外部设备间的双向信息交换。2013年,自美国首次宣布启动“脑计划”以来,欧洲、日本、韩国等陆续参与“脑科技”竞赛项目,据已公开数据表明,全球在脑机接口相关领域的研发支持已经超过200亿美元。相得益彰:人工智能
40、赋能产业与应用场景/02人工智能技术渗透各产业从产品成熟度视角来看在人工智能技术向各行各业渗透的过程中,不同产品由于使用场景复杂度的不同、技术发展水平的不同,而导致其成熟度也不同。比如,教育和音响行业的核心环节已有成熟产品,技术成熟度和用户心理接受度都较高;个人助理和医疗行业在核心环节已出现试验性的初步成熟产品,但由于场景复杂,涉及个人隐私和生命健康问题,当前用户心理接受度较低;自动驾驶和咨询行业在核心环节则尚未出现成熟产品,无论是技术方面还是用户心理接受度方面都还没有达到足够成熟的程度。教育音响个人助理医疗交通咨询环节拆分核心环节教师教学人机深度互动人机深度互动医生诊疗车辆驾驶复杂事项决策辅
41、助环节练测、教务等人机简单互动人机简单互动购药、支付等车载、维修等信息搜集和整理核心环节成熟产品应具备的功能点规划学习路径,推送学习内容,侦测能力缺陷,预测学习速度聊天陪伴,家居控制,生活O2O服务,消费支付聊天陪伴,预约安排,工作处理判断病因,制定治疗方案判断路况,做出驾驶决策判断问题原因和现状,制定解决方案,预测未来走向成熟产品需要的AI技术人工智能自适应技术语音语义识别技术语音语义识别、深度学习图像识别、自然语言处理、深度学习生物识别、语音语义识别、深度学习等自然语言处理、深度学习等技术成熟度高高中中低低当前有无成熟产品已有成熟产品,如AI老师已有成熟产品,如智能音箱已有初步成熟产品,如
42、个人虚拟助理已有初步成熟产品,如AI医生无成熟产品,如全自动驾驶无成熟产品,如智能顾问当前用户心理接受度 高高中,原因:担心信息安全低,原因:担心误诊误疗低,原因:担心交通事故低,原因:无法产生认同人工智能技术渗透各产业从行业使用率视角来看在人工智能技术向各行各业渗透的过程中,安防和金融行业的人工智能使用率最高,零售、交通、教育、医疗、制造、健康行业次之。安防行业一直围绕着视频监控在不断改革升级,在政府的大力支持下,我国已建成集数据传输和控制与一体的自动化监控平台,随着计算机视觉技术出现突破,安防行业便迅速向智能化前进。金融行业拥有良好的数据积累,在自动化的工作流与相关技术的运用上有不错的成效
43、,组织机构的战略与文化也较为先进,因此人工智能技术也得到了良好的应用。零售行业在数据积累、人工智能应用基础、组织结构方面均有一定基础。交通行业则在组织基础与人工智能应用基础上优势明显,并已经开始布局自动驾驶技术。教育行业的数据积累虽然薄弱,但行业整体对人工智能持重点关注的态度,同时也开始在实际业务中结合人工智能技术,因此未来发展可期。医疗与健康行业拥有多年的医疗数据积累与流程化的数据使用过程,因此在数据与技术基础上有着很强的优势。制造行业虽然在组织机构上的基础相对薄弱,但拥有大量高质量的数据积累以及自动化的工作流,为人工智能技术的介入提供了良好的技术铺垫。组织机构战略与文化数据与技术基础人工智
44、能应用基础可获取的数据量数据积累程度数据储存流程成熟完善数据整洁度数据有良好的记录与说明文档工作流自动化程度对人工智能友好的IT系统应用场景清晰程度AI运用准备的成熟程度部署AI应用的历史经验解决方案供应商情况总分金融零售安防医疗交通制造教育地产通信旅游文娱能源高/强低/弱健康1.安防:安保、警务、治安、人车流监控等场景全面应用人工智能在安防领域的应用场景文卫站点金融站点交通站点公安园区楼宇公务站点重大事件安保 警务 社会治安机场 火车站 路面 银行网点 学校 医院 剧场 政府大楼 检察院 法院 海关 工地 社区 商场 停车场 生物特征识别大数据研判智能监控设备 智能摄像头 智能闸机 智能门控
45、机 智能可穿戴设备 2.金融:以智能风控为主,同时渗透支付、理赔、投研投顾等场景智能支付人脸识别支付指纹识别支付虹膜识别支付声纹识别支付智能理赔智能审核智能定损定价智能支付人脸识别 声纹识别机器学习 深度学习人脸识别 指纹识别智能投研分析文本报告智能资产管理智能风险预警智能搜索推荐智能投顾投后服务资产管理流程引导资产配置风险测试智能风控贷款申请贷款审核贷后监控逾期催款贷前贷中贷后人脸识别 机器学习微表情识别 语音识别 知识图谱 机器学习知识图谱 机器学习语音交互 机器学习人工智能在金融领域的应用场景3.零售:人工智能提升零售全流程运行效率,优化消费者体验以图搜图 智能推荐智能选址 智能识别商品
46、 智能监督 优化商品摆放 客流统计 消费者行为分析拍摄样品 智能质检仓储设计 库存管理 区域划分 运输网络路径优化人工智能在零售领域的应用场景配色参考 图片智能分析最优定价策略设计生产制造收益管理供应链管理电商线下零售4.交通:人工智能应用到拥堵分析、路线优化、车辆调度、驾驶辅助等场景,有效改善交通问题结合地图App、交警微波、视频监控等数据,智能分析并锁定拥堵原因,智能配时调控信号灯、诱导屏等,缓解道路拥堵交通信号灯智能适配智能锁收集定位信息,智能分析热力图,精准预测未来需求,优化调度决策,提升平台运营效率 共享单车调度决策车道偏离预警,疲劳驾驶检测,前车避撞和行人检测预警,夜视辅助,智能车
47、载等 驾驶辅助限定场景自动驾驶、开放场景自动驾驶等 自动驾驶航线网络优化;机组排班优化;客运、货运收益管理;不正常航班恢复等 航空优化人工智能在交通领域的应用场景5.教育:由表及里,人工智能技术逐渐深入学习环节人工智能已在老师教学与学生学习、评测的各个环节切入教育领域,相关产品服务包括拍照搜题、分层排课、口语测评、组卷阅卷、作文批改、作业布置等功能,涉及了自适应、语音识别、计算机视觉、知识图谱、自然语言处理、机器翻译、机器学习等多项人工智能技术,正在创造着更加个性化、服务于终身学习的智能高效学习环境。测评练习、作业 教学辅助教、学 认知、思考最外围学习环节次外围学习环节次核心学习环节最核心学习
48、环节获取学习资料、陪伴、沟通、教务、管理规划学习路径 推送学习内容 侦测能力缺陷 预测学习速度自适应课程应用场景与关键人工智能技术学习环节拍照搜题图像识别陪伴机器人语音交互分层排课智能搜索判断学习态度情绪识别口语测评语音识别组卷阅卷图像识别、自然语言处理作文批改图像识别、自然语言处理作业布置自适应题库虚拟场景展现VR/AR人工智能在教育领域的应用场景6.医疗:从影像分析、辅助诊疗、健康管理等角度做好医患助手虚拟医生 利用自然语言处理、知识图谱、计算机视觉等各种AI技术,综合病人各维度信息及医疗知识进行推理、诊疗病灶识别与标注,减少医生重复性工作;辅助医生降低误诊概率 帮助医生发现更有价值的罕见
49、病状降低发现候选药物所需时长 技术成熟后有望在新药研发领域每年降低280亿美元成本手术机器人、康复类机器人等 提高手术精度健康状态监测、疾病发生预测、全方位管理健康06高效记录医患沟通 助推医疗信息化医疗影像分析身体健康管理综合性诊疗医学药物研发医疗机器人语音录入病历人工智能在医疗领域的应用场景7.制造:助力生产制造优化,减少重复劳动,实现智能制造借助3D视觉技术,通过物体识别、姿态估计、尺寸测量、运动规划等步骤,抓取不规则物体并有序放置3D分拣机器人结合专家经验及智能分析技术,充分挖掘设备运行数据背后的规律,优化工艺生产参数,提升生产效能工艺参数性能优化基于特征分析和机器学习进行设备故障预测
50、和全生命周期管理,实现预测性维修,保证设备始终处于可靠受控状态,大幅降低维护保养费用设备健康管理利用计算机视觉进行产品缺陷检测,降低人工成本,提升产品品质智能质检人工智能在制造领域的应用场景8.健康:降低健康管理成本,实现交互革命,增强人类功能基于计算机视觉和脑信号的分析理解,将脑生理数据、行为表现数据、人类生长规律结合,实现对自闭症、多动症等特殊人群的早期发觉和干预,实现对普遍人群的定制化提升效果。个性化增强人类功能运用VR/AR等虚拟增强技术,结合脑机接口分析技术,为无声群体、交流障碍人群提供更加多维的交互体验,开启新的人机交互革命。变革多维交互体验采用便携式可穿戴智能化设备,检测收集高质