收藏 分销(赏)

人工智能技术的未来发展方向.docx

上传人:二*** 文档编号:4566651 上传时间:2024-09-30 格式:DOCX 页数:5 大小:16.64KB
下载 相关 举报
人工智能技术的未来发展方向.docx_第1页
第1页 / 共5页
本文档共5页,全文阅读请下载到手机保存,查看更方便
资源描述
人工智能技术的未来开展方向 尽管深度学习已经在人工智能领域做出重大贡献,旦这项技术本身仍存在一项缺陷:需要大量数 据的加持。深度学习领域的先驱者乃至批评者已经就此达成共识一一事实上,正是由于可用数据 量有限加上处理大规模数据的计算能力缺乏,才导致深度学习直到最近几年才成为AI层面的前 沿技术。 因此,减少深度学习对数据的依赖性,已经成为AI研究人员最重要的探索方向之一。 在AAAI大会的主题演讲中,计算机科学家Yann LeCun讨论了当前深度学习技术的局限性,同时 提出“自我监督学习’’的开展蓝图一一这是他为解决深度学习数据问题而构建的 路线图。作为 深度学习领域的教父级人物之一,LeCun正是卷积神经网络(CNN)的创造 者,而该网络也成为过 去十年内推动人工智能革命的一大核心因素。 自我监督学习,可谓当前提升人工智能服务器系统数据利用效率的多种尝试之一。目前我们还很 难断言哪种具体尝试能够成功掀起下一轮AI革命(也许我们最终会采取完全不同的政策),但 LeCun的规划与思路仍然值得我们认真了解。 澄清深度学习的局限性首先,LeCun强调称,深度学习技术面对的局限性实际上正是监督学习技术的局限性。所谓监督 学习,属于一类需要对训练数据进行标记才能正常完成学习的算法。例如,如果希望创立图像 分类模型,那么必须为系统提供经过适当分类标记的大量图像,由模型在其中完成充分训练。 LeCun在AAAI主题演讲中提到,“深度学习并不是监督学习,也不只是神经网络。基本 上,深 度学习是将参数化的模块组装到计算图中以构建起ai服务器系统。它的优势在于,我们不需要 对系统进行直接编程一一我们只需要定义架构并调整参数。不过其中需要调整的参数可能多达 数十亿之巨。”LeCun同时补充道,深度学习适用于多种不同学习范式,包括监督学习、强化学习以及无 监督/ 自我监督学习等。 但目前人们对于深度学习以及监督学习的抱怨并非空穴来风。当下,大局部能够实际应用的深度 学习算法都基于监督学习模型,这也充分暴露出现有AI系统的缺点所在。我们口常使用的图像 分类器、人脸识别系统、语音识别系统以及众多其他AI应用都需耍利用数百万个带有标记的示 例进行充分训练。 到目前为止,强化学习与无监督学习只能算是在理论上存在的其他机器学习算法类型,还极少在 实践场景中得到应用。 深度学习当下到底开展到了怎样的水平? 监督深度学习为我们带来多种非常实用的应用方案特别是在计算机视觉与自然语言处理等特定 领域。深度学习已经在癌症检测等敏感应用中扮演越来越重要的角色,而且事实证明,其确实能 够在局部人类无法解决的问题中发挥核心作用。 例如,社交媒体巨头们正纷纷利用这类技术审核并通报用户在平台上发布的大量内容。 LeCun表示,“如果把深度学习元素从Facebook. Instagram以及YouTube等厂商中 剥离出 来,他们的‘业务会瞬间崩溃。事实上,他们的业务完全围绕深度学习构建而成。“但正如前文所述,监督学习只适用于具备充足高质量数据、且数据内容足以涵盖所有可能情况的 场景。一旦经过训练的深度学习模型遇到不同于训练例如的全新状况,它们的表现将彻底失去控 制。在某些情况下,单是从稍有区别的角度展示对象,就有可能令神经网络 将其误判为其他物 体。 深度强化学习那么在游戏与模拟场景中表现出强大能力。过去几年以来,强化学习已经征服了众多 以往浪潮ai服务器智能无法攻克的游戏工程当下,AI程序在 《星际争霸2》、《Dota》以及具有悠久历史的围棋领域将人类顶尖选手杀得片甲不留。 但是,这些AI程序在摸索解决问题的方法方面,与人类完全不同。基本上,强化学习代理就是 一张白纸,我们只为其提供在特定环境中能够执行的一组基本操作。接下来,AI会不断自行尝 试,通过反复试验来学习如何获取最高奖励(例如尽可能在游戏中取胜)。 当问题空间比拟简单,而且我们拥有充足的计算能力以运行更多不断重复的试验性会话时,这 类模型就能正常起效。在大多数情况下,强化学习代理要耗费大量时间以掌握游戏精髓,而巨 大的本钱也意味着这类技术只能存在于高科技企业内部或者由其资助的研究实验室当中。 强化学习系统的另•大短板表达在移动学习方面。如果要游玩《魔兽争霸3》,那么即使是已经精 通了《星际争霸2》的代理,也需要从零开始接受训练。实际上,即使对《星际争霸2》游戏环 境做出一点点微小发动,亦会严重影响AI的实际表现。相反,人类非常擅长从-♦款游戏中提取 抽象概念,并快速将其迁移至新的游戏当中。 强化学习在解决无法准确模拟的现实问题时,同样显示出强烈的局限性。LeCun提到,“如果 想要训练一辆无人驾驶汽车,我们该怎么办?”这类使用场景确实很难准确模拟,因此为了开 发出一台真正具备无人驾驶能力的汽车,“我们恐怕得撞毁很多很多汽车。”而且与模拟环境不同,我们无法在现实场景中快速进行实验,更遑论由现实实验带来的巨大本钱。 深度学习面前的三座大山LeCun将深度学习面临的挑战分为三个具体领域。 首先,我们需要开发出能够利用更少样木或者更少试验学习完成训练的浪潮服务器AI系统。 LeCun指出,“我的建议是使用无监督学习,我个人更倾向于称其为自我监督学习,因为其中用到的算法仍然类似于监督学习,只是监督学习的作用主要在于填补空白。总而言之,在学习任务之前「杀缱播婴茸死揭梦世界” 了二J婴儿或者小动物都是这样成长的。我们首先接触这个世界、理解其运作规律,而后才考虑如何 解决具体任务。只要能看懂这个世界,那么学习新任务就只需要很少的试验与样本量。”婴儿在出生后的前几个月内,会快速建立起关于引力、尺寸与物体性状的概念。 虽然研究人员还无法确定其中有多少属性与大脑建立起硬连接、又存在多少具体认知,但可以 肯定的是,我们人类首先观察周边世界、而后才实际行动并与之交互。 第二项挑战在于构建起具备推理能力的深度学习系统。众所周知,现有深度学习系统的推理与 推理能力相当捉急,因此需要大量数据才能解决那些最简单的任务。 LeCun指出,”问题在于,我们要如何超越现有前馈计算与系统1?我们要如何让推理与基于梯 度的学习方式相兼容?我们要如何在推理中实现差异性?这些都是最基本的问题。”系统1是指那些不需要主动思考的学习任务,例如在区域内导航或者进行少量计算。系 统2那么代表一种较为活跃的思维方式,需要推理能力的支持。作为AI领域的经典方案,象征性人工智能已经在推理与抽象领域带来广受好评的能力提升。 但LeCun并不建议人们广泛采用这些备受科学家推崇的象征性A1或者混合人工智能系统。对于 AI未来的开展愿景,他的思路与另一位深度学习先驱Yoshua Bengio更为接近。他在NeurlPS 2019大会上介绍了系统2深度学习的概念,并在AAAI 2020大会上做 出进一步讨论。但LeCun 也坦言,在实现深度学习系统的推理能力方面,“并不存在一种完美的答案工第三大挑战在于如何建立深度学习系统,确保其能够学习并规划复杂的行动序歹U,进而将任务拆分为多个子任务。深度学习系统擅长为问题提供端到端解决方案,但却很难将其分解为可解释且可修改的特定步骤。目前,业界已经在AI系统对图像、语音及文本的分解方 面取得一定进展,由Geoffry Hinton创造的胶囊网络成功解决了其中一局部难题。 但学习复杂的推理任务仍然远超现有AI的能力上限。LeCun成认,“我们不知道要如何实现这种能力。”自我监督学习自我监督学习的基本思路,是开发出一种能够填补上述空白的深度学习系统。 LeCun解释道,〃我们只需要向此类系统展示输入、文本、视频甚至是图像,而后剔除出其时, 局部,由经过训练的神经网络或者您选定的类或模型预测这些缺失的局部。预测对象可以是视频 内容的后续走向,也可以是文本中缺少的词汇。”目前市面上最接近自我监督学习系统的当数Transformers,这是一种在自然语言处理领 域大放 异彩的架构方案。Transformers不需耍标记数据,它们可以通过维基百科等资料进行大规模非 结构化文本训练。而且事实证明,与之前的同类系统相比,Transformers在生成文本、组织对话 以及建立回复内容方面拥有更好的表现。(但它们仍然无法真正理解人类语言。)Transformers已经相当流行,并成为几乎一切最新语言模型的基础技术,具体包括谷歌的BERT、Facebook的RoBERTa、OpenAI的GPT2以及谷歌的Meena聊天机器 人。 最近,AI研究人员还证明,Transformers能够进行积分运算并求解微分议程一一换言之它已经 展现出解决符号处理问题的能力。这可能暗示着Transformers的开展最终有望推动神经网络突 破模式识别与近似任务统计等传统应用的樊篱。截至目前Transformers已经证明了自己在处理 离散数据(例如单词与数学符号)方面的价值。LeCun指出,“训练这类系统比拟简单,因为虽 然单词遗漏可能造成一定程度的不确定性,但我们可以利用完整词典中的巨大概率矢量来表达 这种不确定性,所以问题不大。”但Transformers还没能将自己的威力引入视觉数据领域。LeCun解释称,“事实证明,在图像与 视频中表达不确定性并做出预测,其难度要远高于文本层面的不确定性表达与预测。这是因为图 像与视频内容并非离散存在。我们可以根据词典生成所有单词的分布情况,但却不可能表达所有 潜在视频帧的分布情况。*对于每个视频片段,都存在着无数种可能的后续情况。这就导致AI系 统很难预测出特定结果,例如视频内接下来几帧所展示的画面。神经网络只能计算出可能结果的 平均值,并据此输出非常模糊的影像。 LeCun指出,〃如果要将自我监督学习应用于视频等多种形式,首先得解决这个核心技术问题。” LeCun个人最偏好的监督学习方法,是所谓“基于能量的潜在变量模型”。其中的核心思路在于 引入一个潜在变量Z该变量用于计算变量X (视频中的当前帧)与预测丫(视频的未来帧)之间 的兼容性,并选择具有最正确兼容性得分的结果。 LeCun也在演讲中进一步阐述了基于能量的模型与自我监督学习的实现方法。 关于深度学习的未来LeCun在AAAI大会的演讲中提到,〃我认为自我监督学习才是未来。这意味着我们的AI系统 与深度学习系统将更上一层楼。也许它们能够通过观察了解关于现实世界的充足背景知识,进 而形成自己的某种常识体系。”自我监督学习的主要优势之一,在于AI能够输出巨大的信息量。在强化学习中,AI系统训练只能由标量级别来决定;模型本身会收到一个数值,用于表示对相关行为的奖励 或 惩罚。在监督学习中,AI系统会为每条输入预测出对应的类别或数值。 但在自我监督学习中,输出那么能够扩展为完整的一幅甚至一组图像。LeCun表示,“信息 会更为丰富。而且只需要更少的样本量,系统就能掌握关于真实世界的更多知识中。”必须成认,不确定性问题的处理方式仍然有待探索;但如果解决方案真正出现,AI技术将迎来通往光明未来的通天大道。 LeCun指出,“如果把人工智能看成一块蛋糕,那么自我监督学习就是糕饼部 分。下一轮AI革命的核心将不在于监督、也不在于纯粹的强化。”
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 通信科技 > 人工智能

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服