1、1从人工智能到智能机器人从人工智能到智能机器人吴玺宏吴玺宏()北京大学信息科学技术学院北京大学信息科学技术学院智能科学系智能科学系中国科学院中国科学院20102010年年6 6月月1010日在京发布日在京发布创新创新20502050:科技革命与中国的未来:科技革命与中国的未来系列报告系列报告,为我国描绘了面向,为我国描绘了面向20502050年科技发展路线年科技发展路线图图时事新闻时事新闻图。图。路线图认为,在今后的路线图认为,在今后的1010年至年至2020年,很有年,很有可能发生一场以可能发生一场以绿色绿色、智能智能和和可持续可持续为特为特征的新的科技革命和产业革命。征的新的科技革命和产业
2、革命。科学意义科学意义科学意义科学意义 基础科学的基本成员,具有重大科学价值和影响力。基础科学的基本成员,具有重大科学价值和影响力。宇宙起源及发展宇宙起源及发展生命起源与进化生命起源与进化基本粒子的性质基本粒子的性质基本粒子的性质基本粒子的性质智能的本质和意识的起源智能的本质和意识的起源巨大的应用前景巨大的应用前景 知识助理知识助理。智能?智能?Question 1:Would you,Question 1:Would you,as a cavemanas a caveman,consider,consider the computer to be intelligent?the comput
3、er to be intelligent?Question 2:Would you,Question 2:Would you,as a intelligence as a intelligence it dtit dtidthttbidthttbscience studentscience student,consider the computer to be,consider the computer to be intelligent?intelligent?Question 3:If Question 3:If I am a robotI am a robot,would you con
4、sider,would you consider me to be intelligent?me to be intelligent?从人工智能谈起从人工智能谈起人工智能:是由人类设计并在计算机上实人工智能:是由人类设计并在计算机上实现的模拟或再现某些智能行为的技术。现的模拟或再现某些智能行为的技术。计算机视觉:物体的三维表面形状、距离、速计算机视觉:物体的三维表面形状、距离、速度等的感知度等的感知度等的感知度等的感知 计算机听觉:噪声环境语音识别、说话人识别计算机听觉:噪声环境语音识别、说话人识别、语种识别、语种识别 计算机思维:符号推理、模糊推理、定理证明计算机思维:符号推理、模糊推理、定
5、理证明人工智能取得巨大进展人工智能取得巨大进展相关学科的进步:人工智能、知识工程、相关学科的进步:人工智能、知识工程、模式识别、机器学习、语言学、心理学、模式识别、机器学习、语言学、心理学、认知神经科学、脑科学认知神经科学、脑科学若干领域取得长足进展人际国际象棋大若干领域取得长足进展人际国际象棋大若干领域取得长足进展:人际国际象棋大若干领域取得长足进展:人际国际象棋大战、语音识别、文本图像和视频搜索、音战、语音识别、文本图像和视频搜索、音视频压缩、机器翻译、人机对话视频压缩、机器翻译、人机对话推动了推动了ITIT产业的发展,其推陈出新的速度让产业的发展,其推陈出新的速度让人应接不暇,以最直接的
6、方式体现了现代人应接不暇,以最直接的方式体现了现代社会发展的速度。社会发展的速度。2思考问题思考问题Which is harder,playing chess or picking Which is harder,playing chess or picking up egg?up egg?How can you measure intelligence?How can you measure intelligence?TuringTuring检验?检验?发展的巨大障碍和瓶颈发展的巨大障碍和瓶颈人机对话人机对话 说话人变化:个体差异、口音、说话方式、情绪状态说话人变化:个体差异、口音、说话方式
7、、情绪状态 噪声干扰噪声干扰口语翻译口语翻译 文本统计对齐文本统计对齐 文本统计对齐文本统计对齐 基于句法树的统计对齐基于句法树的统计对齐图像处理图像处理 vs.vs.视觉计算视觉计算 物体分类、识别物体分类、识别 行为检测和识别行为检测和识别GoogleGoogle搜索搜索 vs.vs.知识搜索知识搜索 概念、知识表示、知识获取概念、知识表示、知识获取Natural language Natural language understandingunderstandingTeaching chessTeaching chessImage understandingImage understan
8、dingLearning to programLearning to programNL front end to databaseNL front end to databasePlaying chessPlaying chessIdentifying zip codesIdentifying zip codesLearning to diagnosis Learning to diagnosis known diseasesknown diseases研究现状分析研究现状分析研究现状分析研究现状分析gpggpgRobot to wash dishesRobot to wash dishes
9、Achievable?Achievable?Robot to distribute mail Robot to distribute mail(mobots)(mobots)All achievableAll achievableWhy?Why?闭集任务闭集任务闭集任务闭集任务vsvs开集任务开集任务开集任务开集任务 “You Cant Play 20 Questions with Nature and“You Cant Play 20 Questions with Nature and Win.”Win.”Allen Newell(Cognitive scientist)Allen Newe
10、ll(Cognitive scientist)正问题正问题 vs.vs.逆问题逆问题 工程方法:脱离人类感知系统的约束,利用一工程方法:脱离人类感知系统的约束,利用一切可行的和实用的技术手段实现。切可行的和实用的技术手段实现。认知信息加工:从分析人类感知系统的机理入认知信息加工:从分析人类感知系统的机理入手,建立起感知过程的计算模型。手,建立起感知过程的计算模型。认知科学认知科学cognitive computer scienceartificial intelligencepsychologyneurosciencecognitive scienceengineeringlinguistic
11、sphilosophybiologyeducation探索人类的智力如何由物质产生和人脑信息加工的过程研究人类的认知和智力的本质和规律认知过程认知过程包括语言、学习、推理、意识乃至情感动机等活动。3感觉(感觉(SensationSensation)感觉是人的感觉器官对来自外部世界的各感觉是人的感觉器官对来自外部世界的各种刺激能量进行检测和编码的过程种刺激能量进行检测和编码的过程 人的信息处理过程起源于外部世界信号的输入人的信息处理过程起源于外部世界信号的输入 外部环境刺激作用于感觉器官,并产生相应的外部环境刺激作用于感觉器官,并产生相应的外部环境刺激作用于感觉器官并产相应的外部环境刺激作用于感
12、觉器官并产相应的神经发放事件神经发放事件五种感觉系统:视觉、听觉、触觉、味觉五种感觉系统:视觉、听觉、触觉、味觉、嗅觉,、嗅觉,提供了与外界环境的交互手段提供了与外界环境的交互手段 现现主要是主要是视觉、听觉和触觉视觉、听觉和触觉“I feel”“I feel”人工视觉 长期 可靠 双向通讯人工听觉知觉(知觉(PerceptionPerception)知觉是大脑对感觉信息的组织和解释,并赋知觉是大脑对感觉信息的组织和解释,并赋以意义。以意义。知觉以感觉为基础,但不是感觉的简单相加知觉以感觉为基础,但不是感觉的简单相加而是对大量感觉信息进行综合加工后形成而是对大量感觉信息进行综合加工后形成,而是
13、对大量感觉信息进行综合加工后形成,而是对大量感觉信息进行综合加工后形成的有机整体。的有机整体。选择性、整体性、理解性、恒常性选择性、整体性、理解性、恒常性知觉组织的格式塔原理:前景知觉组织的格式塔原理:前景-背景、相似背景、相似性、邻近性、连续性、闭合性性、邻近性、连续性、闭合性“I feelsomething smooth,square”“I feelsomething smooth,square”0 500.51Synthesized singing voiceAmplitude0 500.51Original soundAmplitude1234567891011x 104-1-0.5T
14、ime(samples)0.511.522.533.544.55x 104-1-0.5Time(samples)0.511.522.533.544.5x 104-1-0.500.51Original soundTime(samples)Amplitude24681012x 104-1-0.500.51Synthesized singing voiceTime(samples)Amplitude4认知(认知(CognitionCognition)对客体和行为给予表示,进而进行推理、解释,对客体和行为给予表示,进而进行推理、解释,从而达到理解。实现对物体和行为的分类从而达到理解。实现对物体和行为的
15、分类 Visual cognitionVisual cognition Auditory cognitionAuditory cognition Attention and resource allocationAttention and resource allocation Learning/MemoryLearning/Memory Knowledge RepresentationKnowledge Representation Development/use of LanguageDevelopment/use of Language ProblemProblem-solvingsol
16、ving Reasoning/decisionReasoning/decision-makingmaking Cognition and emotionCognition and emotion“Oh!This is a pen”“Oh!This is a pen”5基于环境的生态现实理论基于环境的生态现实理论“The body shapes the brain.”“The body shapes the brain.”“Speech communication shapes the human“Speech communication shapes the human brain.”brai
17、n.”RoboCupRoboCup比赛比赛机器人系统结构机器人系统结构关节式机械系统关节式机械系统变速机构变速机构执行装置执行装置内传感器内传感器机器人模型环境模型工作任务控制器机器人模型环境模型工作任务控制器控制算法控制算法内传感信息内传感信息执行装置执行装置控制算法控制算法环境外传感器环境外传感器任务任务交互作用交互作用外传感信息外传感信息DEEPBLUE vs.DEEPBLUE vs.RoboCupRoboCup环境 状态改变 获取信息 传感器信息 控制方式环境 状态改变 获取信息 传感器信息 控制方式国际象棋国际象棋 静态回合完全符号集中RoboCup 动态实时不完全非符号分布不确定性
18、问题不确定性问题不确定性是物理世界的一个重要特性不确定性是物理世界的一个重要特性环境是动态随机变化的,要求迅速反应环境是动态随机变化的,要求迅速反应传感器获得的是带噪的、不准确的信息传感器获得的是带噪的、不准确的信息机械动作执行不够精确、且能力受限机械动作执行不够精确、且能力受限现有模型简单而不准确,需要在巨大的空现有模型简单而不准确,需要在巨大的空间中搜索间中搜索6不确定性问题不确定性问题机器人不能准确地得到下面的答案机器人不能准确地得到下面的答案 我在哪我在哪?我的胳膊和腿在哪我的胳膊和腿在哪?它们在工作吗它们在工作吗?它们在做什它们在做什我的胳膊和腿在哪我的胳膊和腿在哪它们在作吗它们在作
19、吗它们在做什它们在做什么么?我刚在做什么了我刚在做什么了?如果我做了如果我做了X X,后果是什么,后果是什么?你是谁你是谁?你在哪你在哪?你在做什么你在做什么?等等等等挑挑 战战核心挑战:研究机器人能够在核心挑战:研究机器人能够在非结构非结构、动态动态、部分观测部分观测和和不确定不确定的环境下的环境下自主自主地完成任地完成任务务。自主自主:无人工干预情况下,自己完成决策无人工干预情况下,自己完成决策自自无人干预情况下自完成决策无人干预情况下自完成决策 非结构非结构:环境未知,非特殊设计环境未知,非特殊设计 动态动态:环境发生非预期的改变环境发生非预期的改变 部分观测部分观测:无法对环境的完整信
20、息进行感知无法对环境的完整信息进行感知 非确定:非确定:传感器信息和动作执行存在噪声传感器信息和动作执行存在噪声学习和自适应学习和自适应学习的好处:学习的好处:学习的好处:学习的好处:降低机器人系统设计的复杂性降低机器人系统设计的复杂性降低机器人系统设计的复杂性降低机器人系统设计的复杂性 使得机器人随环境动态自适应使得机器人随环境动态自适应使得机器人随环境动态自适应使得机器人随环境动态自适应学习的方式学习的方式增强学习增强学习:使用奖惩作为反馈控制使用奖惩作为反馈控制 神经网络神经网络 进化学习进化学习从过去的经验学习实例学习和多实例学习从过去的经验学习实例学习和多实例学习从过去的经验学习:实
21、例学习和多实例学习从过去的经验学习:实例学习和多实例学习归纳学习归纳学习:从多个实例中归纳出概念和规则从多个实例中归纳出概念和规则解释学习:使用特定领域的知识帮助学习解释学习:使用特定领域的知识帮助学习多策略学习多策略学习:多种学习方法竞争多种学习方法竞争以增强学习系统为例以增强学习系统为例ControllerControlledSystemReinforcementConventional feedbackCriticReinforcement增强学习示例数值学习数值学习归纳学习归纳学习连续在线学习连续在线学习奖励和惩罚奖励和惩罚机器人近期研究的四个目标机器人近期研究的四个目标2 2岁孩子的
22、目标识别能力。“岁孩子的目标识别能力。“chairchair”4 4岁孩子的语言能力。“语法”岁孩子的语言能力。“语法”6 6岁孩子的动手能力。“系鞋带”岁孩子的动手能力。“系鞋带”8 8岁孩子的社会环境理解能力。“环境”“岁孩子的社会环境理解能力。“环境”“角色”角色”7领域知识领域知识(NBIC及其邻近学科,包括语言学、语音学、视觉、听觉语言学、语音学、视觉、听觉.)合理的知识结构对同学的寄语对同学的寄语理论及模型理论及模型认知科学基础认知科学基础数学、物理方法数学、物理方法(数字信号处理,概率统计、机器学习(数字信号处理,概率统计、机器学习)Any questions?Any questions?y qy q