1、中国人工智能系列白皮书 中国中国人工智能系列人工智能系列白皮书白皮书 -人工智能人工智能原理原理 中国中国人工智能学会人工智能学会 二二二二三年年九九月月 中国人工智能系列白皮书 2 前言前言 人工智能技术的发展与成功应用已经成为 21 世纪科技领域最大的新现象。然而,科学地理解人工智能原理已经超出了现有科学体系的范畴。显然,人工智能是人类科学技术发展的必然结果,人工智能科学也将是人类科学进步与发展必然实现的目标。破解人工智能的科学和技术障碍是人类科学技术发展绕不开也跨不过的重大前沿课题,并且已经凸显为人类 21 世纪首先需要突破的问题。人工智能的科学与技术突破需要新的科学思想;人工智能本身是
2、一个多学科交叉融合的科学现象,人工智能必然与若干主要的学科实质相关;人工智能技术开始于 20 世纪中叶,已经经历了几个重要的发展阶段,推动人工智能作为一个重大挑战走到 21 世纪的科学前沿。本白皮书顺应并体现人工智能的上述现状,由人工智能基础专委会负责组织。具体编写组织如下:北京航空航天大学、中关村国家实验室李昂生教授撰写了人工智能总论,分析了人工智能的重大科学问题,和其它学科的边界,论述了人工智能原理的总体框架和主要构成部分。吉林大学杨博教授撰写了符号主义人工智能以总结基于逻辑推理的人工智能的成就、问题与未来展望。中国科学技术大学彭攀教授和陈雪博士撰写了大数据算法与可信计算理论以总结基于计算
3、的智能研究成果,分析计算与智能这两个概念的实质、关系与边界。中南大学冯启龙教授撰写了难解问题的智能算法,以总结在困难问题智能算法求解方面的成就,分析困难问题的实质,展望智能算法在困难问题求解方向的前景。中国人工智能系列白皮书 3 中国科学院计算技术研究所陈薇研究员撰写了神经网络的数学原理以总结深度神经网络学习理论方向的成就、问题和未来展望。天津大学金弟教授撰写了神经网络的计算原理以总结神经网络作为计算模型方向的成就、问题和未来展望。中国人民大学祁琦教授和王子贺博士撰写人工智能的博弈理论以总结智能的博弈途径研究的成就、问题和未来展望。南京大学姚鹏晖教授撰写了量子人工智能以总结基于量子物理的人工智
4、能方向研究的成就、问题和未来展望。李昂生教授撰写了白皮书的其余章节,包括信息定律与信息模型,信息演算理论,(观察)学习的数学理论,自我意识的数学理论,博弈/谋算理论,人工智能信息模型,这些内容是李昂生创建的信息世界的数学原理中的主要科学思想和基本科学原理的简单介绍;在信息时代的科学双引擎和信息时代重大科学问题一章,李昂生提出了信息时代的几个重大科学问题。本白皮书的内容包括了:智能作为一个科学概念的模型、原理与方法;智能与推理、计算、通信、博弈等科学概念的实质关系与边界界定;智能与数据、数学、物理、生物的实质关系与边界界定;智能技术的工程原理与方法等。这些内容构成了本白皮书人工智能原理的五大部分
5、:第一部分 人工智能总论 由李昂生教授的人工智能总论构成。第二部分 逻辑推理人工智能和计算智能 由杨博教授的 符号主义人工智能,彭攀教授和陈雪博士的 大数据算法与可信计算理论 和冯启龙教授的 难解问题的智能算法等三章构成。中国人工智能系列白皮书 4 第三部分 神经网络人工智能和生物人工智能 由陈薇研究员的神经网络的数学原理和金弟教授的神经网络的计算原理两章构成。第四部分 数学人工智能和物理人工智能 由祁琦教授和王子贺博士的人工智能的博弈理论和姚鹏晖教授的量子人工智能两章构成。第五部分 信息主义人工智能:层谱抽象认知模型人工智能 由李昂生教授的信息定律与信息模型,信息演算理论,(观察)学习的数学
6、理论,自我意识的数学理论,博弈/谋算理论,人工智能信息模型,和信息时代的科学双引擎和信息时代重大科学问题等章构成。白皮书的第一部分分析了人工智能的根本科学问题,揭示了人工智能科学是人类科学技术发展的必然结果,分析了人工智能科学是现有科学体系所不足于支撑的重大科学问题;第二、第三和第四部分主要是基于分而治之这一物理世界分析方法科学体系的人工智能原理;第五部分是李昂生创建的层谱抽象认知模型这一信息世界科学范式的数学原理及基于这个新科学原理的人工智能原理。本白皮书第五部分揭示了信息是建立智能科学的钥匙;揭示了层谱抽象是人认知世界、感知认知自我的模型与方法;揭示了信息世界的层谱抽象认知模型、原理与方法
7、;揭示了层谱抽象认知模型与分而治之分析方法结合是建立人工智能科学的总方法,这一总方法恰好就是 2500 多年以前,孙子兵法的核心科学思想:谋算,谋就是层谱抽象,算就是分而治之;揭示并建立了人工智能的数学实质与基本科学原理;提出人工智能的智能论断智能论断(Intelligence Thesis):智能智能=信息信息;揭示了层谱抽象认知模型与分而治之分析方法构成了信息时代的科学双引擎。中国人工智能系列白皮书 5 目 录 目 录.5 第一部分.1 人工智能总论.1 第 1 章 人工智能总论.2 1.1 人工智能的科学思想起源.2 1.2 人工智能的数理逻辑原理.5 1.3 人工智能的计算原理.7 1
8、.4 图灵对机器智能的研究.9 1.5 人工智能研究的兴起.11 1.6 符号主义人工智能.11 1.7 连接主义人工智能.12 1.8 行为主义人工智能.14 1.9 人工智能的数学、物理挑战.15 1.10 人工智能的重大科学挑战.15 1.10.1 数学、物理对象的可分性.15 1.10.2 信息世界对象的不可分性.16 1.10.3 信息世界对象的可定义性问题.17 中国人工智能系列白皮书 6 1.10.4 人学习的基本问题.17 1.10.5 自我意识的基本问题.18 1.10.6 博弈/谋算的基本科学问题.18 1.10.7 本节小结.19 1.11 信息科学重大挑战性问题.19
9、1.11.1 经典信息论.19 1.11.2 生成策略.21 1.11.3 解码策略.23 1.11.4 信息的模型.24 1.11.5 信息基本定律.25 1.11.6 信息科学是什么?.25 1.11.7 信息的数学理论是什么?.26 1.12 信息科学原理.26 1.13 本章小结.27 第二部分.29 逻辑推理人工智能与计算人工智能.29 第 2 章 符号主义人工智能.30 2.1 命题知识表示与推理.30 中国人工智能系列白皮书 7 2.1.1 命题逻辑.31 2.1.2 命题推理问题.33 2.1.3 命题可满足性求解方法.34 2.1.4 模型计数.35 2.1.5 知识编译.3
10、7 2.2 自动定理证明.38 2.2.1 自动定理证明的起源、发展与现状.38 2.2.2 Herbrand 定理.41 2.2.3 合一与匹配.43 2.2.4 归结原理.44 2.2.5 归结原理的改进策略.46 2.2.6 等词推理.48 2.2.7 几何定理证明和数学机械化.50 2.2.8 定理证明器竞赛和著名定理证明器.51 2.3 约束可满足性求解.52 2.4 基于模型的诊断.56 2.4.1 MBD 问题.57 2.4.2 国内外总体研究现状.58 中国人工智能系列白皮书 8 2.5 神经符号系统.59 2.5.1 神经符号系统的背景.59 2.5.2 神经符号系统研究现状
11、.61 2.5.3 神经符号系统的挑战及未来研究方向.64 第 3 章 大数据算法与可信计算理论.67 3.1 大数据算法计算模型.67 3.1.1 亚线性时间算法.68 3.1.2 亚线性空间算法.69 3.1.3 动态图算法.70 3.1.4 大规模并行计算.70 3.1.5 数据降维.71 3.2 满足可信需求的算法.71 3.2.1 鲁棒性.71 3.2.2 公平公正.73 3.2.3 隐私保护.73 第 4 章 难解问题的智能算法.75 4.1 难解问题图学习方法求解.78 4.1.1 路径规划问题.81 中国人工智能系列白皮书 9 4.1.2 最大割问题.84 4.1.3 作业调度
12、问题.85 4.1.4 其他难解问题.86 4.2 难解问题强化学习求解.87 4.2.1 基于无模型的强化学习方法.88 4.2.2 基于有模型的强化学习方法.92 4.3 总结与展望.94 第三部分.98 神经网络人工智能与生物人工智能.98 第 5 章 神经网络的数学原理.99 5.1 神经网络的背景及意义.99 5.1.1 神经网络的发展历史.99 5.1.2 神经网络对人工智能发展的作用.100 5.1.3 神经网络给人工智能带来的挑战.101 5.2 神经网络的数学原理的内涵.102 5.2.1 研究意义.102 5.2.2 分析视角.103 5.2.3 基本框架.104 中国人工
13、智能系列白皮书 10 5.2.4 研究趋势.106 5.3 神经网络的传统理论.106 5.3.1 表达能力.107 5.3.2 泛化能力.107 5.3.3 优化能力.107 5.4 前沿发展.108 5.4.1 对自适应优化器的分析.108 5.4.2 基于神经网络结构的优化分析.108 5.4.3 优化器的隐式正则分析.108 5.4.4 神经网络的精确泛化估计.109 5.4.5 表示所需参数量下界.109 5.5 未来展望.109 5.5.1 设计适用不同场景的安全性度量.109 5.5.2 构建以安全为中心的神经网络理论.110 5.5.3 发展可信可控的神经网络模型.110 第
14、6 章 神经网络的计算原理.111 6.1 经典神经网络的计算原理.112 6.1.1 表示学习.112 中国人工智能系列白皮书 11 6.1.2 前馈神经网络.116 6.1.3 神经网络训练.119 6.2 面向序列数据的神经网络.123 6.2.1 循环神经网络 RNN.124 6.2.2 转换器 Transformer.127 6.2.3 时序卷积神经网络 TCN.132 6.3 图神经网络.134 6.3.1 图表示学习.135 6.3.2 图神经网络的基础原理.137 6.3.3 图神经网络前沿.139 第四部分.158 数学人工智能与物理人工智能.158 第 7 章 人工智能的博
15、弈理论.159 7.1 均衡计算.160 7.1.1 纳什均衡.160 7.1.2 纳什均衡的存在性.162 7.1.3 纳什均衡的计算.165 7.1.4 纳什均衡的计算复杂性.170 中国人工智能系列白皮书 12 7.2 人工智能中的合作博弈.174 7.2.1 合作博弈.175 7.2.2 合作博弈的表示和算法.180 7.2.3 合作博弈在多智能体系统中的应用.182 7.2.4 结论.184 7.3 公平分配.184 7.3.1 引言.185 7.3.2 模型定义.186 7.3.3 公平性.187 7.3.4 可分割物品的公平分配.191 7.3.5 不可分物品的公平分配.193
16、7.3.6 其他研究.195 7.4 适当评分规则(Proper Scoring Rule).196 7.4.1 适当评分规则的起源.198 7.4.2 适当评分规则种类.198 7.4.3 适当评分规则的应用.204 7.4.4 总结.206 7.5 社会选择与投票.206 中国人工智能系列白皮书 13 7.5.1 经典投票规则.207 7.5.2 社会选择中的经典结论.211 7.5.3 总结.214 7.6 重复拍卖.215 7.6.1 动态定价问题.215 7.6.2 上下文动态定价问题.218 7.6.3 重复拍卖中的均衡分析问题.221 7.6.4 总结.222 7.7 小结.22
17、2 第 8 章 量子人工智能.224 8.1 概述.224 8.2 量子学习方法介绍.224 8.2.1 HHL 算法.224 8.2.2 量子奇异值变换.228 8.3 量子吉布斯采样.231 8.2.4 变分量子电路.234 8.3 量子学习应用场景.240 8.3.1 传统机器学习问题的量子化.240 中国人工智能系列白皮书 14 8.3.2 量子无监督学习.247 8.3.3 量子有监督学习.253 8.3.4 量子强化学习.259 8.3.5 量子层析.266 8.3.6 其它量子学习算法.267 第五部分.272 信息主义人工智能:.272 层谱抽象认知模型人工智能.272 第 9
18、 章 信息定律与信息模型.273 9.1 信息科学的研究对象.273 9.2 物理世界对象基本定律(Fundamental Law of Physical Objects).273 9.3 信息性质/知识的定义.274 9.4 现实世界对象的物理性质与信息性质.275 9.5 策略.276 9.6 信息的模型.277 9.7 学习的数学实质.278 9.8 知识是信息在某一个模型下的解释.279 中国人工智能系列白皮书 15 9.9 抽象.279 9.10 层谱抽象.281 9.11 科学范式定律.283 9.12 个体定律.284 9.13 信息定律.285 9.14 运动定律.287 9.
19、15 竞争定律.287 9.16 认知模型定律.288 9.17 观察定律.289 9.18 知识表示定律.290 9.19 知识定律.291 9.20 规律的定义.292 9.21 创造策略.292 9.22 学习的可解释性原理.293 9.23 自我意识定律.293 9.24 系统定律.293 9.25 本章总结.294 第 10 章 信息演算理论.296 中国人工智能系列白皮书 16 10.1 信息系统的数学表示.296 10.2 一维结构熵.299 10.3 信息系统的编码树.299 10.4 在一个层谱抽象策略下的结构熵.300 10.5 信息系统的结构熵.301 10.6 结构熵极
20、小化原理.302 10.7 解码信息.303 10.8 层谱抽象策略的压缩信息.304 10.9 压缩/解码原理.304 10.10 层谱抽象解码原理.305 10.11 层谱抽象可定义性.306 10.12 层谱抽象.307 10.13 基于结构熵的推理演算.308 10.14 基于解码信息的推理.310 10.15 推理的数学理论.311 10.16 信息生成原理.312 10.17 解码信息原理.313 10.18 本章总结.314 中国人工智能系列白皮书 17 第 11 章(观察)学习的数学理论.316 11.1 先验认知模型.317 11.2 观察的数学实质.317 11.3 学习的
21、数学定义.319 11.4 人的先验分析方法.320 11.5 学习的主体与客体.321 11.6 学习的目的、目标.321 11.7 知识的定义.321 11.8 规律的定义.322 11.9 学习过程表示:层谱抽象.322 11.11 学习的数学模型.324 11.11 创造策略的理解与实现.326 11.12 局部观察学习.328 11.13 全局观察学习.330 11.14 学习模型中的生成策略与生成原理.331 11.15 学习模型中的解码策略与解码原理.331 11.16 知识树.331 11.17 知识的一致性准则.332 中国人工智能系列白皮书 18 11.18 知识的度量.3
22、33 11.19 知识演算推理.334 11.20 学习的极限.337 11.21 学习的数学理论总结.338 第 12 章 自我意识的数学理论.341 12.1 自我意识体的先验感知模型.343 12.2 自我意识体的可定义性.345 12.3 自我意识体五维认知.347 12.4 自我意识的数学实质.349 12.5 生命定律.350 12.6 自我意识体的基本性质.352 12.7 自我意识论断.353 12.8 领土/领地意识.353 12.9 自我意识学习.354 12.10 自我意识体的层谱抽象认知.355 12.11 自我意识体的认知熵.356 12.12 自我意识体的认知信息.
23、357 12.13 自我意识体的内结构熵.358 中国人工智能系列白皮书 19 12.14 自我意识体的外结构熵.358 12.15 自我意识体的外解码信息.359 12.16 自我意识体的层谱抽象感知.359 12.17 自我意识理论总结.361 第 13 章 博弈/谋算理论.363 13.1 博弈的基本定义.363 13.2 竞争定律.365 13.3 现实世界博弈的可能结局.366 13.4 博弈的系统原理.368 13.5 现实世界博弈的基本规律.369 13.6 孙子模型.369 13.7 孙子兵法的核心科学思想:谋算.372 13.8 博弈中的学习.375 13.9 博弈中的自我意
24、识学习.378 13.10 力量的系统生成原理.379 13.11 威胁度量.380 13.12 必胜策略原理.382 13.13 博弈策略的信息科学原理.383 中国人工智能系列白皮书 20 13.14 博弈策略的数理原理.384 13.15 博弈设计原理.385 13.16 博弈的收益原理.386 13.17 博弈系统中玩家的定义.388 13.18 博弈中学习与自我意识学习的正确性与可解释性.389 13.19 博弈结局的层谱抽象定义.391 13.20 博弈获胜的主客观一致性准则.394 13.21 博弈中的谋算策略.396 13.22 博弈/谋算理论总结.398 第 14 章 人工智
25、能的信息模型.399 14.1 智能的定义(非形式化).399 14.2 人类智能模型.400 14.3 人类智能的信息科学原理.402 14.4 人工智能的科学原理.402 14.5 人工智能模型.403 14.6 智能的数学定义:智能论题.404 第 15 章 信息时代科学双引擎与信息时代重大科学问题.406 15.1 数学中的三个基本问题.407 中国人工智能系列白皮书 21 15.2 物理中的两个基本问题.408 15.3 生命科学的三个基本问题.409 15.4 信息时代的科学双引擎.410 参考文献.412 1 符号主义人工智能:第 2 章参考文献.412 2 难解问题的智能算法:
26、第 4 章参考文献.433 3 神经网络的计算原理:第 6 章参考文献.448 4 人工智能的博弈理论:第 7 章参考文献.459 7.1 节参考文献.459 7.2 节参考文献.460 7.3 节参考文献.464 7.4 节参考文献.467 7.5 节参考文献.468 7.6 节参考文献.470 5 量子人工智能:第 8 章参考文献.472 6 人工智能的信息科学原理:第 1 章、第 9-15 章参考文献.491 中国人工智能系列白皮书 1 第一部分 人工智能总论 中国人工智能系列白皮书 2 第 1 章 人工智能总论 1.1 人工智能的科学思想起源 人工智能已经凸显为 21 世纪的重大科学挑
27、战。这一现象本身就已经说明人工智能是科学发展在 21 世纪的必然而且自然的结果。因此,人工智能的科学障碍正是 21 世纪的重大前沿科学问题。科学是人类在认识世界、认知自我、改造世界、改造自我的过程中产生的对现实世界的知识发现、规律揭示以及基于知识与规律的创造。科学研究的对象是现实世界的对象。对现实世界对象的科学研究的第一步是现实世界对象的表示,这也是对现实世界对象的抽象表示。数与形是现实世界对象的基本属性。因此,数与形就构成了现实世界对象的基本数学表示。经典数学研究数与形的基本规律。数与形的基本规律提供了研究现实世界对象的基础。因此,数学就是现实世界对象研究的基础。公理化的思想使得数学可以建立
28、严格的数学理论。公理化体系是公理化数学的规范化体系,它解决了“形”这个不太容易建立规则的对象的公理化体系。公理化数学已经成为数学研究的范式。数学定理就是基于公理的推理的结果。因此,推理就是数学研究的基本策略,它包括一些基本推理规则。然而,推理这一概念并没有一个数学定义。而且人的推理中还包含或隐含了人的直观。人的推理包括逻辑推理、直觉推理以及逻辑推理与直觉推理的结合。然而长期以来,一直没有一个推理的数学定义,更没有一个逻辑推理和直觉推理的数学定义。但是人们实际上是清楚的,人有直觉推理。而且第三次数学危机中国人工智能系列白皮书 3 就在于数学家们发现,很多的数学证明依赖于人的直观,这使得数学家开始
29、怀疑:是否在已经建立的数学证明中隐含了不可靠的直观?如果是这样,数学就是建立在“沙滩”上了。这就是第三次数学危机。怎样避免人的直观造成数学证明的不可靠?公理化数学的边界在哪里?为了回答这两个问题,Hilbert 1900 年提出一个计划,数学史上称为 Hilbert 计划。该计划提出数学证明的形式化方法,并猜想一切真的命题都是可证明的。Hilbert 要求的证明是一种排除直观的完全基于规则的“证明”,即后来人们熟知的形式化证明。Hilbert 计划的第一个问题是:给(形式化)证明这一概念一个数学定义。以Godel为代表的一批数学家给出了形式化证明的数学定义,建立了数理逻辑新学科,并用构造性方法
30、构造了一个数学命题,使得 和 的否定命题 都是不可证明的。从语义上来说,对任何数学命题,该命题和它的否定命题必然有一个是真的。这就是Godel 1930 年代的不完全性定理,即:在一个适当复杂的公理系统中,必然存在不可证明的真命题。Godel 不完全性定理彻底否定了 Hilbert 一切真命题均可证明的猜想。数理逻辑中定义一个证明就是一个基于公理和推理规则的序列。证明的这一定义完全排除了证明过程中任何可能的直观的因素。基于这一定义的数学,即数理逻辑,恰好就是逻辑推理的数学理论,完美地实现了 Hilbert 计划所要求的证明的形式化。因此,数理逻辑给出了逻辑推理的数学定义,建立了逻辑推理的数学理
31、论。与此同时,数理逻辑完全排除了直觉推理。可以肯定的是直觉推理是人的基本推理方式,可以肯定的是没有一个重要的数学定理不是中国人工智能系列白皮书 4 数学家们直觉推理的结果。长期以来一直没有一个直觉推理的数学理论(这是 20 世纪未能解决的问题,也是 21 世纪凸显的一个科学问题,不解决这个问题,不可能理解学习是什么意思。)Hilbert 的猜想是不对的,但是,这不影响 Hilbert 计划的意义。因为正是有 Hilbert 计划,才有了Godel 后来数理逻辑的研究。进一步,Turing 1936 年提出了通用 Turing 机模型,给“计算”这一概念一个数学定义与数学模型。Turing 19
32、36 的文章基于通用 Turing 机模型,证明了存在不可计算函数。由于计算也是一种逻辑推理,Turing 的通用 Turing 机也否定了 Hilbert 的猜想。Turing 1936 年提出通用 Turing 机模型的动机是为了否定 Hilbert猜想。Hilbert 1900 年计划的实质是“证明”与“计算”这两个概念的数学定义是什么?Godel 1930 年代对基于逻辑推理的证明给出了一个定义;Turing 1936 年给出了计算这一概念的数学定义。(在数学、乃至科学意义上的“证明”这一概念的数学定义仍然是一个重大的科学问题,是Godel 不曾解决的问题,也是 21 世纪需要回答的科
33、学问题。)显然,在Godel 和 Turing 之前,证明与计算这两个概念还没有严格的数学定义,仍属于哲学概念。证明和计算是数学研究的基本概念,当然也是人的智力活动的基本概念,是人工智能的基本概念。Hilbert 的猜想不对,然而 Hilbert 计划提出了当时的一个重大科学问题,引出了后来的数理逻辑和计算理论,成为 20 世纪科学革命的主要动力。正是由于这个原因,Hilbert 计划的意义远大于 Hilbert 1900 年提出的 23 个问题,这些问题,每一个都对一个方向很重要,但是所有问题合起来也仅在数学领域有意义,在其它学科影响有限。然而中国人工智能系列白皮书 5 Hilbert 计划
34、是对整个 20 世纪科学技术产生革命性影响的问题。人工智能已经凸显为 21 世纪的重大科学挑战。然而破解人工智能科学挑战的钥匙和关键科学思想是什么?理解学习、智能和人工智能等概念的钥匙是正确地理解信息这一科学概念。信息是破解人工智能科学挑战的钥匙。Shannon 1948 年提出度量嵌入在一个随机变量中的不确定性的熵的概念,提出在端到端信道传输中,收方消除的发送方的不确定性的量,即互信息的概念,证明了当互信息适当大时,存在一个解码器,根据收方数据解码出发送方所要传输的数据的通信原理,建立了通信的数学理论。第一次提出了信息的概念。然而 Shannon 信息论里面的信息仅限于作为一个通信概念。显然
35、,信息是一个科学概念,而不仅仅是一个通信概念。李昂生建立了作为科学概念的信息的基本原理与理论,提出了层谱抽象认知模型(或者,称为,认知方法),建立了层谱抽象这一方法论的数学理论。信息世界的层谱抽象认知模型和物理世界的分而治之的分析方法,相结合就是破解人工智能科学障碍的模型、原理与方法。本白皮书第十一、第十二和第十三章将建立这一人工智能科学原理。这一科学原理的思想可以追溯到 2500 多年以前,中国科学与军事科学祖师孙武的孙子兵法。层谱抽象认知方法和分而治之分析方法相结合的人工智能原理正是 孙子兵法 的核心科学思想:“谋算”,这里“谋”就是层谱抽象,“算”就是分而治之。1.2 人工智能的数理逻辑
36、原理 Hilbert 1900 年提出 Hilbert 计划的时代背景是第三次数学危机,人们突然发现或意识到数学并没有建立在一个可靠的基础之上。原因在于数学中最通常的概念“证明”和“推理”并没有一个数学定义。中国人工智能系列白皮书 6 Hilbert 计划的目的与动机是为数学建立一个可靠的基础。数理逻辑建立了逻辑推理的规则,给出了基于逻辑推理的证明的数学定义,从而建立了逻辑推理系统,作为公理化数学的公共基础,建立了数学的基础。数理逻辑第一次把“逻辑推理”这一人的推理方法用数学规则来实现了,从而把曾经认为的只有人才能做的“逻辑推理”用数学规则实现了。数学规则显然可以由算法来实现,因此逻辑推理可以
37、由算法来实现。这就意味着算法可以实现人的逻辑推理。这就是人工智能的数理逻辑原理。数理逻辑还建立了后来的计算机科学三大支柱之一的计算机程序理论的数学原理。(程序理论、计算理论和体系结构原理正是计算机科学的三大支柱理论,支撑着整个计算机科学大厦。)基于逻辑推理的定理机器证明正是第一代人工智能的典型代表。数理逻辑,特别命题逻辑中的一些基本问题还提供了新的算法问题,及研究算法复杂性的经典问题,例如第一个NP完全性问题,SAT问题。数理逻辑系统的分析方法,即系统的完备性(completeness)和可靠性(soundness),还提供了计算机程序分析的一般方法。扩充或变种的各种应用逻辑,比如非单调逻辑提
38、供了基于逻辑推理的常识推理,成为第一代人工智能的重要组成部分。数理逻辑揭示了一个逻辑推理有一个语法(syntax)和一个语义(semantic),语法指按规则的推理过程,语义指该推理过程的数学意义,即真、假值。一个正确的推理必然要求语法和语义的一致性。推理的可靠性(soundness)要求符合推理规则的推理结果是正确的(即,真的),推理的完备性(completeness)要求真的一定能按推中国人工智能系列白皮书 7 理规则证明,即推出来。一个逻辑系统的基本要求是可靠性,即推出来的结论一定是正确的(或真的)。基本的逻辑系统同时还要求满足完备性。然而在一个适当复杂的数学系统,例如算术系统中,存在一
39、个命题,使得和的否定,均不可证明。然而和 A 的否定 必然有一个是真的。因此,存在真的命题,它不可证明。这就是deloG 不完全性定理所揭示的结论。在deloG 不完全性定理中,是否“可证”是语法问题,真或者假是语义问题。不完全性定理的实质是:语法和语义的不一致性,即,一个适当复杂的数学系统必然有:语法和语义的不一致性。这里面的一个根本问题是仅仅基于逻辑推理的证明的概念是不充分的(第十五章将把这个问题作为信息时代的重大科学问题之一提出)。基于数理逻辑的人工智能是人工智能的一个重要方向,即符号主义人工智能,其使命是揭示,逻辑推理在人工智能中的作用与极限。1.3 人工智能的计算原理“计算”是人类的
40、一个基本智能活动。Turing 1936 年的 Turing 机,特别是通用 Turing 机给出了计算这一概念的数学定义和数学模型。计算这一概念有很多属性。然而计算的根本属性是机械性,即计算的每一步动作都是机器可执行的。这就是计算这一概念的实质。Turing 机模型揭示了计算概念的这一实质。Turing 机执行的任何一个步骤都是:(1)指向一个位置;(2)改变一个符号;(3)改变一个状态;(4)左移一格或者右移一格。中国人工智能系列白皮书 8 计算的实质:计算的实质:计算的每个动作都是机器可执行的。因此,计算可以由机器来实现。一个 Turing 机就是一个机器的数学模型,它能实现一个计算任务
41、。通用 Turing 机就是一个机器的数学模型,它能实现任何一个计算任务。Turing 的理论贡献是证明了任何一个计算都可以由一个机器,即通用 Turing 机来实现。Turing 机模型还揭示了:计算定律(计算定律(The law of computation)计算是局部的,即计算过程中任何一个动作都是局部操作,而且一个计算就是一系列局部操作构成的序列。显然,逻辑推理是一个计算过程,计算定律也表明逻辑推理是局部的。计算是局部的这一计算定律表明:计算完美地实现了逻辑推理,但是不能实现直觉推理。什么是逻辑推理?什么是直觉推理?逻辑推理就是同一抽象层次的推理。直觉推理就是跨越抽象层谱的推理。现实世
42、界必然包含不同抽象层谱的对象。逻辑推理和直觉推理都是人推理不可或缺的推理形式,是人学习的基本策略。因此仅仅依靠计算不可能实现人的学习,这是以计算为中心建立学习理论的先天不足,不可弥补。Turing 机模型揭示了计算概念的实质,更证明任何一个计算可以用一个 Turing 机来实现,然而并没有回答如何对一个问题通过计算来求解。任何一个计算问题必然有一个“目标函数”。计算的目标函数是中国人工智能系列白皮书 9 由人来确定的,机器本身不能确定计算的目标函数。一个计算问题的目标函数是该计算问题的语义,而计算的过程是该计算问题的语法。因此,一个计算问题有一个人确定的语义和一个机器实现的语法。计算机解决计算
43、问题的语法,但是不能解决计算问题的语义。Turing 机的定义揭示了计算这一概念的实质,奠定了计算理论的基础。而计算理论正是计算机科学的三大支柱之一。通用 Turing 机还为后来的电子计算机提供了数学模型,因此,通用 Turing 机也为计算机体系结构提供了原理。体系结构是计算机科学的三大支柱之一。程序理论、计算理论和体系结构正是计算机科学的三大支柱,其中程序理论的数学基础是数理逻辑,而计算理论和体系结构的数学基础都是 Turing 机和通用 Turing 机。计算这一概念的研究毫无疑问仍然是计算机科学,特别是理论计算机科学的核心问题。计算的数学实质由 Turing Thesis 确定。这个
44、论题是否正确仍然是一个重大问题。在计算复杂性层面,现有的算法复杂性及计算复杂性都是基于 Turing 机来定义的。基于 Turing 机模型,建立了 NP 困难性、NP 完全性的理论。然而计算复杂性理论并没有揭示一个计算问题为什么困难的实质。一个计算问题为什么复杂应该是由这个问题内在本质属性所决定的。算法、计算复杂性,甚至可计算性的任何突破实质上都要求有一个算法新思想。这仍然是计算机科学研究的发动机。1.4 图灵对机器智能的研究 在 Turing 之前,有很多计算装置,中国古代的算盘就是一个简单、有效的计算装置。然而计算这一概念有一个严格的数学定义,而且计算可以完全由机器来实现。计算器和计算机
45、的根本区别在于:计中国人工智能系列白皮书 10 算器是单一计算任务的计算;计算机是通用计算模型的计算。通用Turing 机预示着计算可以完全由机器来实现。这是一个伟大的科学成就。基于对这一成就的预见,Turing 1948 年提出了机器智能的概念,并第一次对机器智能这一问题做了认真的研究。Turing 1948 年提出:“机器会思考吗?”这一问题,并针对这一问题进行了充分论证。然而,“思考”这个概念太复杂,没有一个数学模型来实现它。对此,Turing 提出了后来人们称之为“Turing 测试”(Turing Test)的模型以检测一个机器是否有智能,从而回避了什么是智能的问题?以及机器是否有智
46、能的问题?在这篇文章中,Turing 提出了一个基于计算的模拟小学生在学校在老师指导下学习的学习模型。这是第一个尝试给学习这一概念建立模型的工作。Turing 的学习模型引出后来强化学习的模型。成为机器学习的一个重要方向。Turing 1948 年的工作第一次明确提出了机器学习和机器智能的问题。然而 Turing 的工作并没有对学习和智能这两个概念的数学实质做出有意义的理解。实际上,如前所说,计算是局部的,不可能实现直觉推理,更不可能实现学习;计算需要人来确定目标函数,学习的目标函数人也不知道。因此仅仅基于计算是不可能建立学习模型的。Turing 1948 年的工作实际上也说明学习和计算是根本
47、不同的概念。不然,Turing 肯定可以基于计算模型很容易地建立学习的模型与原理。Turing 明确提出“机器智能”的概念,然而回避了什么是智能?智能是怎样形成的?等问题。Turing 1948 年提出的“Turing Test”模型仍然被认为是检验一个机器,是否有智能的准则。因此,Turing 1948 年的工作是开启人工智能研究的奠基性成果。中国人工智能系列白皮书 11 Turing 的工作也引出两大基本问题:(1)计算与智能这两个科学概念的关系是什么?(2)作为科学概念的“计算”一定是 Turing 机吗?显然,这两个问题仍然是 21 世纪的重要科学问题。1.5 人工智能研究的兴起 人工
48、智能的兴起是 1956 年在美国达特茅斯的一个会议开始的。它的兴起不是人工智能有了科学突破而自然产生的,是一些学者感觉会有那么一个学科。然而,这个学科真正的科学贡献还没有什么成果。基础性的成果仅限于数理逻辑、Turing 机,以及如上所说 Turing 第一个认真研究的成果。会议讨论决定用“人工智能”这个名称,并决定了一些研讨会组织形式。会议对人工智能学术没有什么影响性成果。顺便说几点:会议确定了“人工智能”名称。在这之前,Turing用的名称是:智能机,intelligent machinery。人工智能这个名称现在用的最多,但严格科学意义上,未必严谨、科学。人工智能后来几波的发展都是一波三
49、折。其原因可能就是:人工智能的提出并不是基于科学已经取得突破的基础,而只是感觉有那么一个东西,大家提出来,口号性的东西比较多,实质科学思想少,口号介入到了科学研究的原因。科学研究应该是有其自身规律的,重大科学问题的突破必然有其历史的规律性。1.6 符号主义人工智能 符号主义的根本原理就是逻辑推理,逻辑推理的数学理论就是数理逻辑。中国人工智能系列白皮书 12 因此符号主义的人工智能就是基于数理逻辑的人工智能。人的推理包括逻辑推理和直觉推理,人的推理是逻辑推理和直觉推理的结合。显然,逻辑推理和直觉推理是不一样的,两者对人的学习都至关重要。逻辑推理的数学理论是数理逻辑。然而,长期以来,没有一个直觉推
50、理的数学理论。为正确理解推理这一概念,这里提出:定义定义 1.1(逻辑推理)逻辑推理就是同一个抽象层谱的推理。定义定义 1.2(直觉推理)直觉推理就是跨越抽象层谱的推理。定义 1.1 和定义 1.2 表明了逻辑推理和直觉推理的本质区别。定义 1.1 和定义 1.2 同时还表明,建立推理的数学理论的一个不可逾越的障碍是建立层谱抽象的数学理论。我们第一次建立了这样一个理论,具体参见本白皮书第十章。一个基本观察是人的推理是逻辑推理和直觉推理的结合或融合。由于符号主义的人工智能就是基于逻辑推理的人工智能,符号主义的人工智能技术不可能实现直觉推理,从而不可能实现人的推理。这就是符号主义人工智能的根本缺陷