收藏 分销(赏)

【人工智能】《新IP大趋势》.pdf

上传人:Stan****Shan 文档编号:1319275 上传时间:2024-04-22 格式:PDF 页数:187 大小:7.32MB 下载积分:25 金币
下载 相关 举报
【人工智能】《新IP大趋势》.pdf_第1页
第1页 / 共187页
【人工智能】《新IP大趋势》.pdf_第2页
第2页 / 共187页


点击查看更多>>
资源描述
3推荐序一 泛舟新浪潮2022年底,OpenAI发布以人工智能技术驱动的自然语言处理工具ChatGPT,一时间,针对人工智能的讨论和思考热潮席卷而来。在极短的时间内,我们目睹了人工智能给对话场景和内容生产场景带来的体验革新和效率提升,也重塑了我们对人工智能的概念认知和价值评判。可以预见,人工智能将对生产工具、生产组织方式和思维模式产生巨大的冲击。本书从新IP、虚拟数字人和NFT等融合发展的角度来阐述和展望文化创意产业将要面临的革新。在阅读的过程中,常有“言必有中”之感,且不乏惊喜。IP本就是文化创意产业中吸引受众、提升商业价值的核心推动力。在人工智能时代背景之下,虚拟数字人将重建人机交互方式和内容生产流程机制;NFT则将重塑数字化内容的所有权和价值体系。这些新技术、新生产方式和新价值体系的协同兴起,让新IP的孵化和商业价值提升变得更加高效和透明,为文化创意产业的发展提供了更加广阔的空间,同时引发我们对人类智慧和文化价值的全新思考。作为文化产业的从业者,在过去的二十年里,变革对我们而言并不陌生。从互联网、移动互联网、VR/AR/XR到Web3.0,这些新技术和新平台横空出世之时,我们常常处于混沌之中,或为之惊叹,或生出忧愁。但经验也告诉我们,浪潮来临之时,总有新大陆在远方跃升而起。作为想要在浪潮之上泛舟远行的我们,拥抱变化、关注趋势、不断学习和保持思考的积极状态,是我们开辟新航路必不可少的罗盘。中国科技创新行业正在经历一个大变革的时代,IP与人工智能等前沿科技的结合必将给文化产业带来新的浪潮,让我们一起走进新IP大趋势这本书,泛舟新浪潮,共同发掘新IP的无限可能。张炜中国文化产业投资母基金管理有限公司7推荐序二 IP、NFT、ChatGPT与虚拟人文娱行业的春天本书相当贴近热点,简直就是热点本身,将当下最时髦的概念与事物IP、NFT、ChatGPT几乎一网打尽。而且,这些概念和事物并不是被生拉硬套地拼凑在一起,因为它们本质上是强相关的。IP是一个讲了挺多年的概念,作为人的IP、作为内容的IP,以及作为品牌和商品的IP,几乎已经成为现代社会与经济生活中的核心词,成了“点石成金”的魔法棒。NFT作为此前区块链与加密资产领域的新事物,与文娱行业打通,风头一时无两;又被置入Web3.0和元宇宙的大概念中,让人们对文娱产业的未来多了很多憧憬,仿佛是行业的一剂解药。2023年开年,OpenAI和ChatGPT如一阵旋风,摧枯拉朽式地席卷了全世界,让科技界、创业界和投资界,甚至普罗大众激动至几乎癫狂,直呼“类似蒸汽机、印刷术那样的科技革命和工业革命来了”!甚至有专家学者,开始讨论人类的灭亡和机器智能的崛起。不可否认的是,人类历史上破天荒的科技与产业革命,有相当多都与信息处理有关。从最早开口说话,到文字出现,到印刷术诞生,再到互联网在电商之前的核心创新,都是信息技术和内容生产的革命。回到我们的主题,今天的科技爆发,发展到虚拟人这里,似乎呈现了终结一切的架势。在人工智能这个大概念下,历史似乎要终结了,人工智能从人类的助理,到一步步代替人类的很多智能,最初实际上是从“接龙”开始的语言和语义的联想、分析与接龙。看完本书,我们可以对当下最热门的事件有一个全面深入的了解,并且展开对自身和所从事工作的思考:在这场潮流革命里,我能干什么?我会被替代吗?作者作为证券研究团队的骨干,在这么短的时间里,能够对这个行业进行全面梳理和思考,看来平日的积累颇多。只要这本书,暂时还不是ChatGPT代劳的就好。读者朋友可以自己移步看内容,做判断。熊三木合鲸资本创始人8自序 AI与NFT,联手打造数字智能时代的新一轮IP孵化与商业化IP是一种辨识度,是存在,是主体,是在一定范围内顺畅流通的记忆符号。IP可以是明星、艺术品、畅销书、特色物产,甚至可以是一种颜色、一个LOGO。究其成因,它是人身上最深刻的创造力的显现与流通创造、显现、流通是成就IP的共同推手。科技大爆发,绝不是为了作用于当下的任何存在,它作为生产力/工具,聚集共识之士,升腾出未来时代流通的新符号新IP!数字智能时代,AIGC作为最先进的生产力,ChatGPT作为爆款工具,正在聚沙成塔,建成新生态。未来这片磅礴的生态里,奔流不息的将是全新的IP。过往的IP是人自身的创造,创造者的数量虽不至于凤毛麟角,但仍是少数;新IP是人与AI的共同创造,在AI强大的助力下,创造者规模将前所未有地壮大。这里还有一项细微但意义重大的变化:人与AI的共同创造,刚开始是人以AI为工具,提升创作效率;随后是人配合AI的创造,为其保驾护航;最后,则是人与AI合二为一将人的虚拟人接入ChatGPT,释放出所有人的巨大创造潜力。AIGC的变革意义堪比活字印刷术的诞生。由传统IP到新IP,这是一条让人热泪盈眶的“平权”之路,它赋予每个人使用过往不可想象的各类高端工具的权利,点燃每一个普通人内心深处关于创造的“星星之火”。这一幅燎原之势,正是本书所描述的“新IP大趋势”,未来将迎来新一轮IP孵化与商业化。NFT是数字智能领域的“魔法棒”,它赋予所有数字内容以“资产”的价值,极大地撬动了数字内容的流通。NFT与AI相辅相成,共同作用于未来各类IP的孕育与孵化,重塑并优化入局企业的“三张报表”,进而催生出一类行业“新贵”商业化变现能力突出的平台型公司。在AI与NFT共同构建的数字智能大舞台上,人与AI联手打造的新IP层出不穷、精彩纷呈。以商业化平台型公司为代表的诸多入局方,其襄助新IP商业化的过程如同一幕幕精彩的舞台剧,即将演绎出数字智能未来的大时代!9 第一章 虚拟人:交互世界的新物种第一节 人VS人的数字人、虚拟数字人、机器人第二节 人的数字人:分身与化身第三节 机器人:虚拟数字人在现实物理世界的显现第四节 人与人的交互VS新增6类交互第二章 NFT的魔法棒:从数字内容到数字资产第一节 NFT:数字世界的“注册制”第二节 NFT机制:金融属性最为突出第三节 NFT是元宇宙世界运行的精髓第四节 NFT作用于“未来”的魅力更大第三章 虚拟人的重大意义第一节 人进入元宇宙的身份第二节 又一轮匿名化社交的开始第三节 AI的定向产业化:AI生成与驱动第四节 元宇宙基础设施建设的“圆心”第五节 AIGC:虚拟人的创作第四章 NFT的魅力:孵化与孕育未来的各类“明星”第一节 向前看:孵化与孕育“新明星”第二节 旧有的“IP+NFT”模式效用仅能发挥出四分之一第三节 NFT的交易链条越长,价值重估空间越大第四节 警惕顶级IP的过度泡沫化第五章 虚拟人与NFT对当下的重构:重塑企业的“三张报表”第一节 虚拟人作为未来的“明星”:在资产负债表的“资产”而非“商誉”中第二节 虚拟人制作:企业“成本”的升与降第三节 NFT的价值重估作用:放大资产负债表中“资产”的量级第四节 NFT将带来丰沛的经营性现金流第六章 新IP探索的地形图10第一节 虚拟人与NFT的运行背景第二节 虚拟人的两大应用方向:赋能、IP孵化第三节 入局方存在的误区第四节 NFT将成为所有人和企业的标配业务第七章 虚拟人与NFT的交叉:新一轮的IP孵化与商业化第一节 IP孵化:专业度、辨识度、局部影响力第二节 新一轮IP将彻底区别于过往的“好莱坞IP”第三节 IP商业化门槛急剧提高第四节 商业化平台类公司:新贵崛起第五节 AIGC将助力新一轮的IP孵化与商业化后记11第一章 虚拟人:交互世界的新物种对于当下的入局方而言,数字智能时代最大的变数,是用户种类从单一的“人”转变为人、人的数字人、虚拟数字人、机器人的并集。这4类用户能衍生出6类交互方式:人与人的数字人的交互、人与虚拟数字人的交互、人与机器人的交互;人的数字人与虚拟数字人的交互、人的数字人与机器人的交互;虚拟数字人与机器人的交互。中国最古老的神话传说“女娲造人”在数字智能时代将真正成为现实外显为机械装置的机器人正根源于“土生金”中的土元素,数字智能时代为何会有机器人这样的交互物种?数字智能时代是人类科技、文明史上前所未有的“大变革”,堪称“数字版的大航海时代”,且第一次针对人的意识进行开发,而非针对外部物理世界。从科技的逻辑架构上,元宇宙是实现真正智能的路径之一,即重构一套新的时空,打造真正智能的虚拟人。虚拟人是相对于“人”的新物种,从这个角度看,新物种不仅包括虚拟人(人的数字人、虚拟数字人),也包括机器人(现实物理世界中的机器人,在元宇宙中一定会有虚拟形象)。“人”在元宇宙时代,其软件、硬件均需要升级,因为实现混合平台需要的技术路径之一,即以“人”为硬件载体。元宇宙对“人”的挑战,是“人”的软件需要适配升维的虚拟现实(元宇宙);智能的真正实现,亦需要“人”的硬件的迭代(甚至是重塑)(图1-1)。12图1-1 元宇宙研究框架元宇宙的技术路径目前仍在积极探索中,主流的技术路径是作用于视觉的硬件入口,但不乏作用于听觉、触觉硬件入口的尝试。所有技术路径的目标均是实现虚拟现实,即技术作用于人,让人在意识中真正模糊虚拟与现实之间的边界。技术路径虽未定,但以终为始,技术方向确定是由互联网时代的图文(2D)升维为视频(3D),在视觉、听觉硬件的基础上再增加触觉甚至味觉、嗅觉硬件。从用户的角度看,互联网13时代的个人计算机(PC)、智能手机貌似已经成为人的一部分,努力去拉近人与网络(虚拟世界)的距离。虽然在努力拉近,但最多只能去靠近、逼近;元宇宙则是将用户直接拉进虚拟世界中。因此,虚拟人的职能,首先是作为人的数字人,肩负着将人拉进元宇宙的使命;其次是作为现实物理世界中不存在实体的虚拟数字人,其存在的底层逻辑在于广泛、普遍承接2D升维成3D的交互界面的“圆心”。机器人看似不在虚拟人的讨论范畴里,但它的存在对元宇宙的构建非常重要。在元宇宙不可逆的大趋势下,人作为用户将被深刻影响与改变,人的软件与硬件升级后,时间将被更多地分配在元宇宙中,现实物理世界中很多的角色、职能、功能将由机器人来承接。浅层次上,机器人的存在将在经济学意义上降低商品与服务的价格,尤其是服务的价格。14第一节 人VS人的数字人、虚拟数字人、机器人这一轮变革不同于过去50年的计算平台演化,原因在于其所依托的新硬件带来的是人的感官体验、交互、内容等一系列的重构,背后是人类从二维互联网进入“仿真”的三维世界,主要体现为空间、体验、交互三个方面的升维。由“平面”到“立体”,一切都将被重塑,但这种重塑并非“镜像”的重塑,因此虚拟人作为交互界面重构的“圆心”,非常考验想象力。元宇宙不仅会囊括现实物理世界,还是对现实物理世界的重构。类比互联网、移动互联网20多年的发展史,未来1020年发展的前半场是元宇宙成型阶段,即元宇宙大投资时代;后半场则是元宇宙重塑现实物理世界的阶段,即新硬件主义时代。在元宇宙大投资1一书中所建立的元宇宙六大投资版图,必将同步运行于不同的发展阶段,但在不同的发展阶段呈现出来的投资价值,从配置的角度所赋予的权重不同。终极的元宇宙所呈现的内容与场景必然百花齐放,抢夺用户时长/注意力的效果越显著,投资的权重越高。但在当下混沌期,元宇宙将有新内容或场景应用出现,引发全市场的关注与跟进,以吸引越来越多的厂商快速匹配资源去大力布局。在通往元宇宙终极形态之前,行业内的内容供给方将在不同节点或方向上实现创新。在这个过程中,预计会出现一种或者多种新的内容或应用。自2021年下半年以来,超写实数字人“AYAYI”、虚拟数字UP主“柳夜熙”、数字人“洛天依”、虚拟带货主播等各类虚拟人或数字人悉数亮相。但虚拟人这一概念不是这两年才有,而是可以追溯至20世纪80年代,人们开始尝试将虚拟人物引入现实商业世界中,当时虚拟人的制作手段以手工绘制为主。21世纪初,计算机动画(CG)、动作捕捉等计算机技术进步,取代传统手绘进行虚拟人的创作,应用于数字替身、虚拟偶像等领域。近5年来,得益于人工智能技术的发展,虚拟人的制作流程得到有效简化,且成本进一步降低,虚拟人行业开始快速发展,众多虚拟数字人在各行各业出现。伴随着新的计算机技术的发展,虚拟人越来越数字化与智能化,有关虚拟人的名词与概念也越来越多,如数字人、虚拟数字人等,相关概念可以被认为是等同的,但在严格意义下又有细微的差别。中央民族大学新闻与传播学院教授郭全中在虚拟数字人发展的现状、关键与未15来2一文中对数字人、虚拟人、虚拟数字人的相关概念进行了界定。他指出数字人在范围上包含虚拟人和虚拟数字人,是存在于数字世界、按照物理世界中的人物进行设定的形象,而与人类形象完全一致的被称为“数字孪生”。虚拟人是数字人的组成部分,包含虚拟数字人,它存在于虚拟世界中,人物身份也是虚构的。而虚拟数字人属于最小的概念范畴,它存在于虚拟世界,是具有人类特征和人类能力的数字化形象,拥有虚拟身份和数字化制作特性。在新的语境下,我们也试图对相关概念进行界定与划分。我们认为虚拟人是交互世界的新物种,包含“人的数字人”和“虚拟数字人”。从广义上来看,这些新物种是相对于“人”而言的,不仅包括虚拟人,也包括机器人。因此,新硬件主义3一书指出从交互对象的角度来看,未来元宇宙囊括现实物理世界后,人的交互对象增加了3类,分别为人的数字人、虚拟数字人、机器人(图1-2)它们本质上都是人工智能(AI),其创作的内容均可以称为人工智能生成内容(AIGC)。16图1-2 未来人的交互对象与交互关系第一类,人的数字人是我们当下比较能够理解的概念,指当前由CG建模或AI驱动的我们自己的数字人。数字人是跟现实物理世界中的人相关联的,又可进一步分为“化身”(avatar)与“分身”(separation)。人在现实物理世界中具有唯一性,但可以在数字空间中映射出多个数字分身与数字化身,即在未来元宇宙的数字场景中,每个用户都会有自己的虚拟分身或化身,来承担不同的工作或任务。第二类,虚拟数字人需要与人的数字人相区分,它跟现实世界的人17没有关系,指的是在元宇宙中数字原生出的虚拟人。数字原生是元宇宙底层架构中较高级的阶段,需要与数字孪生相区分。数字孪生是比照现实世界11孪生出虚拟世界,认知及知识结构均基于已有的现实场景,所解决的也是现实世界的物理问题;数字原生则是生产人类认知之外的新产物。当人工智能足够智能化,就可以在数字世界中原生出很多内容,即AIGC,或者用户通过轻便化的工具原创出在现实世界中不存在的内容。当数字原生的东西足够大、足够强盛,必然会反过来影响现实世界。第三类,机器人,即虚拟数字人的机器人,也可称为人工智能体、人类增强等,指的是虚拟数字人反向映射回现实物理世界的显现。这类机器人本身就属于我们所定义的“新硬件”的范畴,由AI生成及驱动且具有较高的智能化程度,与当下智能化程度较低、工具属性强于计算属性的机器人存在本质区别。在新硬件主义时代,现实物理世界的生物主体与AI主体的类型数量比例将为13。未来元宇宙中人的数字人、虚拟数字人、机器人的存在,将会使现实世界的人突破肉身的限制,突破环境与物质的限制。未来“人”的范围将会被扩大,预计会数倍于现实物理世界,社交关系也会更加复杂。与此同时,新的消费需求、商业空间也会被释放出来。18第二节 人的数字人:分身与化身人类自进入互联网时代以来,社交模式与社交体验都发生了质的变化。伴随着互联网技术与通信技术的进步,社交网络服务应运而生,社交网站提供了一个互动空间,超越了传统的面对面互动,拓宽了人类的社交体验边界,同时社交关系也越来越复杂。互联网已经经历了从Web1.0到Web2.0的迭代,目前正在向Web3.0升级。数字人的出现将会进一步打破人类社交体验的边界,是人从现实世界到虚拟世界的新一轮映射。移动互联网将视觉、听觉、部分社交关系映射进去,因此元宇宙中会增加更多机能,尤其是感官体验。元宇宙是虚实融合的世界,那么人们如何进入元宇宙参与经济活动呢?在PC/移动互联网时代,人们在网上浏览信息或进行一定的经济活动(点击、分享、购买等),其背后都对应着一定的身份信息或IP地址。在数字智能时代,人们进入数字空间需要有一个数字人,数字人是构建数字身份的基础,是让虚拟世界更加真实的重要保障,也是现实世界和虚拟世界产生互动的重要媒介。数字智能时代人的存在表现为三种形式。首先为现实维度的人,即处于现实物理空间的真身。作为拥有生物属性意义上“肉身”的真身,其在现实空间有社交关系、独立的人格与心智(世界观、人生观、价值观)、文化与经济地位等。除了现实物理空间中的真身之外,人在数字空间中还会以数字化身与数字分身的形式存在。总体而言,数字化身与数字分身都是“人的数字人”,人的数字人是人进入数字空间的身份象征,数字身份是独一无二的,与现实世界的真身有直接对应的关系。这意味着,一方面,用户对自己的数字化身与分身拥有自主权,用户可以自主创建,而与用户互动的各方将能够验证其身份;另一方面,数字身份是虚拟世界不可分割的一部分,可以有多种形式,在不同的场景中,用户可以创建与拥有不同的数字身份,以满足不同场景的需求,比如社交场景与工作场景的身份,但这些本质上都基于用户的真实身份而存在。虽然人在现实世界中有物理活动的边界、时长的限制,但人在数字空间中可以映射出多个数字分身或数字化身,来进行不同的活动。化身与分身所应用的场景不同:数字人的化身解决空间问题,应用于有互动需求的场景;数字人的分身可以给时间加杠杆,如增加单位时间的曝光频次。19一、数字化身:给人的空间移动加杠杆作为现实物理世界的用户在数字空间中的一种存在形式,数字化身代替了用户真身在数字媒介实践中缺席的“肉身”。得益于数字孪生、扩展现实、脑机接口等技术,数字化身具有虚拟具身性。4随着技术的迭代,媒介的演进史依次经历了文字、图文、视频的形态,也聚合了人的不同感官。移动互联网在PC互联网的基础上,扩展了时间与空间的广度,即移动设备的可移动性使得人们可以随时随地获取信息,但此时的空间呈现仍是以二维为主。马歇尔麦克卢汉(Marshall McLuhan)在其著作理解媒介:论人的延伸中提出,“媒介即人体延伸”,“一切技术都是肉体和神经系统力量和速度的延伸”。媒介其实就是人类感官的延伸,未来随着技术发展,媒介的延伸范围可能会更加广泛,也会带来更多维度的感官体验。而元宇宙则从空间的维度,更强调感官体验的全面跟进(视觉、味觉、嗅觉、触觉、听觉),用户的感官体验得以高度仿真,当下互联网的平面功能将被三维立体化,从而在元宇宙中呈现。在数字智能时代,用户的身体并不缺席,其真身通过技术“扩展”在场,以数字化身“感知”在场,可与环境、事件及其他虚拟物进行交互,营造出临场感、沉浸感。以远程办公为例,即使Zoom等线上办公软件已经提供了一种较为高效的远程办公方式,但在这种远程办公模式下,独自一人居家办公会产生孤独感,解决问题的效率也不如和同事们面对面沟通的效率高。而在虚拟空间办公,用户可以借助VR、AR等新硬件,以3D数字化身的形式出现在虚拟会议空间中,并通过运动追踪技术实现化身与周围环境及其他人的数字化身的互动。这种沉浸式的交流方式能够在很大程度上接近现实中“面对面”的沟通效果。当前已经有一些虚拟办公产品出现,如微软(Microsoft)的Meshfor Teams与Meta(原Facebook)的Workrooms等,将先通过音频提示、面部识别、手势追踪等技术对现实中的人的状态进行实时采集,再同步给虚拟空间中的数字化身,从而打造沉浸式的沟通体验。二、数字分身:给人的时间利用加杠杆电视剧上载新生(Upload)描述了这样的场景,将人的意识与知识上载到数字分身中,这个数字分身与人的真身在认知水平、能力、表达等方面是一致的,可以在不同的场景中与环境发生互动。20数字分身的存在实现了对时间与空间的重组,这个重组会释放出数倍的价值。在现实世界中,人的活动时间有限,每天只有24小时,而人的数字分身可以有数个,即人将基于多重身份想象设定数字分身,从而进入多重虚拟场景中,以AI进行驱动,并在不同场景中进行沉浸式交互,进而实现给人的时间利用加杠杆。作为下一代互联网产品形态,数字智能按照其开发愿景,其发展完备的终极形态是虚实相融,即现实世界与虚拟世界的相连、融合与共生。虚实相融是外在呈现,时空再构则是其内隐特征。因此,数字分身与数字化身的存在,给人的时间和空间均能加杠杆,使工作效率、劳动生产率得以成倍增长,这就是可能带来的经济价值。打造数字分身与数字化身不是目的,使其作用于人的创造力并放大这种创造力才是目的。21第三节 机器人:虚拟数字人在现实物理世界的显现在数字智能时代的后半场,人、物、空间这三者均会被重塑,未来将会出现基于情感需求投射的分布式垂类硬件。简单来说,主要有以下两个原因:一是人在数字智能时代将会有新增的需求,尤其是非物质需求。未来AI将会发挥越来越重要的作用,2022年,AIGC发展迅速且获得了市场广泛的关注,AIGC被认为是继专业生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式,未来人的需求会越来越多地被AI的供给所满足。另外,AI将更进一步显现在现实物理世界中,以新硬件的形式承接人在未来现实物理世界中的更多需求。二是虚拟数字人有望反向映射回现实物理世界,即显现为机器人/物而存在,其在与人共享的现实物理世界中的需求与体验同样需要被满足。也就是说,分布式垂类硬件的产生,以现实物理世界为空间,以AI为生成与驱动的机制,是“人”与“物”受“机器人”与“新硬件”供给与重塑的结果。但是,硬件仅是外在的表现形式,内核仍然是服务于人交互的AI,包括各类主体之间基于情感需求的交互。新硬件产生的核心意义是作为寄托情感的实物载体完成人与“人”之间的交互。在诸多关于机器人的科幻电影中,机器人/虚拟人均被赋予了独立的人格、健全的思考能力、细腻复杂的情感。它们或是作为单独个体,可以直接与人进行各类交互,如我的机器人女友是人类与机器人相爱,人工智能是机器人小孩终身竭力寻求人类养母的关爱;或是本体藏匿于虚拟世界之中,通过影响虚拟世界达到反向影响现实物理世界的目的,使虚拟世界中的“物”以硬件形态在现实物理世界中得以呈现或投射,如黑客帝国中的网络程序可以迅速实物化为战斗武器、出行工具,甚至是生活必需品等。这类基于感情需求、工具武器需求投射的分布式垂类硬件,未来会散落在各式各样的内容、应用与场景之中,以满足人、虚拟人、数字人、机器人丰富多样的需求。相较于移动互联网时代,数字智能时代增加了AI生成与驱动的机制。在移动互联网时代,交互的内容/对象基本上都是由真实的人(软件工程师、创作者等)设计与渲染出来的;但在数字智能时代,AI成为新增生产要素,将会大量存在于供给、需求的各个环节中,数字人、虚拟人等就是AI的诸多应用之一。数字智能世界将成为“人的数字人”与“虚拟数字人”的共享空间,“虚拟数字人”反向映射回现实物理世界则大概率呈现为“机器人”。由此,人的交互对象由此新增了3类:人的数字人、虚拟数字人、虚拟数字人的机器人。222022年,从年初北京冬奥会上的各类机器人,到特斯拉、小米相继发布人形机器人,机器人的概念备受市场关注。未来的分布式垂类硬件到底是什么样的形态,可以参考北京冬奥会场景中的各类机器人。北京冬奥会主媒体中心的无人智慧餐厅大致描述了分布式垂类硬件未来可能的样貌:该智慧餐厅里约有120台智能厨师机器人,以及诸多服务生机器人,保证点餐、制餐、出餐全流程自动化完成,非常高效地满足了全球各地代表团的用餐需求。该场景的分布式垂类硬件(机器人)满足了疫情下的安全需求,即全程都是由机器服务,避免人与人的近距离接触。冬奥会的诸多智能机器人,符合我们对分布式垂类样貌的描述,但目前仍处于信息化、数字化阶段,智能化的含量仍在蓄力中。借助北京冬奥会这个国际化传媒平台,未来烹饪型机器人及相关场景有望得到更多的推广应用。我们再以特斯拉人形机器人为例,来梳理一下特斯拉人形机器人出现的时间轴。2021年8月19日,在特斯拉第一个“人工智能日”(AI DAY),人形机器人“擎天柱”(Optimus)首次亮相,虽然只展示了该项目的一些概念图和视频,但仍吸引了不少目光。2022年6月3日,马斯克在推特(Twitter)上预告,特斯拉可能在未来几个月内推出能够运转的人形机器人原型。2022年6月21日,马斯克在卡塔尔经济论坛上接受采访时表示,人形机器人“擎天柱”原型机将在2022年9月30日(特斯拉第二个“人工智能日”)现身。美国加州时间2022年9月30日晚6时,马斯克没有食言,真的把人形机器人“擎天柱”带到了人们面前。特斯拉人形机器人的初次亮相只是一款概念机,到第二个“人工智能日”已经实现了第二次迭代,实物图也与概念图进一步贴近。“擎天柱”项目在特斯拉内部的优先级迅速上升,预计2023年投入生产。马斯克此前称,2022年,人形机器人“擎天柱”的产品开发优先于特斯拉一些即将推出的车型,第一版机器人有望在2023年投入生产,产量预计可以达到数百万台。在规模效应下,其成本要比汽车低很多,预计售价不到2万美元(约合14万元人民币)。经过两次大的版本改进,特斯拉现在的人形机器人“擎天柱”已向智能化迈出了一大步。在没有任何备份装置(包括机械装置与电缆支持)情况下,人形机器人“擎天柱”在舞台上展示了四处走动(看似简单,实则是里程碑式的重大突破)的动作。未来团队将收集数据继续训练机器人,使其做到清晰识别周围物体、蹲下捡物体。从2022年的介绍来看,特斯拉的工作还集中在驱动和移动(locomotion)的部分,而操纵(manipulation)的部分还很基础。对于以特斯拉人形机器人为代表的下一代智能交互硬件,我们认为其作为特斯拉的“第二曲线”,本质上与特斯拉的智能电车相同,均是建23立在“输入计算平台输出”模型上的智能交互硬件。由此,我们提出“点、线、面”三个维度的观点与看法:在“点”上,智能电车与人形机器人均用“现实世界的AI和摄像头(硅神经网络和复杂的视觉系统)”来模拟人的“大脑和眼睛”;在“输入计算平台输出”的逻辑线上,特斯拉已经看到了智能电车未来对数曲线的“平缓期”,人形机器人“擎天柱”是下一代新硬件;在基于真实运行的认知层面,未来交互硬件的特征是“软硬一体”“合之为一(AI)、衍之为万(各式新硬件)”,难点在于解决对现实世界全域(非局域)的智能。特斯拉人形机器人“擎天柱”将运用特斯拉最先进的AI技术,其头部配备了与特斯拉汽车相同的智能驾驶摄像头,内置全自动辅助驾驶(FSD)芯片,并由基于视觉神经网络系统预测能力的自动驾驶技术驱动,与汽车共用AI系统。人形机器人“擎天柱”的大脑采用具备极强算力的Dojo D1超级计算机芯片,每个Dojo D1超级计算机芯片之间无缝连接,相邻芯片之间的延迟极低,训练模块在很大程度上实现了带宽的保留。我们认为,特斯拉人形机器人代表了AI落地的新方向,若未来实现规模放量,将能够带动国内AI企业在相关领域的需求。从其本身的特点来看,主要的增量在于两方面。一是人工智能算法。特斯拉人形机器人除了需要具备感知能力,还需要拥有一定的认知能力,这需要算法方面的创新与突破。当前,基于大样本训练的神经网络模型在认知方面仍需要提升。二是人工智能算力芯片。人形机器人作为一个人工智能终端,在承载复杂算法模型的同时,还需要足够的芯片算力作为支撑。伴随人形机器人产业的发展,AI芯片公司的重要性日益提升。在应用场景方面,传统机器人只是“工具”,而特斯拉人形机器人从设计之初,就被赋予成为独立“生产力”的期待,即模仿或替代人的作用。更直观地说,“工具”需要为人所用,它们类似于斧头、锤头的功能;而独立的“生产力”,就像人的伙伴或助手,人类只需要对其下达模糊的指令,人形机器人就可以理解(认知)并将其拆解为一系列行动(决策)。因此,人形机器人的应用领域,先从面向企业(to B)的场景开始,主要用作服务型机器人,如在酒店商场及部分高危场景中应用,后续预计会进入家庭等面向普通消费者(to C)的领域。24第四节 人与人的交互VS新增6类交互人的对外交互分为三类:人与自然的交互、人与人的交互、人与物的交互。首先,是人与自然的交互。从原始社会时期人类的刀耕火种,到封建社会时期人类开始养殖,再到工业革命时期人类开始运用机器生产,最后到现在人类借助自动化设备大规模生产,人类对自然的态度经历了从因为不了解所产生的恐惧到逐步开始借助工具试图征服、控制自然,再到经历了一系列因过度索取、粗暴式破坏而造成的反噬后,开始重新审视人与自然的关系。其次,是人与人的交互。在社会活动中,人与人之间存在亲密关系、商业行为等不同的人际关系,需要进行交互。人类需要通过语言(声音)、文字、眼神、表情、姿态等的有机结合,表达出丰富的含义,从而实现信息传递、情感沟通的目的。马克思说:人的本质是一切社会关系的总和。而社会的本质是人与人之间的交互,从某种程度来看,人与人的交互是这三对交互关系中的核心。最后,是人与物的交互。在征服自然、利用自然的过程中,人类发明了工具来提高效率,比如中国古代的四大发明造纸术、指南针、火药、印刷术。随着对自然的进一步探索,人类需要不断改进工具使其功能变得更加丰富且易用、灵活,从而进一步提高效率,这便衍生出了人与物的交互关系。同样,人与人的交互也需要以物作为载体来传输信息,并且提高信息流转的效率,比如老师上课时通常会借助道具、视频来进行展示。站在当前时点来看,人机交互是最典型的一类人与物的交互。一、人与人的交互我们认为人与自然的交互、人与物的交互,是人对外交互的基本层面,人与人的交互则是人对外交互的更高层面,因此人与人的交互是我们关注的重点。我们通过梳理人与人交互的历史脉络发现,在历史进程中任何一个方向的升维都有可能推动人与人的交互发生翻天覆地的变化,呈现愈加复杂的特性。整体而言,人与人的交互脉络最为核心的主线,是技术的发展推动人与人交互的空间范围不断扩大,交互的反馈变得迅速(交互时间缩短)。在交互空间持续扩大与交互时间持续缩短的过程中,当下人与人交互的媒介、渠道发生了变化,交互行为范式也变得更加丰富(图1-3)。25(一)传统农业时代:从面对面交流,到通过书信传递信息旧石器时代,人们普遍过着游牧的生活,需要不断地进行地理迁移才能获得生存所需的能量。随着农业社会的出现,大多数人结束游牧生活开始在某个地方定居,形成稳定的农业生产关系。人与人的沟通基本上是熟人之间的面对面沟通,表现为个人之间、邻里之间、群族之间的交往与沟通。对大多数的普通人而言,这样的社会形态在中国维持了几千年。但是在过去几千年里,局部地区也发生了一些比较显著的变化。首先,城市的出现推动贸易发展,人们开始跳出种族范围进行人际交互。稳定的农业生产能力为部落带来了充足的粮食,在满足已有人口需求的情况下还能有剩余,甚至不从事农业生产的人们也能获得粮食,这便开始推动社会内部产生分工,比如因犁、耙的制造而出现手工业;城市开始出现并发展。两河流域的美索不达米亚文明、尼罗河流域的古埃及文明、黄河流域的华夏文明、印度河流域文明已经呈现出一定的社会与经济复杂性,书写与贸易正式在人类社会出现。贸易的发展推动人与人之间的交互逐渐跳出所属的种族,延伸到邻近的种族,交互的空间范围开始扩大。2627图1-3 交互历史梳理其次,技术迭代、经济发展带来了更充足的食物、财力,支撑人类走得越来越远。社会精英阶层开始探索更遥远的世界,人与人的交互在地理边界上被不断拓展。在中国,公元前139年汉武帝派张骞出使西域,以首都长安(今西安)为起点,经甘肃、新疆,到中亚、西亚,并连接地中海各国,开辟了著名的“陆上丝绸之路”。13世纪末马可波罗游记出版,其中详细记录了意大利商人马可波罗行经地中海、欧亚大陆和游历中国的所见所闻,涉及山川地形、物产、气候、商贾贸易、居民、宗教信仰、风俗习惯等丰富的内容。透过这些事件,我们发现东西方文明开始连接,人类能够与另一个半球的人进行交流、贸易通商。而1517世纪开启的大航海时代将东西方人类间文化、贸易交流的地理边界进一步打开,欧洲的船队出现在世界各地的海面上,寻找新的贸易路线与贸易伙伴。人与人的交互跨越地理、种族出现碰撞,甚至因冲突而发生战争。最后,随着人类活动区间变大,不断解锁全新地图,承载人与人交互信息的载体也在发生变化。口口相传的交流方式将信息交互限制在邻里之间,一旦扩大交互空间,信息的传递便显得效率极低且容易出现偏差。文字的出现使得信息能够保存,并得以传递与交流,被认为是文明的标志之一。文字在相当程度上保证了传递信息的准确性,但是依靠人力传递信息仍然效率极低,且传播速度慢。对于重要信息,人们还想了很多种办法加快信息的传递速度,比如美洲的印第安人巧妙地采用烟信号传递信息,古代中国人则借助烽火传递信息,以及我们经常在电视剧中看到的飞鸽传书、快马送情报等,信息的传递速度相较之前有了大幅度的提升。透过中国古代驿站的历史可以大概看出当时信息的传递速度,宋朝沈括的梦溪笔谈记载:“驿传旧有步、马、急递三等,急递最遽,日行四百里,唯军兴用之。熙宁中又有金字牌,急脚递如古羽檄也,以朱漆木牌镶金字,日行五百里。”即在宋朝(约11世纪初),一天内最快传递五百里,且一般只用于军事信息传递。到清朝(17世纪后),京师设皇华驿,军机处公文上注明“马上飞递”,规定日行三百里,假如遇到紧急情况,可以日行四百里、五百里,甚至日行六百里不等,最高速达日行八百里,俗称“六百里加急”及“八百里加急”。但是即使是最快的马接力,也无法满足人们对交互时效的要求。例如在元朝统治期间,其国土版图一度包括西伯利亚部分地区在内,所涉28面积非常广阔,在遇到天灾人祸等重要信息需要呈报朝廷进行决策时,信息一来一回可能需要十余天,很容易就错过了救灾的时机,造成巨大的损失。此外,唐朝诗人杜甫在春望中写道:“烽火连三月,家书抵万金。”也能从侧面看出当时信息传递速度缓慢对人们生活造成比较大的影响。然而在发明电报之前,中国乃至世界都经历了一段漫长的靠人力或者动物传递信息的过程。整体而言,过去几千年历史上人类社会的生产关系相对较为稳定,大众交互的范围多限于各自成长的地域,与熟识的人进行面对面沟通。城市文明下产生的贸易行为打开了人与人交互的空间范围,大航海时代使这种贸易交互边界进一步打破,走得更远,但这仅仅被限定在部分特定阶层中。交互空间的扩大产生了远距离通信的需求,文字的诞生弥补了口口相传所造成的信息误差的问题,但古代信息传递的速度较慢,也仅限制于军事、通商等重大信息的传递。(二)电报/电话时代:即时、在线沟通逐渐成为常态美国画家塞缪尔莫尔斯(Samuel Finley Breese Morse)在旅欧学习的途中对电报机技术产生了兴趣,并于1835年发明了世界上第一台电报机。1843年,莫尔斯修建了从华盛顿到巴尔的摩的电报线路,全长64.4千米。1844年5月24日,在座无虚席的美国国会大厦里,莫尔斯向巴尔的摩发出了人类历史上的第一份电报:“上帝创造了何等奇迹!”电报的出现将人类拉入电信通信时代,使人类传输信息的速度得到了极大的提升,电报所承载的信息可以在一秒内绕着地球走7圈半。在电报之后,电话的出现使得信息传输速度进一步提升。1876年,亚历山大格拉汉姆贝尔(Alexander Graham Bell)为其发明的电话申请了专利。1877年,从波士顿到马萨诸塞州萨默维尔的第一条普通电话线的建设工作完成,至1880年底美国已有47900部电话,电话设备快速发展。贝尔于1877年成立了贝尔电话公司,在此基础上发展成为当今美国最大的电信服务供应商AT&T。但是早期电话使用人工寻呼的方式,寻呼等待时间较长而且周转较为繁复,所以电话的通信费用也比较高。电报与电话的出现缩短了远距离通信的时间,但是通信费用较高,因此在很长一段时间里,写信仍是普通老百姓主要的通信方式。以电报为例,20世纪5080年代,在中国寄一封信只要4分钱,而发电报则要按字收费,80年代电报一个字收费0.075元,到了90年代电报每字收费0.135元。1993年,中国无线寻呼业务向社会开放,1998年全国寻呼机用户突29破6546万人,“有事儿呼我”成为当时的流行词,写信这种通信方式开始逐步退出历史舞台。1987年11月18日,广州开通了我国第一个TACS模拟蜂窝移动电话系统,实现了我国移动电话用户零的突破。1994年10月,我国第一个省级数字移动通信网在广东省开通,我国由此进入了2G时代。相较于寻呼机,移动电话不需要寻呼台,通信双方可以
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 行业资料 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服