1、索尼人工智能新奇风索尼人工智能击溃顶级真人赛车手以一点五秒优势打败人类“这是什么情况?”艾米丽琼斯不敢相信自己竟然落后了。艾米丽琼斯是一名多次夺冠的顶级GT游戏赛车手,她拍打着她的电子竞技专用方向盘,眼睛町着面前的屏幕:“我尽力了,但还是追不上它,它是怎么做到的?”在游戏GT赛车中,琼斯以每小时120英里的速度驾驶着她的赛车。为了追上世界上最快的“玩家”,她几度把车速到了每小时140 英里、150 英里。这位“玩家”实际上是名为“GTSophy”的人工智能。它是由索尼人工智能研究实验室在2 0 2 0 年发布的,利用人工智能技术在GT游戏中学习如何操控赛车。在2 0 2 1年举行的一系列闭门活
2、动中,索尼安排了该人工智能与顶尖GT赛车手同台竞技。2021年7 月,琼斯作为电竞战队TransTasmanRacing的一员,参与了索尼组织的活动,但当时的她并不知道会发生什么。“没人给我提供任何信息。只是跟我说不需要做任何练习,也不要在意圈速。”她回忆道。“我的态度也很单纯,保密就保密吧,这肯定不是什么坏事。”最后,GTSophy以1.5秒的优势击败了琼斯的最佳成绩一一人类赛车手刷新GT记录基本都是以毫秒为单位的,1.5秒意味着巨大的差距。但索尼很快了解到,仅凭速度并不足以让GTSophy成为赢家。它在单人赛道上超越了人类车手,以不可思议的成绩打破了三个不同赛道的记录。然而当索尼将其与多个
3、人类车手放在一起比赛时,它却输掉了一一多人竞赛不仅需要速度,还需要一定的智慧。GTSophy有时B如星雪 如星雪索尼人工智能新奇风称,这与人类玩家的反应时间相似。索尼使用了强化学习,通过试错的方法从零训练GTSophy。起初,人工智能只能努力让汽车保持在路上行驶。但经过在10 台PS4上的训练后(每台运行2 0 个程序实例),GTSophy在大约8小时内提升到了GT的内置人工智能水平,相当于业余玩家。在2 4小时内,它就接近了包含17 7 0 0 名人类玩家最佳成绩排行榜的最顶端。GTSophy花了9 天时间不断缩短圈速。最后,它比任何人类玩家都要快。可以说,索尼的人工智能学会了如何在游戏允许
4、的极限下驾驶,完成了人类玩家力所不能及的动作。令琼斯最为印象深刻的是GTSophy的转弯方式,将刹车提前、以实现用更紧的走线加速出弯。她说:“GTSophy以一种奇怪的方式对待走线,做了一些我甚至从未想过的事情。”例如GTSophy经常把一个轮胎开到赛道边缘的草地上,然后滑进弯道。一般人不会那样做,因为太容易犯错了。这就像是你在控制一起碰撞事故。给我一百次机会,我也许只能成功一次。”GTSophy很快就掌握了这个游戏的物理学,不过更大的问题是裁判。在职业赛场上,GT比赛由人类裁判监督,他们有权对危险驾驶扣分。累积惩罚是GTSophy在2 0 2 1年7 月的第一轮比赛中失利的一个关键原因,尽管
5、它比任何一个人类车手都要快。在几个月后的第二轮比赛中,它学会了如何规避惩罚失分,结果就大不相同了。沃曼在GTSophy上投入了数年的精力。他桌子后面的墙上挂着一幅两辆车争抢位置的画。“这是GTSophy正在超越Yamanaka,”他说。他指的是顶尖GT日本车手TomoakiYamanaka,他是2 0 2 1年与GTSophy比赛的四名日本职业模拟赛车手之一。他不记得这幅画是哪局比赛。如果是2 0 2 1年10 月的比赛,Yamanaka很可能会乐在其中,因为他面对的是一个强大但公平的对手。如果这是2 0 2 2 年7 月份的活动,他很可能会咒骂电脑莫名其妙。Yamanaka的队友Takuma
6、 Miyazono通过翻译软件向我们简单描述了2 0 2 2 年7 月份的比赛。他说:“有几次我们被(GTSophy)撞出赛道,因为它的过弯方式太过激进。这让我们很生气,因为人类玩家会在转弯时减速,以避免开出赛道。”沃曼说,训练人工智能公平竞技且不失去竞争优势是十分困难的。人类裁判会做出取决于环境的主观判罚,这让人们很难将它们转化为人工智能可以学到的东西,比如哪些行为可以做,哪些不可以。索尼的研究人员尝试给人工智能提供许多不同的线索,供其调用和调整,B如星雪分星雪的进步。”但是,他的同事埃莉亚考夫曼指出,仍然是人类研究人员主导了GTSophy学习行为的训练。“良好的赛道礼仪是由人类教给人工智能
7、的,”他说,“如果这能以自动化的方式实现,那将真的很有趣。”这样的机器不仅会有良好的赛场风范,更主要的是可以理解什么是赛场风范,并且能够改变它的行为来适应新的设置。斯卡拉穆扎的团队现在正在将其GT赛车研究,应用到现实世界的无人机比赛中,使用原始视频输入而不是模拟数据来训练人工智能飞行。2 0 2 2 年6 月,他们邀请了两名世界冠军级别的无人机飞手对抗电脑。他说:“在看到我们的人工智能比赛后,他们的表情说明了一切。他们被震撼到了。”他认为,对机器人技术的真正进步必须要拓展到现实世界。“在模拟和现实世界之间,总是会有一种不匹配的情况,”他说,“当人们谈论人工智能取得了令人难以置信的进步时,这一点
8、就被遗忘了。在战略方面,是的。但就部署到现实世界而言,我们还差得很远。”目前,索尼仍坚持将技术仅用在游戏中。它计划将GTSophy用于未来版本的GT游戏中。“我们希望这能成为产品的一部分,”索尼人工智能美国的执行总监彼得斯通说。“索尼是一家娱乐公司,我们希望这能让游戏更加有趣。”琼斯认为,一旦人们有机会观摩GTSophy的驾驶过程,那么整个模拟赛车社区都可以从中学到很多东西。“在许多赛道上,我们会发现很多沿袭了多年的驾驶技巧都是有缺陷的,实际上存在更快的方法。”Miyazono已经在尝试复制人工智能在弯道的走线方式,因为它已经展示了这是可以实现的。琼斯说:“如果基准水平发生变化,那么每个人的技术都会提升。”口(综合整理报道)(编辑/克珂)