悦读

中国链
爱链中国,链你所爱!

游戏的下一个突破点,很可能是AI

更新时间:01-13信息来源:品途商业评论


 

我们和网易互娱AI Lab的小伙伴聊了聊,AI是如何赋能游戏的。

这几年,不管高屋建瓴的学术圈,还是产业前线的互联网,各路机构和大厂都在下场做AI,就发展程度而言,AI已经是全面渗透的姿态了。

我持续关注AI发展趋势和使用场景有一段时间了。这几年,自动驾驶、人脸识别、脑机接口,越来越花里胡哨的词儿都或多或少地和AI开始沾边。

这直接引发了大众领域内的观点站队。保守派大喊着「机器拥有自己的思想很可怕」,技术极客大多是「我们要拥抱AI」的开放姿态,但问题是,AI到底能用在哪些领域,怎么用,只有内行人清楚。

以目前的发展阶段来看,AI技术对人类的助益远远大过担忧。更何况,万事没有绝对的非黑即白,AI这事儿也不是一句两句能说清楚的。我们争论这些,不如看一看技术目前已经落下的场景,能给产业带来的实际赋能在哪里。

我会从大家比较熟悉的游戏等泛文娱领域展开讲讲。

为什么突破点在AI 

说一个观点。

我认为游戏行业竞争的下一个突破点,可能在于各家的AI技术水平。

来看一个整体脉络。

根据中国音数协游戏工委最新的游戏产业报告,整个行业的规模肯定在扩大,但从2017年-2020年报告也能看出另一个趋势:随着人口红利见顶,用户规模增长放缓,游戏市场扩张的同时,竞争也越发激烈。

这种激烈竞争在2018年版号收窄之后更加明显,监管层面也希望通过数量的减少去促成质量的提升和品质的创新。这背后,是大量未被满足的游戏玩家的需求。

伽马数据等多方报告指出,游戏感受、玩法创新和社交是大多玩家最注重的游戏体验,再往下拆分就是画面、音乐、公平性、竞技感、游戏协作等具体层面的需求。而诸如AI等技术层面的突破,无疑会改善玩家的这些体验,加速游戏行业的换挡升级。从玩家角度来说,丰富的竞技感是重要因素。Steam上线《全境封锁》时,不同风格的NPC就点燃了玩家。胆小的NPC见了你知道绕路,胆大的就开始猛攻,这就是新型AI利用强化学习技术优化出来的多样玩法。它更接近一个真实的游戏环境,体验更类似你遭遇到风格不同的三维世界玩家。

竞技感之外,相对公平有序的游戏环境也是需要的,多少FPS玩家内心的痛就在于,眼睁睁地看着对手外挂还无能能力。早年CS反恐精英不知道伤了多少人的心。这一点如今的AI技术其实能较好地消化解决,多重维度的匹配和反外挂监测已经在路上了。

继续深入讨论,如果你打开一款游戏,第一眼看到的画面、听到的声音也是决定你是否会成为潜在玩家的理由。音画已经成为绝对不能忽视的因素。

这是AI技术能够大显身手的地方,在游戏设计和开发中,AI的降本增效效果明显。

举个例子。对游戏里的美术同学来说,通过各种形式的生成-对抗网络模型,AI能直接生成高质量的角色原画、场景原画,甚至三维动作资源。作为制作者,美术同学大概最明白AI减少了多少工作量,还提升了画面质量,增加了玩家沉浸感。 

产学研一体,全链路赋能 

了解了AI对于游戏行业的破局程度,自然也能理解深入游戏领域的公司们对AI的重视了。

就拿网易来说,其互动娱乐事业群早在2017年就成立了网易互娱AI Lab,收拢的人才基本上都来自于清北浙复交等名校。

一个比较明显的趋势是,如今巨头们入局AI,产学研三者有了更深层的渗透。这也是互联网行业的妙处,它们本身走在前沿,对科技边缘的拓展也跑得最快。

以网易互娱AI Lab为例,这几年,七十多位算法和工程人员在顶会上发表了多篇重磅论文。

还是从大家比较好理解的音画这个角度举个例子,比如去年7月网易互娱AI Lab 获得全球最大的语音会议 INTERSPEECH 2020 声纹识别赛道双料第一。在这次比赛中,网易互娱AI Lab提出了一种 ASR-free 的文本相关声纹识别算法。相比传统的识别方法,该算法不需要依赖语音识别, 也能在多语言环境下,同时完成说话人和文本内容的验证。

而声纹识别技术在游戏中,主要可用于进行游戏身份验证或完善用户画像等方面。从实用场景来说,以往该技术多用于安防场景,网易互娱 AI Lab 能够将其嵌入游戏场景,本身就是突破。

实际上,更多AI技术的落地是围绕游戏的运营痛点来打通的。这就促成AI技术在游戏生命周期的全链路上的贯通和覆盖。目前,在包括策划、动作、美术、音频、程序、测试、营销和运营的环节,网易的AI技术正在全面赋能。 

让子弹先飞会儿

一个共同的走向是,巨头们在AI上的发力并不是仅仅为了游戏,而是不断思考更广泛实用的商业场景,以及游戏业务可能与之产生的化学反应。

这几年大众触点较多的AI使用场景就是自动驾驶,在实际的场景测试里,自动驾驶公司很难创造或者遇到极限场景,比如暴雨+冰雹的复杂路况,或者高速公路上闯入的动物及行人这种突发事件。这往往会造成测试数据的局限。

然而在游戏世界,利用AI技术的测试数据获取成本就相对较低。而模拟场景中的无限撞车,或持续过弯,都能在AI的短时多次测试中得到一个相对可行的解决路径。

在赛博朋克的时代,AI技术在产业端的落地只是时间早晚问题,技术深度是目前要突破的方向。先前我提到的来自大众认知层面最大的争议点,实际在AI是否能取代人上。

在科学技术螺旋上升的前期阶段,这种讨论其实会牵绊住前进的步伐,不如让子弹飞一会儿,看以后的发展,道德伦理与法律法规必然是伴随技术的进步随之发展的。

我这里倒是会用网易互娱AI Lab虚拟偶像制作的相关技术来解释一下我自己的观点,为什么我会认为目前AI之益远大于弊。

2021年跨年之际,数字人「万一」登上了浙江卫视的跨年晚会,其生动的面部表情是由网易互娱AI Lab的AIxFace面部动捕技术打造的。这种配置首先就为具备即时性、现场感的直播晚会增强了科技感,其次虚拟人的神态高度真人化也让互动更为有趣。

依靠AIxFace面部动捕技术,女孩的眼神、唇动、眉毛、甚至法令纹等变化都细致入微,在交谈和说话时,她发出的每一个字也能精准匹配口型。

而网易互娱AI Lab开发的这种轻量级面部动捕系统,与传统面部动捕技术的最大区别在于,不需要复杂专业的动作捕捉场地和设备,也不需要设置任何面部标记点,只需要一个单目摄像头,就可以实时将演员的面部表情迁移到可以脸上,并实现舌头、视线、口型等表情细节变化的精准跟踪。

表情的丰富、自然和准确程度,自然是数字人在互动真实感上的直接体现。此外,虚拟偶像是否像真人爱豆那样兼具唱跳能力,也是评判其真实感的重要标准之一。

在此之前,AxFace技术已经在《第五人格》Bilibili秃秃杯游戏决赛的侦探主播中落地,即时的互动、极具情绪感染力,让虚拟偶像挣脱了虚拟的限制,真正实现了「次元壁的突破」。

事实上,游戏AI和非游戏AI的技术核心是一致的,只是数据、应用场景和优化目标不同。两者的互相赋能、协同发展是一致的。

在未来,人类和游戏的交互会呈现愈加多元化的趋势。可以遇见的是,未来的人机交互并不是一个单一的技术驱动,而会是一个综合方案,它或许能够让电脑像真人一样通过眼球追踪、语音分析和肢体语言去理解玩家的意图。

当然,这不止取决于AI技术的进步,也取决于游戏设备和游戏产品本身的演进。而这两者,会更深刻地丰富人类的游戏体验和快乐感受。