它是一个简单的驾驶模拟器,但可能是视频游戏图形革命的开始。
当前的人工智能蓬勃发展在一个令人惊讶的领域:图片和电影创作领域产生了非凡的成果。最近的例子由芯片设计师Nvidia提出,该公司今天发表了有关演示如何将AI生成的视觉效果与常规视频游戏一起使用的研究。结果是一种混合图形系统,有一天可以在视频游戏,电影和虚拟现实中使用。
这是一种利用深度学习渲染视频内容的新方法。显然,Nvidia非常重视生成图像,而游戏行业正在考虑AI将如何革新该领域。
Nvidia的工作结果不是真实感,并且揭示了在基本上AI生成的图像中看到的商标视觉拖尾现象。它们也不是完全新颖的。在Nvidia的研究论文中,该公司的工程师描述了他们如何基于许多现有方法构建,例如一种有影响力的开源系统pix2pix。它们的功能部署了一种称为生成型社会系统甚至GAN的神经网络。这些被广泛用于AI图像生成中,包括介绍佳士得最近出售的AI肖像。
但是,Nvidia引入了多项发明,并称这项工作的一个产品是有史以来第一个具有AI生成图形的视频游戏演示。这是一个简单的驾驶模拟,玩家可以浏览几个AI生成空间的城市街区,但不能离开自己的车辆或与外界互动。该演示仅支持一个GPU-对于此类前沿工作而言,这是一项了不起的成就。 (尽管可以肯定的是,GPU是该公司售价高达3,000美元的Titan V的最高端,“ Titan V”是“有史以来最有效的PC GPU”,并且通常用于高级模拟处理而不是游戏)。
Nvidia的系统使用一些动作即可创建图形。首先,研究人员必须收集训练数据,在这种情况下,该数据已从用于自动驾驶研究的开源数据集中删除。然后将这些素材进行分割,这意味着将每个帧分为不同的类别:天空,树木,汽车,道路,建筑物等。然后,使用此特定数据训练生成的对抗网络,以生成这些项目的新变体。
然后,工程师使用传统的游戏引擎制作了数字环境的基本拓扑。在这种情况下,系统是虚幻引擎4,然后是诸如Fortnite,PUBG,Gears of War 4之类的游戏中使用的最受欢迎的引擎。以此环境为框架,深度学习算法随后会实时为每个不同类别的事物创建图形,并将其粘贴到游戏引擎的模型中。
Nvidia受雇于深度学习的副总裁Bryan Catanzaro澄清说: “世界的安排是传统的,人工智能唯一产生的就是图像。”他补充说,演示本身是基本的,并且是由一名工程师组成的。 “这是概念验证,而不是有趣的游戏”。
为了制作此程序,Nvidia的工程师需要应对许多挑战,其中最大的挑战是物体的持久性。问题是,如果深度学习计算以每秒25帧的速度为世界生成图形,那么它们如何保持外观相同?卡坦扎罗说,这种困难意味着机器的初始结果“检查起来很痛苦”,因为颜色和纹理“每帧都在变化”。
解决的办法是为机器提供一个临时的内存,以便将每个新帧与以前的内存进行比较。它试图预测诸如这些图片中的运动之类的东西,并生成与屏幕上的内容一致的新帧。但是,所有这些计算都很昂贵,因此游戏仅以每分钟25帧的速度运行。
卡坦扎罗(Catanzaro)强调说,这项技术还处于早期阶段,可能需要数十年的时间,人工智能生成的图形才会出现在消费者的名字中。他将这种情况与光束跟踪的发展进行了比较,光束跟踪是当前图像制作中的热门技术,该技术可以立即生成单个光束以在数字环境中产生逼真的反射,阴影和不透明度。他说:“最早的交互式射线追踪演示是在很久以前发生的,但是直到两周前我们才批量生产它。”
不过,这项工作确实有可能在不同的研究领域中得到应用,包括机器人技术和自动驾驶汽车,它们可以在其中用于产生训练环境。尽管功能有限,但它可以更早地出现在消费品中。
例如,可以在混合图片系统中使用该技术,在该系统中,大多数游戏都是使用传统方法完成的,但是AI被用来创建个人或物体的相似度。消费者可以使用智能手机自己拍摄素材,然后将这些信息上传到云中,计算将学习复制到云中,然后将其插入火柴中。例如,它可以使创建看起来像游戏玩家的化身变得容易得多。
但是,这种技术提出了一些明显的问题。最近,专家们越来越担心使用AI生成的虚假信息(例如虚假信息和宣传)。研究人员表明,创建政客和名人的假镜头很容易,因为他们伪造了政客和名人的言行,这是不正当手中的有力武器。通过推动这项技术的能力并发布其研究成果,Nvidia无疑可以为这一可能的问题做出贡献……
不过,该组织表示这是一个新问题。卡坦扎罗说:“(这项技术)可以用来产生误导性的内容吗?是的。可以使用任何渲染技术来做到这一点。”他说,Nvidia正在与合作伙伴一起研究检测AI伪造品的方法,但最终错误信息的问题是“信任问题”,并且像之前的大多数信任问题一样,它需要使用一系列流程来解决,而不是简单地技术..
卡坦扎罗说,像Nvidia这样的科技公司只能承担这么多的责任。 “您能使电力公司承担责任,因为他们为生产假视频的计算机提供了电力吗?”他问。
最终,对于Nvidia而言,推进AI生成的图像具有明显的优势:它有助于推广其组织的更多硬件。自从2010年代初深度学习热潮开始以来,英伟达的股价就飙升了,因为很明显其计算机芯片非常适合于机器学习研究和发展。
那么计算机图形学领域的AI革命是否会对组织的收入产生好处? Catanzaro笑着说,当然不会受伤。 “任何增强我们创建更逼真的图像效果的能力,相信对于Nvidia的利润来说都是巨大的。”
参考: 边缘