Nvidiaは、AIで生成されたグラフィックスを使用してビデオゲームの未来を発表しました

Nvidiaは、AIで生成されたグラフィックスを使用してビデオゲームの未来を発表しました

これは単純なドライビングシミュレータですが、ビデオゲームのグラフィックスの革命の始まりかもしれません。

人工知能の現在のブームは、やや意外な領域で驚くべき結果を生み出しました:写真と映画の作成の分野。最新の例は、チップデザイナーのNvidiaによって提示されました。このデザイナーは、AIで生成されたビジュアルを従来のビデオゲームでどのように使用できるかを実証する研究を本日発表しました。その結果、いつの日かビデオゲーム、映画、バーチャルリアリティで使用できるハイブリッドグラフィックシステムが実現します。

これは、ディープラーニングを利用してビデオコンテンツをレンダリングするための新しいアプローチです。明らかに、Nvidiaは画像の生成にかなりの関心を持っており、ゲーム業界はAIがこの分野にどのように革命を起こすかを検討しています。

Nvidiaの作業の結果は写実的ではなく、実質的にAIで生成された画像に見られるトレードマークの視覚的な汚れを明らかにしています。それらはまた完全に斬新ではありません。 Nvidiaの研究論文では、同社のエンジニアが、pix2pixとして知られる影響力のあるオープンソースシステムなど、現在の多くの方法に基づいてどのように構築したかについて説明しています。それらの機能は、生成的社会システムまたはGANとしても知られる一種のニューラルネットワークを展開します。これらは、最近Christie'sによって販売されたAIポートレートの導入など、AI画像の生成に広く利用されています。

ただし、Nvidiaはいくつかの発明を導入しており、その成果の1つは、AIで生成されたグラフィックスを使用した初めてのビデオゲームプレゼンテーションであると述べています。これは簡単なドライビングシミュレーションで、プレイヤーはAIで生成された空間のいくつかの街区を閲覧しますが、車を離れたり、外の世界と対話したりすることはできません。デモは1つのGPUのみで動作します。これは、このような最先端の作業の目覚ましい成果です。 (確かに、GPUは同社のリーチ$ 3,000 Titan Vのトップであり、「これまでに作成された中で最も効果的なPC GPU」であり、ゲームではなく高度なシミュレーション処理に一般的に使用されています。)

Nvidiaのシステムは、いくつかのアクションを使用してグラフィックを作成します。まず、研究者はトレーニングデータを収集する必要があります。この場合、自動運転の研究に使用されるオープンソースのデータセットから削除されています。次に、この映像はセグメント化されます。つまり、各フレームは、空、木、車、道路、建物などのさまざまなクラスに分割されます。次に、生成的敵対的ネットワークがこの特定のデータでトレーニングされ、これらのアイテムの新しいバリアントが生成されます。

次に、エンジニアは従来のゲームエンジンを使用してデジタル環境の基本的なトポロジを作成しました。このような場合、システムはUnreal Engine 4であり、Fortnite、PUBG、Gears of War4などのタイトルに使用されたお気に入りのエンジンでした。この環境をフレームワークとして使用して、ディープラーニングアルゴリズムはその後、実際の時間でさまざまなクラスのグラフィックを作成し、それらをゲームエンジンのモデルに接着します。

「世界の配置は伝統的に行われてきました。AIが生成するのは画像だけです」と、 Nvidiaの採用ディープラーニング担当副社長であるブライアンカタンツァーロは明言します。彼は、デモンストレーション自体が基本であり、1人のエンジニアによってまとめられたと付け加えています。 「プレイするのが楽しいゲームではなく、概念実証です」。

このプログラムを作成するために、Nvidiaのエンジニアは多くの課題に取り組む必要がありましたが、その最大のものはオブジェクトの永続性でした。問題は、深層学習の計算が毎秒25フレームの速度で世界のグラフィックスを生成している場合、どのようにして同じように見えるものを維持するのかということです。カタンザロ氏によると、この難しさは、色やテクスチャが「フレームごとに変わる」ため、マシンの最初の結果が「チェックインするのが面倒」だったことを意味します。

解決策は、マシンに一時的なメモリを与えることでした。これにより、新しい各フレームが以前のフレームと比較されます。これらの画像内の動きなどを予測し、画面に表示されているものと一致する新しいフレームを生成しようとします。ただし、この計算はすべてコストがかかるため、ゲームは1分あたり25フレームでしか実行されません。

テクノロジーは非常に初期段階にあり、カタンザロ氏は強調しています。AIで生成されたグラフィックスが消費者の名前で表示されるまでには、おそらく数十年かかるでしょう。彼はこの状況を、デジタル環境でリアルな反射、影、不透明度を生成するために個々の光線が瞬時に生成される画像作成の現在のホットな手法であるビームトレースの開発と比較します。 「最初のインタラクティブなレイトレーシングのデモンストレーションはずっと前に行われましたが、ほんの数週間前までバッチで取得できませんでした」と彼は述べています。

この作業は、ロボット工学や自動運転車など、さまざまな研究分野で応用できる可能性があり、トレーニング環境を生成するために使用できます。そしてそれは、より限定された能力ではあるが、より早く消費財に現れる可能性がある。

たとえば、このテクノロジーは、ゲームの大部分が従来の方法を使用して残されるハイブリッド画像システムで利用できますが、AIは個人またはオブジェクトの肖像を作成するために利用されます。消費者はスマートフォンを使用して自分で映像をキャッチし、この情報をクラウドにアップロードして、計算でコピーして試合に挿入することを学習できます。たとえば、ゲーマーのように見えるアバターを作成するのがはるかに簡単になる可能性があります。

ただし、この種のテクノロジーには明らかな疑問があります。最近、専門家は、偽情報やプロパガンダなど、AIによって生成されたディープフェイクの使用についてますます懸念するようになっています。研究者たちは、政治家や有名人がしなかったことをしたり言ったりする偽の映像を簡単に作成できることを示しました。これは、誤った手に渡る強力な武器です。テクノロジーの能力を推し進め、その研究を発表することにより、Nvidiaは間違いなくこの起こりうる問題に貢献しています…

組織は、しかし、これは新しい問題であると言います。 「[このテクノロジー]は誤解を招くコンテンツを作成するために使用される可能性がありますか?はい。レンダリングのための任意のテクノロジーを使用してそれを行うことができます」とCatanzaro氏は述べています。 Nvidiaはパートナーと協力してAI偽物を検出する方法を研究していると彼は言いますが、最終的には誤った情報の問題は「信頼の問題」であり、それ以前のほとんどの信頼の問題と同様に、単純ではなく一連のプロセスを使用して解決する必要があります。技術的。

Catanzaroは、Nvidiaのようなテクノロジー企業はそれほど多くの責任を負うことしかできないと言います。 「偽のビデオを生成するコンピューターに電力を供給する電力を作ったので、電力会社に説明責任を負わせることができますか?」彼は尋ねます。

そして最終的に、Nvidiaにとって、AIで生成された画像を推進することには明らかな利点があります。それは、組織のハードウェアをより多く宣伝するのに役立ちます。 2010年代初頭にディープラーニングブームが始まって以来、Nvidiaの株価は、そのコンピューターチップが機械学習の研究と進歩に理想的に適していることが明らかになったため、急騰しました。

では、コンピュータグラフィックスのAI革命は、組織の収益に役立つでしょうか?それは確かに傷つくことはないだろう、カタンザロは笑う。 「より現実的で説得力のある画像を作成する能力を高めるものはすべて、Nvidiaの収益にとって素晴らしいと思います。」

参照The Verge