Это простой симулятор вождения, но он может стать началом революции в графике видеоигр.
Нынешний бум искусственного интеллекта дал замечательные результаты в несколько неожиданной области: в области создания изображений и фильмов. Самый последний пример был представлен разработчиком микросхем Nvidia, которая сегодня опубликовала исследование, демонстрирующее, как визуальные эффекты, созданные искусственным интеллектом, могут быть использованы в обычной видеоигре. Результатом является гибридная графическая система, которую однажды можно будет использовать в видеоиграх, фильмах и виртуальной реальности .
Это новый подход к рендерингу видеоконтента с использованием глубокого обучения. Очевидно, что Nvidia очень заботится о создании изображений, и игровая индустрия рассматривает вопрос о том, как ИИ произведет революцию в этой области.
Результаты работы Nvidia не фотореалистичны и демонстрируют фирменное визуальное размытие, которое наблюдается в изображениях, созданных в основном с помощью искусственного интеллекта. Они также не совсем новы. В исследовательском документе Nvidia инженеры компании описывают, как они построили ряд существующих методов, таких как влиятельная система с открытым исходным кодом, известная как pix2pix. Их функции развертывают своего рода нейронную сеть, известную как генеративная социальная система или даже GAN. Они широко используются при создании изображений AI, в том числе для представления портретов AI, недавно проданных Christie's.
Тем не менее, Nvidia представила несколько изобретений, и одним из результатов работы, по ее словам, является первая презентация видеоигр с графикой, созданной с помощью искусственного интеллекта. Это простой симулятор вождения, в котором игроки просматривают пару городских кварталов пространства, созданного искусственным интеллектом, но не могут покинуть свой автомобиль или взаимодействовать с внешним миром. Демонстрационная версия оснащена только одним графическим процессором - замечательное достижение для такой передовой работы. (Хотя, по общему признанию, этот графический процессор является вершиной компании Titan V за 3000 долларов, «самый эффективный графический процессор для ПК из когда-либо созданных» и обычно используемый для расширенной обработки моделирования, а не для игр.)
Система Nvidia создает графику с помощью нескольких действий. Во-первых, исследователи должны собрать данные для обучения, которые в данном случае были удалены из наборов данных с открытым исходным кодом, используемых для исследования автономного вождения. Этот видеоматериал затем сегментируется, то есть каждый кадр делится на различные классы: небо, деревья, автомобили, дорога, здания и т. Д. Генеративная противоборствующая сеть затем обучается с этими конкретными данными для создания новых вариантов этих элементов.
Затем инженеры создали базовую топологию цифровой среды, используя традиционный игровой движок. В подобных случаях системой был Unreal Engine 4, затем любимый движок, используемый для таких игр, как Fortnite, PUBG, Gears of War 4 и некоторых других. Используя эту среду в качестве основы, алгоритмы глубокого обучения впоследствии создают графику для каждого отдельного класса вещей в реальном времени, приклеивая их к моделям игрового движка.
«Мир устроен традиционно, - поясняет вице-президент Nvidia по глубокому обучению Брайан Катандзаро, - единственное, что генерирует ИИ, - это изображения». Он добавляет, что демонстрация является фундаментальной и была создана одним инженером. «Это доказательство концепции, а не игра, в которую весело играть».
Чтобы создать эту программу, инженерам Nvidia пришлось поработать над множеством проблем, самой большой из которых была постоянство объектов. Проблема в том, что если вычисления глубокого обучения генерируют графику для мира со скоростью 25 кадров в секунду, как они сохраняют то же самое? Катандзаро говорит, что эта трудность означала, что первоначальный результат работы машины был « болезненным для проверки », поскольку цвета и текстуры «менялись каждый кадр».
Решением было предоставить машине временную память, чтобы она сравнивала каждый новый кадр с предыдущим. Он пытается предсказать такие вещи, как движение внутри этих изображений, и генерирует новые кадры, соответствующие тому, что отображается на экране. Однако все эти вычисления являются дорогостоящими, и поэтому игра работает только со скоростью 25 кадров в минуту.
По словам Катандзаро, технологии находятся на ранней стадии развития, и, вероятно, пройдут десятилетия, прежде чем графика, созданная искусственным интеллектом, появится в именах потребителей. Он сравнивает ситуацию с развитием трассировки луча, нынешней горячей техники создания изображений, при которой отдельные лучи света генерируются мгновенно, создавая реалистичные отражения, тени и непрозрачность в цифровой среде. «Самая первая демонстрация интерактивной трассировки лучей произошла задолго до этого, но мы не получали ее партиями всего пару недель назад», - заявляет он.
Однако у этой работы есть возможные приложения в различных областях исследований, включая робототехнику и беспилотные автомобили, в которых ее можно использовать для создания тренировочной среды. И он может появиться в потребительских товарах раньше, хотя и с более ограниченными возможностями.
Например, эту технологию можно использовать в гибридной системе изображения, где большая часть игры остается с использованием традиционных методов, однако ИИ используется для создания подобий людей или объектов. Потребители могут сами снимать кадры с помощью смартфонов, а затем загружать эту информацию в облако, где расчеты научатся копировать ее, а затем вставлять в спички. Например, это могло бы упростить создание аватаров, похожих на геймеров.
Однако такая технология вызывает ряд очевидных вопросов. В последнее время экспертов все больше беспокоит использование созданных искусственным интеллектом дипфейков, таких как дезинформация и пропаганда. Исследователи показали, что легко создать фальшивые кадры, на которых политики и знаменитости делают или говорят то, чего они не делали, - это мощное оружие в неправильных руках. Продвигая вперед возможности технологии и публикуя свое исследование, Nvidia, вероятно, способствует решению этой возможной проблемы ...
Однако организация заявляет, что это новая проблема. «Может [эта технология] используется для создания контента, который вводит в заблуждение? Да. Для этого можно использовать любую технологию рендеринга », - заявляет Катандзаро. Он говорит, что Nvidia работает с партнерами над поиском методов обнаружения подделок искусственного интеллекта, но в конечном итоге проблема дезинформации - это «проблема доверия». технологический ..
Катандзаро говорит, что технологические компании, такие как Nvidia, могут взять на себя только такую большую ответственность. «Можете ли вы привлечь к ответственности энергетическую компанию за то, что они вырабатывали электричество, питающее компьютер, производящий фальшивое видео?» Он спрашивает.
И, в конечном счете, для Nvidia продвижение изображений, созданных с помощью искусственного интеллекта, имеет явное преимущество: это помогает продвигать больше оборудования их организации. С тех пор, как в начале 2010-х начался бум глубокого обучения, цена акций Nvidia резко выросла, поскольку стало очевидно, что ее компьютерные чипы идеально подходят для исследований и развития машинного обучения.
Так может ли революция искусственного интеллекта в компьютерной графике принести пользу организации? «Конечно, это не повредит», - смеется Катандзаро. «Все, что увеличивает нашу способность создавать более реалистичные и убедительные изображения, я считаю, отлично подходит для прибыли Nvidia».
Ссылка : The Verge