É um simulador de direção simples, mas pode ser o início de uma revolução nos gráficos de videogames.
O atual boom da inteligência artificial gerou resultados notáveis em um reino um tanto surpreendente: a área de criação de imagens e filmes. O exemplo mais recente foi apresentado pelo designer de chips Nvidia, que publicou hoje uma pesquisa para demonstrar como os visuais gerados por IA podem ser usados com um videogame convencional. O resultado é um sistema gráfico híbrido que poderá um dia ser usado em videogames, filmes e realidade virtual .
É uma nova abordagem para renderizar conteúdo de vídeo utilizando aprendizado profundo. Obviamente, a Nvidia se preocupa muito com a geração de imagens e a indústria de jogos está considerando como a IA revolucionará o campo.
Os resultados do trabalho da Nvidia não são fotorrealistas e revelam a mancha visual característica vista em imagens substancialmente geradas por IA. Eles também não são totalmente novos. Em um artigo de pesquisa da Nvidia, os engenheiros da empresa descrevem como se basearam em vários métodos atuais, como um influente sistema de código aberto conhecido como pix2pix. Suas funções implantam uma espécie de rede neural conhecida como sistema social generativo ou mesmo GAN. Eles são amplamente utilizados na geração de imagens de IA, inclusive para a introdução de um retrato de IA vendido recentemente pela Christie's.
No entanto, a Nvidia introduziu várias invenções e um produto do trabalho, diz, é a primeira apresentação de videogame com gráficos gerados por IA. É uma simulação de direção fácil na qual os jogadores navegam em alguns quarteirões da cidade de um espaço gerado por IA, mas não podem deixar seu veículo ou interagir com o mundo exterior. A demonstração é alimentada por apenas uma GPU - uma realização notável para esse trabalho de ponta. (Embora reconhecidamente a GPU seja a empresa com a marca de US $ 3.000 no Titan V, "a GPU para PC mais eficaz já criada" e geralmente usada para processamento de simulação avançado, em oposição a jogos.
O sistema da Nvidia cria gráficos usando algumas ações. Primeiro, os pesquisadores precisam coletar dados de treinamento, que, neste caso, foram removidos de conjuntos de dados de código aberto utilizados para pesquisa de direção autônoma. Essa filmagem é então segmentada, o que significa que cada quadro é dividido em várias classes: céus, árvores, carros, estradas, edifícios, etc. Uma rede adversária geradora é então treinada com esses dados específicos para gerar novas variantes desses itens.
Em seguida, os engenheiros fizeram a topologia básica do ambiente digital empregando um motor de jogo tradicional. Em casos como esse, o sistema era Unreal Engine 4, então um mecanismo favorito utilizado para títulos como Fortnite, PUBG, Gears of War 4 e vários outros. Usando esse ambiente como uma estrutura, algoritmos de aprendizado profundo subsequentemente criam os gráficos para cada classe diferente de coisa em tempo real, colando-os aos modelos do motor de jogo.
"O arranjo do mundo foi feito tradicionalmente", esclarece o vice-presidente de aprendizado profundo empregado da Nvidia, Bryan Catanzaro, "a única coisa que a IA gera são as imagens." Ele acrescenta que a própria demonstração é fundamental e foi montada por um único engenheiro. “É uma prova de conceito em vez de um jogo divertido de jogar”.
Para fazer este programa, os engenheiros da Nvidia precisaram trabalhar em muitos desafios, o maior dos quais era a permanência do objeto. O problema é se os cálculos de aprendizado profundo estão gerando os gráficos para o mundo a uma velocidade de 25 quadros por segundo, como eles mantêm as coisas com a mesma aparência? Catanzaro diz que essa dificuldade significava que o resultado inicial da máquina era " doloroso de verificar ", pois as cores e texturas "mudavam todos os quadros".
A solução foi dar à máquina uma memória temporária, para que ela comparasse cada novo quadro com o que existia antes. Ele tenta prever coisas como movimento dentro dessas imagens e gera novos quadros que são consistentes com o que está na tela. Porém, todo esse cálculo é caro e, portanto, o jogo só roda a 25 quadros por minuto.
As tecnologias estão em seus estágios iniciais, enfatiza Catanzaro, e provavelmente levará décadas antes que os gráficos gerados por IA apareçam nos nomes dos consumidores. Ele compara a situação com o desenvolvimento do traçado do feixe, a técnica atual em imagens em que feixes individuais de luz são gerados instantaneamente para produzir reflexos, sombras e opacidade realistas em ambientes digitais. "A primeira demonstração interativa de traçado de raios ocorreu muito, muito tempo antes, mas não a recebíamos em lotes até apenas algumas semanas atrás" , afirma ele.
O trabalho tem aplicações possíveis em diferentes áreas de pesquisa, porém, incluindo robótica e carros autônomos, nos quais pode ser utilizado para gerar ambientes de treinamento. E pode aparecer em bens de consumo mais cedo, embora com uma capacidade mais limitada.
Por exemplo, esta tecnologia poderia ser utilizada em um sistema de imagem híbrido, onde a maior parte do jogo é deixada usando métodos tradicionais, no entanto, a IA é utilizada para criar a semelhança de indivíduos ou objetos. Os consumidores podiam capturar imagens usando smartphones e, em seguida, enviar essas informações para a nuvem, onde os cálculos aprenderiam a copiá-las e depois inseri-las nas correspondências. Isso poderia tornar muito mais fácil criar avatares que se parecem com jogadores, por exemplo.
Esse tipo de tecnologia levanta algumas questões óbvias, no entanto. Recentemente, os especialistas estão cada vez mais preocupados com o uso de deepfakes gerados por IA, como desinformação e propaganda. Os pesquisadores mostraram que é fácil criar filmagens falsas de políticos e celebridades fazendo ou dizendo coisas que não fizeram, uma arma poderosa nas mãos incorretas. Ao levar adiante as habilidades da tecnologia e publicar seu estudo, a Nvidia está indiscutivelmente contribuindo para este possível problema ...
A organização, porém, diz que esse é um problema novo. “Pode [essa tecnologia] ser usada para produzir conteúdo enganoso? Sim. Qualquer tecnologia de renderização pode ser usada para fazer isso ”, afirma Catanzaro. Ele diz que a Nvidia está trabalhando com parceiros para pesquisar métodos para detectar falsificações de IA, mas no final das contas o problema de desinformação é um "problema de confiança" e, como a maioria dos problemas de confiança anteriores, precisará ser resolvido usando uma série de processos, não simplesmente tecnológica..
Catanzaro diz que empresas de tecnologia como a Nvidia podem assumir uma certa responsabilidade. "Você pode responsabilizar a empresa de energia porque ela fez a eletricidade que alimenta o computador que produz o vídeo falso?" Ele pergunta.
E, em última análise, para a Nvidia, avançar com imagens geradas por IA tem uma vantagem clara: ajuda a promover mais o hardware de sua organização. Desde que o boom do aprendizado profundo decolou no início de 2010, o preço das ações da Nvidia disparou, pois ficou óbvio que seus chips de computador eram ideais para pesquisas e avanços em aprendizado de máquina.
Então, uma revolução da IA na computação gráfica poderia ser boa para os lucros da organização? Certamente não faria mal, Catanzaro ri. "Acredito que qualquer coisa que aumente nossa capacidade de criar imagens mais realistas e atraentes é ótimo para os resultados financeiros da Nvidia."
Referência : The Verge