Google, avec son nouveau moteur GameNGen, peut faire tourner le premier Doom d’id Software à 20 FPS. Cela peut sembler médiocre, cependant, chacune des images du jeu est générée par l’intelligence artificielle.
Faire tourner Doom d’id Software (1993) sur n’importe quel support est depuis longtemps l’un des passe-temps préférés des développeurs de toutes sortes. Le FPS mythique, vieux de plus de 30 ans, peut même tourner dans le gestionnaire de tâches de Windows.
Dans sa recherche sur l’intelligence artificielle, Google s’est récemment servi de Doom pour mettre en avant sa nouvelle technologie : GameNGen. Ce moteur de jeu alimenté par l’IA serait capable de générer chaque image du jeu en temps réel et en fonction des actions du joueur.
Cela représente une avancée conséquente dans ce domaine de la high-tech et préfigure un avenir particulièrement intéressant pour les outils de génération d’images. Utilisées par les joueurs afin de lisser leur expérience de jeu et gagner quelques images par seconde, ces technologies sont devenues quasiment incontournables et bénéficient d’améliorations régulières.
Néanmoins, que ce soit le DLSS 3 de NVIDIA ou l’AFMF 2 d’AMD, aucune n’est au niveau du GameNGen de Google. Après tout, le moteur de la firme de Mountain View est capable de recréer un jeu entier. Certes, il est suffisamment peu gourmand pour tourner sur une calculatrice, mais le fait de générer chacune des images du jeu en temps réel reste impressionnant.
Google recréer Doom grâce à l’IA
Pour arriver à ce résultat, les équipes de Google ont entraîné leur IA spécifiquement sur le FPS d’id Software. Elles ont ensuite chargé une version modifiée de Stable Diffusion (un outil de génération d’images) de recréer le jeu. Afin d’améliorer le rendu graphique et le travail d’inférence de l’IA, les développeurs ont chiffré les frames du jeu à l’aide de bruit gaussien.
Évidemment, bien que la technologie soit performante, elle a également ses limites. Le jeu est certes extrêmement bien rendu, mais le manque de “support physique” des images sur lequel l’IA peut se baser afin d’en générer de nouvelles réduit la qualité graphique globale du titre.
Chaque image étant générée indépendamment des autres, cela résulte en l’apparition d’artefacts visuels ainsi qu’une baisse de la cohérence. Sur GameNGen, Doom tourne malgré tout à 20 FPS. Cela peut sembler peu, cependant, le fait que chaque image soit générée par l’IA rend le travail de Google véritablement impressionnant.
Actuellement, les outils de génération de frames se contentent d’une ou deux images générées par l’IA, intercalées entre celles calculées normalement. Seul l’outil Lossless Scaling propose de quadrupler les FPS en interpolant trois images.
La capacité de GameNGen à générer dix fois plus d’images que les technologies courantes est donc assez éloquente. Certes, la qualité et la fluidité ne sont pas encore au rendez-vous, mais cela reste un tour de force. Il serait intéressant, à l’avenir, de voir Google partager ses avancées avec d’autres développeurs ou tout simplement les inspirer afin d’améliorer encore les outils à disposition des joueurs.
- Google et son moteur GameNGen ont recréé Doom 1993.
- Chacune des images du jeu est générée par l’IA en temps réel.
- Le jeu tourne à 20 FPS seulement.
Source : Arxiv.org
Ah ils ont enfin trouvé un truc utile à faire avec une IA. ^^
C’est vraiment très très impressionnant !
Le fait de rajouter des frames supplémentaires est quand même extrêmement cadré en comparaison, on doit “juste” générer une image intermédiaire entre deux images de référence, et en plus de ça on a les motion vectors qui sont aussi calculés par le moteur de jeu qui donnent le mouvement de chaque pixel. C’est difficile de complètement se planter.
Là, le fait que l’intégralité du jeu soit halluciné c’est un tout autre monde ! Il y a un contexte qui reste cohérent, la logique du jeu, tout est là, on peut interagir avec, et même si c’est pas parfait, ça marche !
et quid de la puissance machine nécessaire à faire tourner ça? car si pour faire tourner un jeu fonctionnant sur une calculette, il fait un barrage hydro électrique le rendement perf/Energie serait bien dégueu… (ce qui doit être le cas!). C’est une démo OK, mais ne faisons pas faire n’importe quoi aux outils… et ne choisissons pas n’importe quel outil pour certaines taches… (comme au boulot…)
Je suis d’accord avec l’idée globale, mais toute nouvelle technologie passe à un moment où un autre l’étape “c’est pas rentable/prêt pour le moment”.
Je vois plutôt ça comme une validation technique du concept, on est encore loin de la mise en production (pour différentes raisons, dont le rendement énergétique).