Dans le domaine du jeu vidéo, l'intelligence artificielle renvoie depuis longtemps à des techniques comme les machines à états finis ou les arbres de comportement. Un développeur propose aujourd'hui une approche différente : employer un réseau de neurones de type transformer pour adapter la difficulté en quasi-temps réel, sans recourir au traditionnel curseur de difficulté.

Un modèle entraîné sur le comportement du joueur

Le créateur du projet a conçu une démonstration technique dans laquelle les vagues d'ennemis sont gérées par un petit modèle de transformeur. Toutes les quatre secondes, le réseau capture un instantané de la partie — incluant la direction du joueur, sa position, le nombre d'ennemis à l'écran, le temps écoulé depuis la dernière mort, le nombre de vies restantes, ou encore le total des éliminations récentes. À partir de ces données, il choisit une action parmi un ensemble prédéfini : faire apparaître certains types d'ennemis, augmenter ou réduire la pression globale (cadence d'apparition et budget alloué aux ennemis élites), laisser un répit au joueur, ou déclencher une vague massive d'attaque.

Un entraînement manuel et une intégration simplifiée

La partie la plus laborieuse a consisté à constituer un jeu de données d'apprentissage. Le jeu inclut une fonction qui enregistre automatiquement un instantané du jeu accompagné d'une capture d'écran. Le développeur a étiqueté manuellement plus de mille entrées, en évaluant chaque situation. Le modèle a ensuite été entraîné sur une vingtaine d'époques avec arrêt précoce pour éviter le sur-apprentissage, une opération qui n'a nécessité que peu de temps.

Une fois entraîné, le modèle a été converti dans un format compatible avec le moteur de jeu Godot. Bien que Godot ne prenne pas nativement en charge des formats comme ONNX, la petite taille du réseau a permis une conversion aisée.

Space Base Bomb Run : une preuve de concept

Le jeu utilisé pour cette démonstration s'intitule « Space Base Bomb Run » (SBBR). Il s'agit d'un shoot-em-up à défilement vertical où le « maître du jeu » neuronal ajuste les vagues d'ennemis. Le joueur peut visualiser le fonctionnement du réseau en appuyant sur la touche « v », même si cette superposition occupe une partie de l'écran.

Le développeur précise que SBBR n'est qu'une démonstration technique, et non un titre commercialisable. L'intégralité du code source, du projet Godot, des scripts d'entraînement et des outils d'étiquetage sont disponibles sur une plateforme de partage de code, permettant à quiconque de reproduire l'expérience ou d'entraîner son propre modèle.

Cette approche ouvre des perspectives pour des jeux dont la difficulté s'adapte finement au niveau réel du joueur, sans intervention manuelle de celui-ci. Elle illustre également comment des modèles d'IA légers, bien plus petits que les grands modèles de langage, peuvent être intégrés dans des jeux pour enrichir l'expérience.