Une quête de cohérence visuelle pour les récits illustrés

Un utilisateur a récemment partagé sur un forum en ligne dédié aux technologies sa recherche d'un modèle génératif capable de répondre à un besoin précis : transformer les notes d'une campagne de jeu de rôle entre amis en une bande dessinée cohérente. Il souhaite que l'outil permette dans un premier temps de créer des designs de personnages distincts et réutilisables (par exemple un ogre, un mage, un dragonborn), puis, dans un second temps, de générer des planches de bande dessinée respectant ces designs tout en suivant le scénario fourni.

Les limites des modèles actuels

L'utilisateur constate que les modèles génératifs qu'il a pu tester ne parviennent pas à maintenir une identité visuelle stable d'une image à l'autre. Il souligne que, à l'exception de quelques modèles dont les designs sont directement inspirés d'un style visuel précis (évoquant par exemple l'univers du Studio Ghibli), aucune solution ne permet de conserver un personnage donné au fil des générations. Chaque nouvelle image produit un rendu différent, rendant impossible la réalisation d'une bande dessinée où les mêmes protagonistes apparaissent de façon reconnaissable dans chaque case.

Un besoin non satisfait

La demande exprimée rejoint un enjeu majeur de la génération d'images par intelligence artificielle : la consistance des personnages. Si les modèles de texte vers image (comme DALL-E, Midjourney ou Stable Diffusion) excellent dans la création d'illustrations uniques, ils peinent à assurer que le même personnage, décrit par les mêmes attributs, apparaisse identique d'une scène à l'autre. Ce problème est d'autant plus critique pour la narration graphique, où la continuité des traits, de la tenue et de la posture est essentielle.

Vers une solution ?

La question posée sur la plateforme invite la communauté à proposer des modèles, qu'ils soient gratuits ou payants, qui permettraient cette double fonctionnalité : conception de personnages et génération de planches cohérentes. L'utilisateur précise qu'il dispose de notes détaillées d'une longue campagne, ce qui donne une base narrative solide. Pour l'instant, aucun modèle connu ne répond pleinement à ce besoin, mais la question pourrait stimuler des échanges sur des approches innovantes, comme le fine-tuning de modèles sur les designs créés ou l'utilisation de techniques d'embedding personnalisé.

Un appel à la communauté

Ce type de requête illustre l'écart entre la puissance créative des IA génératives et leur capacité à respecter une continuité stylistique. Alors que des outils spécialisés commencent à émerger pour la génération de storyboards ou de bandes dessinées, la cohérence des personnages reste un défi technique. L'utilisateur espère que d'autres membres de la communauté technologique pourront partager des solutions existantes ou des pistes de développement.