Les systèmes multi-agents, qui orchestrent plusieurs intelligences artificielles pour accomplir des tâches complexes, suscitent un intérêt croissant dans le domaine du développement logiciel. Des expériences comme Ralph Loop, qui exécute des agents de codage autonomes en boucle jusqu’à l’achèvement d’un cahier des charges, ou Gas Town, qui coordonne 20 à 30 agents concurrents répartis en sept rôles spécialisés, témoignent de gains de productivité réels. Pourtant, tous les utilisateurs n’en tirent pas le même bénéfice. Armin Ronacher, concepteur du framework Flask, a ainsi confié qu’il utilise moins d’agents parallèles qu’auparavant, car sa capacité de relecture reste limitée.
Cette observation empirique rejoint une loi formulée en 1967 par Gene Amdahl, pionnier de l’informatique. La loi d’Amdahl stipule que l’accélération maximale d’un programme traité en parallèle est bornée par la fraction du travail qui doit être exécutée de manière séquentielle. Formellement, l’accélération vaut 1 / (S + (1-S)/N), où S est la fraction séquentielle et N le nombre de processeurs. Lorsque N tend vers l’infini, l’accélération converge vers 1/S. Si 10 % du travail est incompressiblement séquentiel, l’accélération ne dépassera jamais 10 fois, quel que soit le nombre de cœurs.
Transposition aux agents d’IA
La même logique s’applique aux systèmes multi-agents, mais en remplaçant la fraction séquentielle par la fraction de temps humain H. Cette fraction représente toutes les étapes du workflow qui bloquent sur une intervention humaine : clarification d’une intention ambiguë (« Voulez-vous dire le tableau de bord administrateur ou celui destiné aux utilisateurs ? »), prise de décision (« Faut-il rembourser ce client ou lui proposer un crédit ? »), cycle de relecture (« Ce n’est pas tout à fait ce que je voulais, recommence »), résolution d’imprécisions dans les consignes, ou encore application du jugement esthétique (« C’est techniquement correct, mais l’impression est mauvaise »).
Si H représente 40 % du temps total du workflow, l’accélération maximale atteignable par l’ajout d’agents est de 2,5 fois. À 50 %, le plafond tombe à 2 fois. Même avec un H optimiste de 20 %, on ne dépasse pas 5 fois. En dessous de 10 %, on peut espérer jusqu’à 10 fois, et à 5 %, jusqu’à 20 fois. H domine donc l’équation de l’accélération, bien plus que la capacité des modèles d’IA eux-mêmes.
La réduction du facteur humain
Contrairement à la fraction séquentielle S de la loi originelle, qui est une propriété fixe de l’algorithme, H n’est pas statique. De meilleurs modèles d’IA peuvent réduire certains composants de H, comme le besoin de clarification ou le nombre d’erreurs. Mais les gains les plus importants proviennent de la transformation du caractère même des interventions humaines.
L’auteur de l’analyse propose le concept de « H auto-liquidant » (self-liquidating H). L’idée est que chaque intervention humaine doit produire un artefact – un test, une mise à jour de spécification, une décision documentée – qui rend la même intervention inutile à l’avenir. Si un humain détecte un bogue, il faut ajouter un cas de test. S’il lève une ambiguïté, il doit mettre à jour la spécification. S’il prend une décision de goût, il doit la documenter comme précédent.
Ce processus repose sur ce que l’auteur nomme la « configurance » : l’ensemble minimal d’engagements comportementaux explicites (avec leurs justifications) qui permet à un agent d’IA d’opérer de manière autonome sans avoir à redécouvrir les invariants du système. Les spécifications, les suites de conformité (suites de tests automatisés vérifiant le comportement par rapport à une spécification) et les décisions documentées sont des exemples de ce cadre. Une suite de tests qui rend une relecture humaine superflue est qualifiée de « cognition cristallisée » : le jugement humain sur la correction est encodé au moment où il est porté, pour que les agents n’aient pas à le refaire.
Distinguer les types d’interventions
Toutes les interventions humaines ne se valent pas face à l’encodage. La vérification (détection de bogues) est très encodable : chaque bogue peut devenir un test. La clarification (résolution d’ambiguïtés) l’est aussi : chaque réponse peut enrichir la spécification. La spécification elle-même est partiellement encodable, via des modèles réutilisables. En revanche, le goût et les décisions novatrices sont les moins encodables – mais ce sont précisément les domaines où le jugement humain crée le plus de valeur. Le système tend naturellement vers un état où les humains ne font que le travail qui ne peut être encodé, parce que tout ce qui peut l’être l’a été.
Toutefois, l’accumulation brute d’artefacts peut devenir contre-productive. Un fichier AGENTS.md long de 400 lignes de recommandations contradictoires ou une suite de tests redondante nuisent à l’efficacité. L’auteur préconise donc une approche en deux temps : accumuler, puis compresser. Les jugements individuels s’entassent d’abord sous forme d’artefacts locaux (cas de test, entrée dans un fichier de directives, enregistrement de décision). Périodiquement, ces artefacts sont intégrés dans des artefacts de niveau supérieur : spécifications mises à jour, suites de tests refactorisées, définitions de compétences révisées. Cette compression permet de remettre en question les variables directrices elles-mêmes – par exemple, si quarante cas de test encodent quarante variantes d’un même principe, il est temps de réviser le principe lui-même.
Implications pour les équipes
Cette analyse fournit une grille de lecture pour les équipes qui adoptent des agents d’IA. Une équipe où 40 % du temps de workflow est humain, mais consacré à des décisions de goût et de stratégie, est dans une situation fondamentalement différente d’une équipe où ces 40 % sont absorbés par des clarifications et des relectures mécaniques. Les pratiques auto-liquidantes permettent de convertir le deuxième cas en premier.
L’effort ne doit pas porter sur l’amélioration des modèles d’IA eux-mêmes, mais sur l’encodage systématique de chaque décision humaine sous une forme réutilisable par les agents. Plus la part d’interventions humaines est réduite et concentrée sur des tâches à haute valeur ajoutée, plus le retour sur investissement des agents d’IA est élevé. La loi d’Amdahl, vieille de près de soixante ans, retrouve ainsi une actualité inattendue dans le domaine de l’intelligence artificielle.