Une progression inédite des agents IA
Un indice de référence conçu pour évaluer la capacité des intelligences artificielles à réaliser des travaux rémunérés de manière autonome affiche une hausse fulgurante des taux d’automatisation. Le Remote Labor Index (RLI), qui mesure la part de projets freelances — allant de la modélisation 3D à l’analyse de données en passant par le design graphique — que des modèles d’IA accomplissent à un niveau jugé équivalent ou supérieur à celui d’un professionnel humain, vient d’être actualisé avec des résultats pour trois nouveaux systèmes.
Lors de son lancement, le meilleur agent artificiel atteignait à peine 2,5 % de taux d’automatisation. Aujourd’hui, les modèles les plus récents pulvérisent ce record. Le système Fable 5 a atteint le score le plus élevé jamais enregistré, avec 16,1 % de projets automatisés. Les modèles Opus 4.8 et GPT‑5.5 affichent respectivement des taux de 8,3 % et 6,3 %. Ces trois performances dépassent tous les modèles précédemment évalués. Le précédent meilleur résultat, établi par Opus 4.6 avec un échafaudage logiciel spécifique, s’élevait à 4,17 %. La progression est donc de l’ordre d’un quadruplement en moins de huit mois, un signe concret de la rapidité avec laquelle les agents d’IA gagnent en compétence économique.
Une évaluation rigoureuse par des humains
Le RLI se distingue par sa méthodologie : chaque projet est accompagné d’un cahier des charges, de fichiers d’entrée et d’une livraison de référence produite par un professionnel rémunéré. Les travaux des IA sont ensuite jugés par des évaluateurs humains, qui comparent la qualité à celle du livrable humain. L’indicateur clé, le taux d’automatisation complète, correspond à la proportion de projets pour lesquels le résultat de l’IA est estimé au moins aussi bon que celui du professionnel.
Parmi les missions testées figurent des tâches variées : création de modèles 3D pour l’architecture, conception de graphismes, production de vidéos et animations, traitement audio, analyse statistique, développement d’applications web, etc. Les exemples concrets montrent que les IA parviennent désormais à reproduire des livrables commerciaux complexes avec une précision croissante.
Des résultats partiels pour le modèle le plus performant
Il est à noter que Fable 5 n’a pu être testé que sur 218 des 240 projets de l’indice, en raison de restrictions d’accès imposées par les autorités américaines. Les 22 projets manquants sont répartis uniformément dans l’ensemble du benchmark, sans concentration dans un secteur ou un niveau de difficulté particulier. Même dans le scénario le plus pessimiste où le modèle aurait échoué sur l’intégralité des projets non évalués, son taux d’automatisation resterait de 14,6 %, soit toujours le meilleur score enregistré.
Des implications économiques majeures
Cette accélération intervient dans un contexte où les préoccupations sur l’impact de l’IA sur l’emploi se multiplient. Plusieurs analystes et responsables économiques ont récemment mis en garde contre une possible polarisation du marché du travail et des destructions d’emplois dans les secteurs exposés à l’automatisation. Si la progression des taux d’automatisation se poursuit à ce rythme, le nombre de missions pouvant être confiées à des agents artificiels sans intervention humaine pourrait augmenter rapidement, menaçant particulièrement les professions intellectuelles et créatives accessibles à distance.
Les chercheurs derrière l’indice soulignent que le RLI ne mesure que les tâches purement numériques et exécutables à distance, mais que l’amélioration rapide des capacités suggère que l’automatisation gagne du terrain bien au-delà des seuls secteurs industriels. Les prochaines évaluations devraient permettre de suivre l’évolution de cette tendance et d’identifier les métiers les plus vulnérables.