Suivi du sujet

Un agent IA minimaliste atteint 74 % de réussite sur le benchmark SWE-bench avec seulement 100 lignes de code Python

Développé par les équipes de Princeton et Stanford, le mini-SWE-agent démontre qu’un système d’intelligence artificielle extrêmement simplifié peut rivaliser avec les solutions les plus complexes dans la résolution de tâches de génie logiciel.

1 article

Ce sujet évolue — revenez pour les suites.

Anyscale Claude Code Essential AI IBM LiteLLM Meta Nebius Nvidia OpenRouter Portkey Princeton University Stanford University SWE-bench

Évolution chronologique

28 mai 2026, 05h19

Un agent IA minimaliste atteint 74 % de réussite sur le benchmark SWE-bench avec seulement 100 lignes de code Python

L’agent miniature conçu par les chercheurs de Princeton et Stanford affiche un taux de réussite supérieur à 74 % sur le benchmark SWE-bench, tout en se limitant à une centaine de l...

Toute l’actualité »