Un agent IA minimaliste atteint 74 % de réussite sur le benchmark SWE-bench avec seulement 100 lignes de code Python
Développé par les équipes de Princeton et Stanford, le mini-SWE-agent démontre qu’un système d’intelligence artificielle extrêmement simplifié peut rivaliser avec les solutions les plus complexes dans la résolution de tâches de génie logiciel.
Anyscale
Claude Code
Essential AI
IBM
LiteLLM
Meta
Nebius
Nvidia
OpenRouter
Portkey
Princeton University
Stanford University
SWE-bench
Évolution chronologique
-
Un agent IA minimaliste atteint 74 % de réussite sur le benchmark SWE-bench avec seulement 100 lignes de code Python
L’agent miniature conçu par les chercheurs de Princeton et Stanford affiche un taux de réussite supérieur à 74 % sur le benchmark SWE-bench, tout en se limitant à une centaine de l...