Gandalf the Grader : un cadre open source pour évaluer les résultats de l’IA
Un nouvel outil de notation, présenté comme un « agent-juge », permet d’évaluer automatiquement les productions de modèles d’intelligence artificielle. Le projet, baptisé Gandalf the Grader, a été rendu public par Handshake AI Research.
Gandalf the Grader
GitHub
Handshake AI Research
Évolution chronologique
-
Gandalf the Grader : un cadre open source pour évaluer les résultats de l’IA
Gandalf the Grader est un nouveau framework open source de type « agent-juge » pour évaluer automatiquement les productions des modèles d’intelligence artificielle, développé par H...