Un nouvel outil open source évalue les IA en conditions réelles de travail
Le projet LLM Inquisitor, disponible sur GitHub, propose une méthode de test des grands modèles de langage basée sur l'observation de leurs performances lors de tâches ordinaires, afin de détecter des défaillances comme la dérive ou l'instabilité.
AssimilatedHuman
GitHub
LLM Inquisitor
Évolution chronologique
-
Un nouvel outil open source évalue les IA en conditions réelles de travail
Le projet open source LLM Inquisitor propose d'évaluer les grands modèles de langage en observant leur comportement lors de tâches réelles, afin de détecter dérive et instabilité a...