vendredi 29 mai 2026

Rechercher

En continu

il y a 9 min · Bourse du 26 mai : les marchés actions en ordre dispersé entre espoir...
il y a 9 min · Finale de la Ligue des champions : à Budapest, les supporters du PSG p...
il y a 24 min · L’ancien président yéménite Abd-Rabbu Mansour Hadi meurt en exil à 80...
il y a 24 min · Netanyahu affirme que les forces israéliennes ont franchi le fleuve Li...
il y a 24 min · Universal Music rejette l’offre de rachat de Bill Ackman et Pershing S...
il y a 25 min · Un juge fédéral ordonne le retrait du nom de Donald Trump du Kennedy C...

Suivi du sujet

Benchmarking LLMs for Web Tasks

Article URL: https://100x.bot/a/Benchmarking-LLMs-for-Web-Tasks Comments URL: https://news.ycombinator.com/item?id=48296665 Points: 1 # Comments: 0

1 article

Ce sujet évolue — revenez pour les suites.

benchmark pour évaluation des LLM

Évolution chronologique

27 mai 2026, 16h37

Un nouveau benchmark évalue les performances des LLM sur des tâches web complexes

Une nouvelle méthode d'évaluation compare les grands modèles de langage sur des tâches web pratiques, comme la navigation et l'extraction d'informations.

Toute l’actualité »