Une étude met en garde contre les benchmarks trompeurs des agents d’IA

Les défis des benchmarks pour les agents IA : une étude de l’Université de Princeton Une…