Une nouvelle étude accuse LM Arena de truquer son célèbre test de référence en matière d'IA, le célèbre test de référence de l'IA n'est peut-être pas aussi équitable qu'il n'y paraît

Une nouvelle étude accuse LM Arena de truquer son célèbre test de référence en matière d'IA, le célèbre test de référence de l'IA n'est peut-être pas aussi équitable qu'il n'y paraîtUne étude intitulée Gaming the Benchmarks: Bias in LLM Leaderboards, publiée en avril 2025 par des chercheurs de Cohere Labs, Princeton et du MIT, jette une lumière crue sur les pratiques contestables de LM Arena, le benchmark d'IA devenu référence. Les données révèlent que 60 % des matchs opposent des modèles propriétaires...

Mai 4, 2025 - 04:44
 0
Une nouvelle étude accuse LM Arena de truquer son célèbre test de référence en matière d'IA, le célèbre test de référence de l'IA n'est peut-être pas aussi équitable qu'il n'y paraît
Une nouvelle étude accuse LM Arena de truquer son célèbre test de référence en matière d'IA,
le célèbre test de référence de l'IA n'est peut-être pas aussi équitable qu'il n'y paraît

Une étude intitulée Gaming the Benchmarks: Bias in LLM Leaderboards, publiée en avril 2025 par des chercheurs de Cohere Labs, Princeton et du MIT, jette une lumière crue sur les pratiques contestables de LM Arena, le benchmark d'IA devenu référence. Les données révèlent que 60 % des matchs opposent des modèles propriétaires...