OpenAI lança ferramenta de benchmark para avaliar performance do código dos modelos de IA

O benchmark SWE-Lancer inclui mais de 1.400 tarefas realizadas em freelance de engenharia da Upwork, avaliado num total de 1 milhão de dólares.

Fev 21, 2025 - 20:02
 0
OpenAI lança ferramenta de benchmark para avaliar performance do código dos modelos de IA
O benchmark SWE-Lancer inclui mais de 1.400 tarefas realizadas em freelance de engenharia da Upwork, avaliado num total de 1 milhão de dólares.