OpenAI lança ferramenta de benchmark para avaliar performance do código dos modelos de IA

O benchmark SWE-Lancer inclui mais de 1.400 tarefas realizadas em freelance de engenharia da Upwork, avaliado num total de 1 milhão de dólares.

Fev 21, 2025 - 20:02

0

OpenAI lança ferramenta de benchmark para avaliar performance do código dos modelos de IA

O benchmark SWE-Lancer inclui mais de 1.400 tarefas realizadas em freelance de engenharia da Upwork, avaliado num total de 1 milhão de dólares.

Tags:

Artigo Anterior

49% dos leitores do SAPO TEK acreditam que alterações no sistema de moderação da...

Próximo Artigo

Tarifa Social de Internet só tem 536 utilizadores ativos. 3 anos depois do lança...

Publicações Relacionadas

A polémica da Lei dos Solos é um caso de escrutínio pessoal a Luís Montenegro ou uma prova de vida ao seu governo? Talvez ambos

A polémica da Lei dos Solos é um caso de escrutínio pes...

Mar 4, 2025 0

Marcelo entende que há "muito espaço" para indecisos decidirem voto: "Os debates podem ser decisivos"

Marcelo entende que há "muito espaço" para indecisos de...

Abr 1, 2025 0

Os <em>chatbots</em> representam um desafio para a protecção da saúde mental das crianças

Os <em>chatbots</em> representam um desafio para a prot...

Fev 21, 2025 0

Este site usa cookies. Ao continuar a navegar no site, você concorda com o nosso uso de cookies.