OpenAI преувеличила успехи модели o3 на сложных тестах по математике
Новая модель искусственного интеллекта (ИИ) o3 от OpenAI, презентованная как мощный инструмент для сложных задач, на деле показала более скромные результаты в сравнении с теми, что были заявлены в декабре. По словам независимой исследовательской группы Epoch AI, при тестировании на наборе задач FrontierMath модель справилась лишь примерно с 10% заданий — это значительно меньше 25%, о которых ранее сообщала OpenAI.
