OpenAI представила модели o3 и o4-mini: они «думают» с учётом изображений и гораздо лучше кодят

Вчера, 16 апреля, OpenAI официально представила миру свои новые модели o3 и o4-mini, которые, по словам компании, были обучены думать гораздо дольше перед тем, как дать ответ на вопрос пользователя. На данный момент это самые умные модели бренда и первые рассуждающие модели OpenAI, способные задействовать все доступные инструменты ChatGPT — они могут искать информацию в интернете, анализировать загруженные файлы, вести глубокие рассуждения на основе визуального контента или даже генерировать изображения. Кроме того, главная фишка новинок в том, что они могут самостоятельно думать о том, какие инструменты и когда лучше применять. «Мы научили модели не только использовать инструменты, но и рассуждать о том, как их использовать. Способность применять инструменты в зависимости от желаемых результатов делает их более продвинутыми, особенно в сценариях с визуальными рассуждениями и многоэтапными рабочими процессами», — заявили разработчики моделей в официальном блоге OpenAI.При этом, естественно, новые модели стали гораздо лучше решать различного рода задачи. Например, o3, по словам OpenAI, существенно прокачали в области программирования, математики, науки, визуального восприятия и не только. Благодаря этому модель смогла поставить новые рекорды в бенчмарках Codeforces, SWE-bench и MMMU, плюс разработчики ИИ отмечают, что их флагманское решение идеально подходит для решения сложных вопросов, требующих многогранного анализа данных, а также для анализа изображений, диаграмм и графиков. Примечательно, что o3 допускает на 20% меньше ошибок, чем o1, при выполнении сложных задач, а это довольно важный параметр для тех, кто использует чат-бота в профессиональной деятельности. У o4-mini, меньшей модели от OpenAI, имеется другое весомое преимущество — она оптимизирована под быстрые и более экономичные рассуждения, демонстрируя при этом внушительную производительность с учётом своего размера и низкой стоимости. Особенно хорошо данная модель справляется с написанием кода, математическими задачами и взаимодействием с визуальным контентом. И, что немаловажно, новые размышляющие модели OpenAI должны ощущаться более естественными в ходе диалога, так как они в том числе ссылаются на данные в памяти из прошлых диалогов с пользователем, предлагая более персонализированные и релевантные ответы.

Апр 17, 2025 - 07:02
 0
OpenAI представила модели o3 и o4-mini: они «думают» с учётом изображений и гораздо лучше кодят

Вчера, 16 апреля, OpenAI официально представила миру свои новые модели o3 и o4-mini, которые, по словам компании, были обучены думать гораздо дольше перед тем, как дать ответ на вопрос пользователя.

На данный момент это самые умные модели бренда и первые рассуждающие модели OpenAI, способные задействовать все доступные инструменты ChatGPT — они могут искать информацию в интернете, анализировать загруженные файлы, вести глубокие рассуждения на основе визуального контента или даже генерировать изображения. Кроме того, главная фишка новинок в том, что они могут самостоятельно думать о том, какие инструменты и когда лучше применять.

«Мы научили модели не только использовать инструменты, но и рассуждать о том, как их использовать. Способность применять инструменты в зависимости от желаемых результатов делает их более продвинутыми, особенно в сценариях с визуальными рассуждениями и многоэтапными рабочими процессами», — заявили разработчики моделей в официальном блоге OpenAI.

При этом, естественно, новые модели стали гораздо лучше решать различного рода задачи. Например, o3, по словам OpenAI, существенно прокачали в области программирования, математики, науки, визуального восприятия и не только. Благодаря этому модель смогла поставить новые рекорды в бенчмарках Codeforces, SWE-bench и MMMU, плюс разработчики ИИ отмечают, что их флагманское решение идеально подходит для решения сложных вопросов, требующих многогранного анализа данных, а также для анализа изображений, диаграмм и графиков. Примечательно, что o3 допускает на 20% меньше ошибок, чем o1, при выполнении сложных задач, а это довольно важный параметр для тех, кто использует чат-бота в профессиональной деятельности.

У o4-mini, меньшей модели от OpenAI, имеется другое весомое преимущество — она оптимизирована под быстрые и более экономичные рассуждения, демонстрируя при этом внушительную производительность с учётом своего размера и низкой стоимости.

Особенно хорошо данная модель справляется с написанием кода, математическими задачами и взаимодействием с визуальным контентом. И, что немаловажно, новые размышляющие модели OpenAI должны ощущаться более естественными в ходе диалога, так как они в том числе ссылаются на данные в памяти из прошлых диалогов с пользователем, предлагая более персонализированные и релевантные ответы.