Los que daban a OpenAI por muerta tras el aterrizaje de DeepSeek se dan cuenta ahora de que o3-mini ya lo ha destronado

Si algo ha quedado claro con la irrupción de o3-mini es que la IA avanza a un ritmo imparable. Cada mes (o cada par de semanas), los modelos mejoran gracias a una combinación de fuerza bruta computacional y de innovaciones algorítmicas. Y es que, recientemente, tras una semana en la que DeepSeek estuvo en boca de todos gracias a su inesperada eficiencia, OpenAI dio un sonoro golpe sobre la mesa con su modelo o3-mini: no sólo ha superado al hasta ahora impresionante modelo de IA 'made in China', sino que lo ha hecho con un rendimiento superior y un costo tres veces menor. Los datos son contundentes: o3-mini se destaca en diversas pruebas de referencia. En el test ARC-AGI-1, clave para medir la capacidad de razonamiento de estos modelos, ha demostrado un equilibrio excepcional entre precisión, costo y eficiencia computacional. Otros test también muestran que el nuevo modelo de OpenAI es más inteligente, rápido y económico. Sorprendentemente, algunos, como Livebench, muestran que el recién llegado es capaz incluso de superar a modelos de la serie o1, que son considerablemente más costosos. Eso sí, DeepSeek sigue ganando a o3-mini en un aspecto en el que OpenAI no parece interesado en competir: es una IA 'open source' que puedes instalar en tu propio PC si así lo deseas En Genbeta DeepSeek lo cambia todo a la hora de aprender a programar porque ofrece algo que ChatGPT no: un vistazo a cómo piensa Un cambio en cómo razonamos con IA El dominio de o3-mini no solo se debe a la potencia bruta, sino también a su capacidad para "pensar antes de responder". OpenAI introdujo con o1 el concepto de 'cadena de pensamiento', permitiendo que la IA rumiara antes de dar una respuesta. Modelos como o3-mini y DeepSeek R1 han perfeccionado esta técnica, logrando que la inteligencia artificial hable consigo misma y evalúe distintas soluciones antes de decidir. Esto ha sido especialmente beneficioso en tareas de razonamiento lógico y matemático, donde se observan mejoras significativas. Además, hace no mucho, se criticaba a los modelos generativos como ChatGPT por su bajo rendimiento en matemáticas: hoy en día, gracias precisamente a estos avances, esa afirmación ha quedado obsoleta. La IA no solo se mide en pruebas, también en preferencias del usuario Un aspecto curioso de la evolución de estos modelos es que el mejor en los test no siempre es el favorito del público. Un caso paradigmático es el de Claude 3.5 Sonnet, que ha ganado popularidad no tanto por sus datos de rendimiento como por su "personalidad". Este fenómeno demuestra que, además de la precisión y eficiencia, los usuarios valoran la experiencia conversacional y la forma en que un modelo se comunica. Imagen | Marcos Merino Bonilla En Genbeta | Sam Altman cree que OpenAI se equivocó con la visión con el código abierto: DeepSeek lo ha cambiado todo - La noticia Los que daban a OpenAI por muerta tras el aterrizaje de DeepSeek se dan cuenta ahora de que o3-mini ya lo ha destronado fue publicada originalmente en Genbeta por Marcos Merino .

Feb 11, 2025 - 00:11

Si algo ha quedado claro con la irrupción de o3-mini es que la IA avanza a un ritmo imparable. Cada mes (o cada par de semanas), los modelos mejoran gracias a una combinación de fuerza bruta computacional y de innovaciones algorítmicas.

Y es que, recientemente, tras una semana en la que DeepSeek estuvo en boca de todos gracias a su inesperada eficiencia, OpenAI dio un sonoro golpe sobre la mesa con su modelo o3-mini: no sólo ha superado al hasta ahora impresionante modelo de IA 'made in China', sino que lo ha hecho con un rendimiento superior y un costo tres veces menor.

Los datos son contundentes: o3-mini se destaca en diversas pruebas de referencia. En el test ARC-AGI-1, clave para medir la capacidad de razonamiento de estos modelos, ha demostrado un equilibrio excepcional entre precisión, costo y eficiencia computacional.

Otros test también muestran que el nuevo modelo de OpenAI es más inteligente, rápido y económico. Sorprendentemente, algunos, como Livebench, muestran que el recién llegado es capaz incluso de superar a modelos de la serie o1, que son considerablemente más costosos.

Eso sí, DeepSeek sigue ganando a o3-mini en un aspecto en el que OpenAI no parece interesado en competir: es una IA 'open source' que puedes instalar en tu propio PC si así lo deseas

En Genbeta

DeepSeek lo cambia todo a la hora de aprender a programar porque ofrece algo que ChatGPT no: un vistazo a cómo piensa

Un cambio en cómo razonamos con IA

El dominio de o3-mini no solo se debe a la potencia bruta, sino también a su capacidad para "pensar antes de responder". OpenAI introdujo con o1 el concepto de 'cadena de pensamiento', permitiendo que la IA rumiara antes de dar una respuesta.

Modelos como o3-mini y DeepSeek R1 han perfeccionado esta técnica, logrando que la inteligencia artificial hable consigo misma y evalúe distintas soluciones antes de decidir.

Esto ha sido especialmente beneficioso en tareas de razonamiento lógico y matemático, donde se observan mejoras significativas. Además, hace no mucho, se criticaba a los modelos generativos como ChatGPT por su bajo rendimiento en matemáticas: hoy en día, gracias precisamente a estos avances, esa afirmación ha quedado obsoleta.

La IA no solo se mide en pruebas, también en preferencias del usuario

Un aspecto curioso de la evolución de estos modelos es que el mejor en los test no siempre es el favorito del público. Un caso paradigmático es el de Claude 3.5 Sonnet, que ha ganado popularidad no tanto por sus datos de rendimiento como por su "personalidad".

Este fenómeno demuestra que, además de la precisión y eficiencia, los usuarios valoran la experiencia conversacional y la forma en que un modelo se comunica.

Imagen | Marcos Merino Bonilla

En Genbeta | Sam Altman cree que OpenAI se equivocó con la visión con el código abierto: DeepSeek lo ha cambiado todo

-
La noticia Los que daban a OpenAI por muerta tras el aterrizaje de DeepSeek se dan cuenta ahora de que o3-mini ya lo ha destronado fue publicada originalmente en Genbeta por Marcos Merino .