Así es Nova Sonic, el nuevo modelo de IA de Amazon para apps de voz que entiende lo que dices y cómo lo dices

Gracias a esta novedad, las conversaciones de voz serán más realistas en aplicaciones de inteligencia artificial.

Abr 9, 2025 - 13:08
 0
Así es Nova Sonic, el nuevo modelo de IA de Amazon para apps de voz que entiende lo que dices y cómo lo dices

Amazon anuncia Nova Sonic, su nuevo modelo base que unifica la comprensión y la generación de voz en un único modelo para que las conversaciones de voz sean más realistas en aplicaciones de inteligencia artificial.

Este modelo simplifica el desarrollo de aplicaciones de voz, como la automatización de llamadas de atención al cliente y agentes de IA, en una amplia gama de sectores, como viajes, educación, salud y entretenimiento, entre otros. Además, Nova Sonic adopta un nuevo enfoque para resolver desafíos complejos, incluso comprende los matices de la conversación humana —como, por ejemplo, las pausas, vacilaciones naturales, la espera para hablar en el momento oportuno y las interrupciones—.

¿Para qué sirve Amazon Nova Sonic?

Esta innovación ha sido desarrollada para habilitar conversaciones con voces más parecidas a las humanas a partir de las tecnologías de compresión y generación de discurso, además, es capaz de simplificar el desarrollo de aplicaciones de voz.

Por otro lado, Amazon explica en su blog oficial que la capacidad de unificar las capacidades de compresión y generación "permite al modelo adaptar la respuesta de voz generada al contexto acústico y a la entrada hablada, lo que resulta en un diálogo más natural".

Disponibilidad

Amazon Nova Sonic forma parte del ecosistema Nova, compuesto por varios modelos de procesamiento/comprensión y de generación de contenido creativo. El gigante ecommerce indica en su blog oficial que este modelo ya disponible a través de una nueva API en Amazon Bedrock.

Amazon también actualiza su IA Nova Reel para crear vídeos

Aparte de lanzar el modelo Nova Sonic, Amazon también ha actualizado su modelo de generación de vídeo Nova Reel para crear vídeos de múltiples tomas de hasta dos minutos de duración.

Gracias a esta actualización, los usuarios también pueden aportar indicaciones para toma en el modo manual, teniendo en cuenta que cada toma admite hasta 512 caracteres y puede incluir hasta 20 tomas en solo vídeo con una resolución de 1.280 x 720 píxeles.

Por si no sabes qué es Nova Reel, esta IA es un modelo que se centra en la generación de vídeo a partir de una descripción de texto y, de forma opcional, una imagen.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.