Amazon lanza el modelo Nova Sonic AI para la generación de voz

Resumen: Amazon va en contra de Gemini de Google y los modelos GPT4.O AI de OpenAI con el nuevo modelo de generación de voz Nova Sonic Sonic. El nuevo modelo de voz de la compañía es capaz de manejar el procesamiento del habla en tiempo real y la generación de voz de IA para aplicaciones conversacionales. Además, la marca ha lanzado el nuevo modelo Nova Reel 1.1 AI que ahora puede generar videos más largos basados ​​en entradas de texto.

Amazonas ha anunciado un nuevo inteligencia artificial (AI) Modelo en su familia de modelos Nova el martes. Llamado Amazon Nova SonicEl nuevo modelo de IA del gigante de comercio electrónico es capaz de generar un discurso humano. La compañía dijo que los desarrolladores pueden usar su nuevo modelo de IA para construir chatbots de IA conversacionales y funcionalidades similares. Además, Amazon ha lanzado el modelo Nova Reel 1.1 AI que puede generar videos de dos minutos.

Puede usar el modelo Nova Sonic AI de Amazon para construir agentes de IA para varios sectores

Amazon dice que su modelo Nova Sonic AI puede Simplifique el desarrollo de aplicaciones de voz. Estos pueden incluir la automatización de llamadas de servicio al cliente y los agentes de IA en una amplia gama de industrias, como viajes, educación, atención médica, entretenimiento y más. Los desarrolladores pueden usar el modelo AI para crear aplicaciones con voz de voz que puedan completar varias tareas para los consumidores con una «mayor precisión, mientras que es más natural y atractivo».

El modelo Nova Sonic AI no es una herramienta de texto a voz; En cambio, puede procesar entradas de voz en tiempo real y responder a ellas. Amazon dijo que los enfoques tradicionales para las herramientas habilitadas por voz utilizan múltiples modelos para el reconocimiento de texto, conversión de voz a texto, procesamiento de datos y TTS. Estos podrían conducir a un aumento de la latencia y el fracaso para preservar el contexto lingüístico. Sin embargo, el modelo Nova Sonic AI puede unificar la comprensión del habla y los componentes de generación del habla.

El modelo Nova Sonic AI de Amazon está disponible en Bedrock Developer Platform

Además, Nova Sonic de Amazon es capaz de reconocer diferentes estilos de habla. La compañía dice que el modelo de IA también puede comprender cuándo un usuario se pierde mal, hace una pausa mientras habla o murmura. A partir de ahora, solo admite el idioma inglés. Sin embargo, la marca agregará soporte para más idiomas pronto. El modelo tiene una ventana de contexto de 32,000 tokens para audio, con una ventana adicional para manejar conversaciones más largas.

El modelo Nova Sonic AI es Disponible a través de la roca madreLa plataforma de desarrollador del gigante de comercio electrónico para hacer aplicaciones AI Enterprise, a través de una nueva API de transmisión bidireccional. En un comunicado de prensa, la compañía llamó a Nova Sonic «el modelo de voz AI más rentable» en el mercado. Amazon afirma que es aproximadamente un 80 por ciento menos costoso que Operai’s GPT-4O.

Además, conozca el nuevo modelo de generación de videos Nova Reel 1.1

Vale la pena agregar que Amazon también ha lanzado el nuevo modelo Nova Reel 1.1 AI que ahora puede generar videos más largos basados ​​en entradas de texto. Sucesor del modelo Nova Reel del año pasado, el nuevo modelo puede generar tomas de seis segundos, y un solo video puede tener 20 clips de este tipo cosidos para crear un video de 120 segundos de largo. También está disponible para desarrolladores y usuarios generales a través de la plataforma Amazon Bedrock.

Fuente: Android Headlines

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *