Investigadores de Apple describen un nuevo método para lograr conversaciones más naturales con Siri

Manzana está trabajando día y noche para mejorar su asistente digital, Siri, como revela un nuevo informe en el que está trabajando la empresa conversaciones más rápidas y con un sonido más natural. Un estudio muestra cómo los cambios en la generación del habla podrían reducir los retrasos en la respuesta y mejorar la claridad. El trabajo de investigación interna destaca la intención del gigante tecnológico de fortalecer su pila de inteligencia artificial y al mismo tiempo reducir gradualmente la dependencia de modelos externos para las experiencias centrales de asistentes de voz.

Apple está trabajando para ofrecer conversaciones con sonido natural con Siri

Los modelos de voz típicos generan el habla en pequeños tokens fonéticos, seleccionando cada sonido paso a paso mediante autorregresión. Si bien este método funciona bastante bien, a veces puede introducir pequeñas pausas y problemas de pronunciación ocasionales, especialmente cuando los datos de entrenamiento son limitados. Este único inconveniente a veces puede arruinar las conversaciones. Los investigadores de Apple explican que estos retrasos se notan en entornos conversacionales, donde los usuarios esperan siri responder con fluidez y sin pausas incómodas.

Para solucionar este problema, el estudio de Apple propone grupos de similitud acústicaque agrupan sonidos del habla que son perceptivamente similares. El método reduce las opciones a grupos que suenan similares. Esto permite que el sistema identifique los tokens de voz apropiados más rápidamente. La búsqueda probabilística dentro de estos grupos permite que el modelo mantenga la inflexión natural mientras reduce la latencia. Como resultado, el modelo puede producir resultados más rápidos y que suenan más naturales. Hace que el asistente digital suene más humano y conversacional.

La empresa da un paso más hacia una mayor independencia de la IA

Otra gran ventaja del nuevo método es que reduce la sobrecarga computacional, permitiendo respuestas en tiempo real en el dispositivo. Es muy respetuoso con la privacidad y puede permitir eficiencia y coherencia en todo el hardware de Apple sin una gran dependencia del procesamiento en la nube. Sin embargo, la investigación es incremental. Aunque muestra el compromiso de la empresa de perfeccionar sus propias bases de aprendizaje automático.

Apple también busca mayor Independencia de la IA en el futuro. Si bien es un hecho que recientemente asociado con google Al utilizar su Gemini, esfuerzos como este revelan una visión a largo plazo de la marca. De todos modos, no hay información sobre la integración del nuevo método de velocidad en Siri. La empresa puede llevarlo o no a la audiencia estable.

Fuente: Android Headlines

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *