Bot de voz

Instrucciones sencillas: cree un robot de voz con Voicegain, RASA y AWS Lambda

Uno de los anteriores publicaciones de blog describió un Voice Bot creado con Twilio, Voicegain, RASA y AWS Lambda. Twilio se utilizaba para la telefonía (números de teléfono, enlaces troncales SIP y TWiML para el control de llamadas). Voicegain proporcionaba el reconocimiento de voz y ASR, mientras que AWS Lambda coordinaba las acciones. La configuración funciona, pero es complicada. La necesidad de transmitir los resultados del reconocimiento de voz a través de S3 (dado que Lambda no tiene estado ni memoria entre las llamadas a funciones) puede provocar, en ocasiones, retrasos en las solicitudes y respuestas.

Opción de CPaaS sencilla incorporada

Voicegain ahora se integra con el conector de voz de Amazon Chime para ofrecer un servicio de enlace troncal SIP de pago por uso directamente desde la consola web de Voicegain. También puedes comprar números de teléfono y recibir llamadas entrantes. Se está preparando la compatibilidad para realizar llamadas IVR de voz salientes.

Por supuesto, seguimos apoyando a los desarrolladores que utilizan Twilio y SignalWire mediante un simple SIP INVITE - este blog describe cómo.

¿Cómo funciona?

Los componentes
  • Función AWS Lambda - una única función de Node.js con un activador de API Gateway (tipo de API HTTP simple).
  • Ganación de voz API de bots de telefonía - la API Telephony Bot funciona con las devoluciones de llamadas web. Para los desarrolladores de Twilio y SignalWire, es similar a trabajar con Twilio Twiml y SignalWire LaML, respectivamente.
  • RASA - La lógica de diálogo la proporciona el servidor RASA NLU Dialog, al que se puede acceder a través de la API RestInput.
Los escalones

El diagrama de secuencia se proporciona a continuación. Es muy sencillo. Básicamente, la secuencia de operaciones es la siguiente:

  1. Llame a un número de teléfono proporcionado por Voicegain (con tecnología de Amazon Chime Voice Connector)
  2. La API Voicegain Telephony Bot llama a una función de devolución de llamada en AWS Lambda.
  3. La función Lambda envía «Hola» a RASA y RASA responde con el mensaje de diálogo inicial
  4. La función Lambda responde a la llamada de Voicegain con el mensaje recibido de RASA y le dice a Voicegain Speech-to-Text que capture la respuesta de la persona que llama.
  5. Voicegain usa TTS para generar a partir del texto de la pregunta RASA un mensaje de audio y lo reproduce por teléfono para la persona que llama.
  6. La persona que llama escucha el aviso y dice algo en respuesta
  7. Voicegain ASR transcribe el discurso a texto y devuelve la llamada con el resultado de la transcripción a la función Lambda.
  8. La función Lambda invoca a RASA y le pasa el texto de la respuesta.
  9. RASA procesa la respuesta y genera la siguiente pregunta del diálogo
  10. Continuamos en el siguiente turno igual que en el paso 4.

El código de muestra de la función Lambda (en las versiones python y node.js) está disponible en nuestro github.



¡Haz una prueba de manejo con Voicegain!

1. Haga clic aquí para obtener instrucciones sobre cómo acceder a nuestro sitio de demostración en vivo.

2. Si estás creando una aplicación de voz genial y quieres probar nuestras API, haz clic aquípara crear una cuenta de desarrollador y recibir 50$ en créditos gratis


Ganancia de voz: La IA de voz bajo tu control

Ganancia de voz: Cree aplicaciones de IA de voz con nuestras API de NLU de voz a texto y LLM. Graba y transcribe reuniones, llamadas a centros de atención al cliente, vídeos, etc. Obtén resúmenes, opiniones y mucho más basados en LLM. Cree bots de voz conversacionales que se integren con su plataforma CCaaS local o en la nube. Comience hoy mismo.

Descubre cómo funciona Voicegain — obtén una demostración de Voicegain hoy mismo.

Inscríbase hoy mismo en una aplicación
* No se requiere tarjeta de crédito.

Empresarial

¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?

Póngase en contacto con nosotros →
Voicegain - Speech-to-Text
Under Your Control