Bot de voz

Creación de robots de voz con Voicegain Speech-to-Text/ASR

El propósito de esta entrada de blog es profundizar en otras publicaciones en las que describimos varias formas de crear un Voice Bot usando Voicegain ASR/Speech-to-Text. También tenemos previsto anunciar una nueva función que pronto facilitará aún más el desarrollo de Voice Bot.

Solo un resumen rápido: ¿qué es un Voice Bot? Un Voice Bot permite a los usuarios hablar con libertad y naturalidad en respuesta a las preguntas que hace el Bot. Puede extraer múltiples «intenciones» de lo que dice un cliente y puede responder de forma inteligente. Al implementar los bots de voz, los clientes pueden retirar sus IVR antiguos y también utilizar una plataforma de bots unificada para impulsar tanto los chatbots como los bots de voz.

Es importante tener en cuenta que Voicegain ASR/Speech-to-Text solo proporciona la «boca» y el «oído» del Voice Bot. Para crear la lógica del bot y todas las integraciones de back-end (es decir, el cerebro), el desarrollador tiene que seleccionar un marco de bots como Flujo de diálogo de Google, RASA, Kore.ai, Servicio Microsoft Azure Bot, o AWS Lex.

Estas son algunas formas en las que puedes crear un Voice Bot.

1. Uso de la API de bots de telefonía de Twilio y Voicegain

Este método se describe en la entrada del blog: Cómo crear un Voicebot con Voicegain, Twilio, RASA y AWS Lambda

Es importante tener en cuenta que la configuración descrita para usar AWS Lambda y S3 para gestionar las devoluciones de llamadas es solo para fines de demostración y no es ideal para la implementación en producción. El servidor de devolución de llamadas debe poder gestionar las devoluciones de Twilio y Voicegain y transmitir información entre ambos. Como AWS Lambda no tiene estado, la información se transmite en este ejemplo a través de S3, lo que hace que el proceso de principio a fin sea lento debido a la necesidad de realizar sondeos. Eso no proporcionará un tiempo de respuesta rápido para su Voice Bot.

Para una configuración lista para la producción, le sugerimos que sustituya AWS Lambda y S3 por un servidor web adecuado que pueda mantener el estado de la sesión; para ello, puede utilizar Node.js o Python Flask.

2. Uso de la CPaaS incorporada de la API Voicegain Telephony Bot

Este método se describe en la entrada del blog: Instrucciones sencillas: cree un robot de voz con Voicegain, RASA y AWS Lambda

Esto es más fácil que el método descrito anteriormente. La API Voicegain Telephony Bot utiliza la CPaaS de Amazon Chime para proporcionar la funcionalidad que de otro modo proporcionaría Twilio y está integrada internamente con la API Voicegain STT. Utiliza devoluciones de llamadas, por lo que necesita un servicio web intermedio para gestionar la interacción con una plataforma de bots, por ejemplo, RASA. Este servicio web puede no tener estado porque la API de Telephone Bot es capaz de mantener la información de estado.

El ejemplo descrito en la entrada de blog anterior utiliza troncales SIP y números de teléfono proporcionados por Amazon Chime, que están integrados como parte de la API Voicegain Telephony Bot. Si prefiere conservar su proveedor de telefonía y CPAAS (p. ej. Cable de señal, Twilio, Telnyx, o Bandwidth.com) puede hacerlo y conectarse a la API de Telephone Bot mediante SIP INVITE. Esto se describe en la entrada del blog: Captación de voz SIP INVITE de Twilio, SignalWire y Telnyx CPaaS

3. Uso de AudioCodes Voice AI Connect

Este método se describe en la entrada del blog: Voicegain anuncia la integración con Audiocodes Voice AI connect.

VoiceAI Connect (VAIC) de AudioCodes permite a las empresas conectar un marco de bots y servicios de voz, como conversión de texto a voz (TTS) y voz a texto (STT), a los canales de voz y telefonía de las empresas para impulsar los casos de uso de Voice Bots, IVR conversacionales y Agent Assist.

AudioCodes proporciona una integración nativa con Bot Frameworks como Kore.ai, Google Dialogflow y Microsoft Bot Framework.

4. Conéctese directamente desde la API de Telephone Bot a su plataforma de bots

Esta configuración le permite especificar directamente un punto final de Voice Bot en lugar de especificar un destino de devolución de llamada http genérico. La ventaja de esto es que no tiene que lidiar con tener que proporcionar el servicio web de devolución de llamadas. Tenga en cuenta que, en esta configuración, cualquier solicitud de back-end desde la lógica de su aplicación a, por ejemplo, los servicios de datos, ahora tendrá que hacerse desde la plataforma de bots.

Las plataformas de bots que ya admitimos son RASA y Google Dialogflow. Actualmente estamos trabajando para integrarnos con Marco de bots de Microsoft. Esperamos terminar esta integración a tiempo para la primera versión de la integración de la plataforma Voicegain-Bot. También tenemos previsto trabajar muy pronto en una integración con Kore.ai.


Ganancia de voz: La IA de voz bajo tu control

Ganancia de voz: Cree aplicaciones de IA de voz con nuestras API de NLU de voz a texto y LLM. Graba y transcribe reuniones, llamadas a centros de atención al cliente, vídeos, etc. Obtén resúmenes, opiniones y mucho más basados en LLM. Cree bots de voz conversacionales que se integren con su plataforma CCaaS local o en la nube. Comience hoy mismo.

Descubre cómo funciona Voicegain — obtén una demostración de Voicegain hoy mismo.

Inscríbase hoy mismo en una aplicación
* No se requiere tarjeta de crédito.

Empresarial

¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?

Póngase en contacto con nosotros →
Voicegain - Speech-to-Text
Under Your Control