Voice Bot

Voicegain como un único ASR para los IVR de voz y los bots de voz

Esta publicación destaca cómo el ASR basado en el aprendizaje profundo de Voicegain admite tanto los IVR habilitados para voz como los bots de voz conversacionales.

Esto puede ayudar a las organizaciones de TI empresariales a simplificar su transición del sistema IVR de telefonía con diálogo dirigido a un Voice Bot conversacional moderno.

Esto se debe a una característica muy importante de Voicegain. Se puede acceder al ASR de Voicegain de dos maneras

1) MRCP ASR para voz IVR: la forma tradicional: El ASR de Voicegain se puede invocar a través de MRCP desde una aplicación VoiceXML IVR desarrollada con gramáticas de voz. Voicegain es un sustituto «directo» del ASR utilizado en la mayoría de estos IVR.

2) Conversión de voz a texto/ASR para bots: la forma moderna: Voicegain ofrece API que se integran con (a) plataformas de telefonía SIP o CPaaS y (b) marcos de bots que presentan un punto final REST. Algunos ejemplos de marcos de bots compatibles son Google Dialogflow, RASA y Azure Bot Service.

¡Los IVR de Diálogo Directo no desaparecerán pronto!

En lo que respecta al autoservicio de voz, las empresas entienden que necesitarían mantener y operar los IVR de voz tradicionales durante muchos años.

Esto se debe a que los usuarios actuales han recibido capacitación a lo largo de los años y se han vuelto expertos en estos IVR habilitados para voz. Preferirían no tener que aprender una nueva interfaz de usuario, como los Voice Bots, si pueden evitarlo. Además, las empresas han realizado inversiones sustanciales en el desarrollo de estos IVR y les gustaría seguir respaldándolos siempre que generen un uso adecuado.

Sin embargo, un segmento cada vez mayor de clientes «nativos digitales» exige experiencias de conversación similares a las de Alexa, ya que proporcionan una experiencia de usuario mucho mejor en comparación con los IVR. Esto está despertando un interés considerable entre las empresas por desarrollar bots de voz que sustituyan a largo plazo a los IVR.

Net-net, incluso cuando las empresas desarrollen nuevos bots de voz conversacionales a largo plazo, necesitarían soportar y operar estos IVR a corto plazo.

Los bots y los IVR utilizan diferentes conjuntos de tecnología de aplicaciones, protocolos y ASR

COMO: Si bien tanto los bots de voz como los IVR requieren ASR y conversión de voz a texto, los ASR que admiten los bots de voz conversacionales son diferentes de los ASR que se utilizan en los IVR de diálogo dirigido. Los ASR compatibles con los IVR se basan en los HMM (modelos ocultos de Markov) y las aplicaciones utilizan gramáticas de voz al invocar el ASR. Por otro lado, los bots de voz funcionan con modelos STT basados en el aprendizaje profundo de vocabulario extenso.

Protocolo: Los protocolos de comunicación entre el ASR y la aplicación también son muy diferentes. Una aplicación de IVR, normalmente escrita en VoiceXML, se comunica con el ASR a través de MRCP; los marcos de bots modernos se comunican con los ASR a través de protocolos modernos basados en la web, como WebSockets y gRPC.

Pila de aplicaciones: La lógica de la aplicación de un IVR de diálogo dirigido se basa en un IDE de aplicación compatible con VoiceXML. Los proveedores más populares en este ámbito son Avaya Aura Experience Portal (AAEP), Cisco Voice Portal (CVP) y Genesys Voice Portal o Genesys Engage. Este artículo explora esto con más detalle.

Por otro lado, los bots de voz modernos requieren marcos de bots como Flujo de diálogo de Google, Kore.ai, RASA, AWS Lex y otros. Utilizan la tecnología moderna de NLU para poder extraer la intención del texto transcrito. Bot Frameworks también ofrece una gestión sofisticada de los diálogos para determinar de forma dinámica los turnos de las conversaciones. También permiten la integración con otros sistemas empresariales como el CRM y la facturación.

En lo que respecta a los bots de voz, la mayoría de las empresas quieren «habilitar por voz» la lógica de interacción con los chatbots, que también se desarrolla en el mismo marco de bots, y luego integrarla con la telefonía. - así que utiliza un número de teléfono para «marcar» el chatbot e interactuar mediante conversión de voz a texto y de texto a voz.

La solución: utilice Voicegain ASR para admitir tanto los IVR como los bots

La plataforma Voicegain es la primera y en la actualidad el único ASR/ Speech-to-Text plataforma del mercado que puede soportar tanto un IVR de voz de diálogo dirigido como un bot de voz conversacional utilizando un único modelo acústico y lingüístico.

Las API de conversión de voz a texto en la nube de Google, Amazon y Microsoft admiten el reconocimiento de voz con vocabulario extenso y pueden admitir bots de voz. Sin embargo, no pueden reemplazar «directamente» la funcionalidad MRCP ASR del IVR de diálogo dirigido.

Además, los ASR MRCP tradicionales que admitían IVR de diálogo dirigido (por ejemplo, Nuance, Lumenvox, etc.) no admiten la transcripción de vocabulario extenso.

Integración con marcos de bots y telefonía

Ofertas de Voicegain API de bots de telefonía para ayudar a los desarrolladores de bots a proporcionar la «boca» y la «oreja» del bot.

Estas API son API de tipo callback que una empresa puede usar junto con el marco de bots de su elección.

Además del ASR actual, Voicegain también incorpora una interfaz de telefonía y PSTN. Hay 3 posibilidades:

1. Integración con plataformas CPaaS modernas como Twilio, SignalWire y Telnyx Con esta integración, las personas que llaman ahora pueden «marcar y hablar» con sus chatbots a través de un número de teléfono.

2. SIP INVITE desde la plataforma CCaaS o CPaaS: el desarrollador del bot puede transferir el control de llamadas a Voicegain mediante un SIP INVITE. Una vez transferida la llamada, el Bot Framework puede interactuar utilizando las API mencionadas anteriormente. Al final de la interacción con el bot, puede finalizar la sesión del bot y continuar la conversación en vivo en la plataforma CCaaS/CPaaS.

3. CPaaS integrada con Voicegain: Voicegain también ha incorporado la CPaaS de Amazon Chime, por lo que los desarrolladores pueden comprar un número de teléfono y empezar a crear su bot de voz en cuestión de minutos.

Básicamente, al usar las API de Telephony Bot junto con cualquier marco de bot, una empresa puede: tienen un marco de bots y un ASR que sirva a los 3 medios de autoservicio - Chatbots, robots de voz y IVR de diálogo dirigido.

Para explorar más esta idea, envíenos un correo electrónico a info@voicegain.ai

Ganancia de voz: La IA de voz bajo tu control

Ganancia de voz: Cree aplicaciones de IA de voz con nuestras API de NLU de voz a texto y LLM. Graba y transcribe reuniones, llamadas a centros de atención al cliente, vídeos, etc. Obtén resúmenes, opiniones y mucho más basados en LLM. Cree bots de voz conversacionales que se integren con su plataforma CCaaS local o en la nube. Comience hoy mismo.

Descubre cómo funciona Voicegain — obtén una demostración de Voicegain hoy mismo.

Inscríbase hoy mismo en una aplicación
* No se requiere tarjeta de crédito.

Empresarial

¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?

Póngase en contacto con nosotros →
Voicegain - Speech-to-Text
Under Your Control