CPaaS

Conversión de voz a texto precisa y asequible para desarrolladores de SignalWire

Esta entrada del blog describe cómo los desarrolladores de SignalWire deben integrar Voicegain Speech-to-Text/ASR en función de la aplicación que están creando.

Voicegain ofrece una altamente preciso Opción de conversión de voz a texto/ASR en SignalWire. Voicegain es muy con precios disruptivos y una de las principales ventajas es que permite a los desarrolladores personalizar los modelos acústicos subyacentes para lograr una precisión muy alta para acentos específicos o verticales de la industria.

#1: Transcripción en tiempo real y análisis del habla con LaML <Stream>

Los desarrolladores de SignalWire pueden bifurcar el audio a Voicegain mediante el <Stream>instrucción en LAML. La <Stream>instrucción permite enviar transmisiones de audio sin procesar desde una llamada telefónica en curso a través de WebSockets casi en tiempo real, a una URL específica.

Los desarrolladores que solo deseen obtener el texto o la transcripción sin procesar pueden usar la API Voicegain STT para obtener la transcripción en tiempo real del audio transmitido desde SignalWire.

Para los desarrolladores que necesitan etiquetas de NLU como sentimiento, entidades nombradas, intenciones y palabras clave además de la transcripción, la API Speech Analytics de Voicegain proporciona esas métricas además de la transcripción.

Las aplicaciones de transcripción y análisis de voz en tiempo real incluyen la asistencia de agentes en tiempo real en los centros de contacto, la extracción de información para las llamadas de ventas realizadas por telefonía y el análisis de reuniones.

#2: Voice Bot o IVR de voz con diálogo dirigido

Si desea crear un Voice Bot o una aplicación de voz IVR de diálogo dirigido que gestione las llamadas que llegan a través de SignalWire, le sugerimos que utilice Voicegain. API de bots de telefonía. Se trata de una API de devolución de llamadas web similar a LaML y contiene instrucciones o comandos especialmente útiles para crear IVR o bots de voz. Esta API gestiona la conversión de voz a texto, los dígitos DTMF y también reproduce las indicaciones (en TTS, pregrabadas o una combinación).

Las llamadas se transfieren desde SignalWire a un terminal SIP proporcionado por Voicegain (basado en FreeSwitch) mediante un simple SIP INVITE.

La API Voicegain Telephony Bot le permite crear dos tipos de aplicaciones:

  • Bot de voz aplicaciones que utilizan un marco Bot de su elección. Voicegain proporciona el «oído» y la «boca» del bot, mientras que el Bot Framework gestiona el diálogo y extrae las intenciones del texto transcrito. En esta entrada del blog se describe cómo crear un Voice Bot uso del marco de bots de RASA.
  • IVR de diálogo dirigido utilizando flujos de llamadas y gramáticas. Puede programarlos directamente mediante la API Telephony Bot implementando las devoluciones de llamada adecuadas. Como alternativa, proporcionamos un script simple que te permite especificar toda la aplicación IVR de forma declarativa en un archivo YAML. Puedes encontrar un ejemplo completo de cómo hacerlo en nuestro github: platform/declarative-ivr at master · voicegain/platform (github.com)

#3: Aplicaciones personalizadas

Si tu aplicación solo tiene una necesidad limitada de reconocimiento de voz, puedes invocar la API Voicegain STT solo cuando sea necesario. Cada vez que necesites el reconocimiento de voz en tu aplicación, solo tienes que iniciar una nueva sesión de ASR con Voicegain o en transcribir (transcripción de vocabulario extenso) o reconocer modo (reconocimiento basado en gramática). <stream>Puede usar el comando LAML

Un ejemplo de aplicación que podría ser una aplicación de dictado o recuperación de correo de voz controlada por voz en la que la API de reconocimiento de Voicegain se utiliza en modo continuo y escucha comandos como reproducir, detener, seguir, etc.

Además de SignalWire, Voicegain también ofrece integraciones con FreeSwitch mediante el complemento mrcp y un módulo independiente para la transcripción en tiempo real.

Si es desarrollador de SignalWire y desea crear una aplicación que requiera conversión de voz a texto/ASR, puede regístrate para obtener una cuenta de desarrollador utilizando las instrucciones que se proporcionan aquí.

Ganancia de voz: La IA de voz bajo tu control

Ganancia de voz: Cree aplicaciones de IA de voz con nuestras API de NLU de voz a texto y LLM. Graba y transcribe reuniones, llamadas a centros de atención al cliente, vídeos, etc. Obtén resúmenes, opiniones y mucho más basados en LLM. Cree bots de voz conversacionales que se integren con su plataforma CCaaS local o en la nube. Comience hoy mismo.

Descubre cómo funciona Voicegain — obtén una demostración de Voicegain hoy mismo.

Inscríbase hoy mismo en una aplicación
* No se requiere tarjeta de crédito.

Empresarial

¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?

Póngase en contacto con nosotros →
Voicegain - Speech-to-Text
Under Your Control