Interruptor gratuito es una plataforma de telefonía muy capaz adecuada para crear diversas aplicaciones de telefonía. Algunas de esas aplicaciones se basarán en la conversión de voz a texto, por ejemplo: los ACD (distribución automática de llamadas), los IVR, los bots de voz, la asistencia de agentes en tiempo real, la transcripción de conferencias telefónicas en tiempo real, la supervisión de llamadas, etc.
La plataforma Voicegain Speech-to-Text se puede usar con FreeSWITCH de varias maneras.
1. mod_unimrcp para IVR
La plataforma Voicegain STT es compatible con MRCP (Media Resource Control Protocol) desde hace mucho tiempo. Se puede acceder a nuestro ASR mediante el MRCP y admitimos tanto el reconocimiento basado en la gramática (por ejemplo, GRXML) como la transcripción de vocabulario extenso. El MRCP es un protocolo de comunicación diseñado para conectar los IVR y los bots de voz basados en telefonía con reconocedores de voz (ASR) y sintetizadores de voz (TTS).
FreeSwitch puede interactuar con los reconocedores basados en MRCP utilizando el mod_unimrcp módulo. El Voicegain STT ha sido probado con mod_unimrcp e interactúa con él sin problemas. Puedes obtener más información sobre el uso de Voicegain STT a través de mod_unimrcp en esta entrada de blog.
Voicegain es compatible con MRCP tanto en la nube como en Edge (local). Pronto lanzaremos en OpenSource un complemento de reconocimiento para unimrcp servidor que le dará aún más opciones para implementar FreeSwitch con Voicegain y MRCP.
2. Conecta con la API Voicegain Telephony Bot
Voicegain proporciona una API de bots de telefonía, que es una API de devolución de llamadas, similar en estilo a Twilio TWiML. Puedes realizar una llamada al terminal de Voicegain usando un número de teléfono obtenido de Voicegain o usando un punto final SIP exclusivo de tu aplicación Voicegain. Cuando recibas una llamada, recibirás una llamada web y la respuesta que proporciones determinará las acciones que realizará la plataforma Voicegain, como reproducir un mensaje, reconocer la voz, detectar el DTMF, etc.
Puedes obtener más información sobre esta API en las siguientes publicaciones del blog:
- Voicegain lanza las API de Telephony Bot para bots e IVR de telefonía
- Instrucciones sencillas: cree un robot de voz con Voicegain, RASA y AWS Lambda
- IVR Easy Speech para llamadas salientes con Voicegain y Twilio
Si tienes una aplicación FreeSWITCH y quieres reconocer el habla hablada, puedes puente al punto final SIP de Voicegain y en una devolución de llamada, especifique un mensaje y el tipo de captura de voz (basada en la gramática o en vocabulario extenso). Cuando finalice el reconocimiento, recibirás una llamada y, a continuación, podrás emitir una orden de desconexión que devolverá el flujo de llamadas a tu aplicación de Freeswitch, o puedes continuar con más preguntas y reconocimientos en la plataforma Voicegain, según sea necesario.
A continuación se muestra un ejemplo de una interacción sencilla con 4 participantes:
- Interruptor gratuito
- Su lógica de control para la aplicación FS, por ejemplo, un script de Lua
- Servicio web que gestionará las devoluciones de llamadas desde la API Voicegain Telephone Bot. Tiene que poder mantener los datos de la sesión.
- Plataforma API Voicegain Telephone Bot
3. mod_voicegain para usar Voicegain ASR desde aplicaciones/scripts de FS
Esto todavía no está disponible de forma general. Póngase en contacto con nosotros si está interesado en realizar una prueba.
mod_voicegain le proporcionará capacidades similares a las de usar mod_unimrcp con Voicegain, pero sin la sobrecarga de usar un protocolo MRCP: mod_voicegain se comunica directamente con Voicegain ASR.
mod_voicegain aprovecha la transmisión de audio entrante de FreeSwitch y envía los datos de audio a Voicegain ASR en la nube o en Edge. Voicegain ASR procesa el audio de acuerdo con los parámetros de invocación especificados en el argumento de datos. Luego comunica el resultado de la transcripción o el reconocimiento en un evento.
mod_voicegain se instala en FreeSwitch como una aplicación y se puede invocar como tal, por ejemplo:
o desde el script LUA:
Los resultados siempre se devolverán como un evento FreeSwitch, pero también es posible obtener los resultados en una devolución de llamada a la URL especificada en callback.uri
El evento FreeSwitch será de tipo personalizado (Nombre-evento: CUSTOM) y la subclase de evento será «voicegain_asr_update». La carga útil correspondiente estará en el campo «ASR-Response» con formato JSON.
Puedes leer más sobre mod_voicegain es este artículo de la base de conocimientos.
4. mod_vg_tap para la transcripción en tiempo real
mod_vg_tap se ha desarrollado pensando en aplicaciones como Real-Time Agent Assist. Estas aplicaciones necesitan acceder a la transmisión de audio de una llamada de FreeSwitch, pero no necesitan interactuar con FreeSwitch de otro modo (a diferencia del IVR y los Voice-Bots).
mod_vg_tap se instala como una aplicación y tiene comandos sencillos para iniciar o detener la transmisión al motor Voicegain Speech-to-Text.
El comando start puede especificar los siguientes destinos:
- URL (s) de websocket: devueltas por un comando POST que inicia una nueva sesión de voz a texto
- socket IP: puerto para comunicación por socket; solo es compatible con Voicegain implementado en Edge (local)
- (en la hoja de ruta): cuerpo completo de JSON para iniciar una nueva sesión de voz a texto y comenzar a transmitir a ella
Por lo general, los resultados de la transcripción no se devuelven a una aplicación FreeSwitch, sino que se entregan al destino especificado al iniciar la sesión de conversión de voz a texto; los resultados se pueden entregar mediante websocket, sondeo o devolución de llamada.
Si deseas obtener más información sobre cualquiera de estos métodos de integración de Voicegain con FreeSwitch, envíanos un correo electrónico a support@voicegain.ai.