Visión general
Las API de transcripción en tiempo real y análisis de voz de Voicegain pueden acceder a los datos de audio de transmisión en tiempo real desde los sistemas de telefonía IP o comunicaciones unificadas (por ejemplo, de Avaya, Cisco, Genesys) mediante 3 enfoques:
- SIPREC
- SORBO, INVITACIÓN
- Integración programable (mediante API)
Los detalles de cada uno de esos enfoques se describen a continuación.
Casos de uso
Los casos de uso de las API de análisis de voz y transcripción en tiempo real son los siguientes:
- Asistencia de agentes en tiempo real en los centros de contacto para el servicio al cliente
- Asistencia en tiempo real para el personal de ventas (SDR, ingenieros de ventas, EA) para conversaciones y reuniones telefónicas
- Información en tiempo real de las reuniones internas
Las API de transcripción convierten el audio en texto en tiempo real. Las API de análisis de voz ofrecen análisis tanto de texto (intenciones, sentimientos, entidades y palabras clave de NLU) como de audio (tono, silencio, OverTalk, etc.).
SIPREC
El SIPREC se usa generalmente para la grabación de llamadas, pero el estándar esencialmente proporciona una transmisión de audio en tiempo real desde la llamada telefónica, lo que lo hace adecuado para aplicaciones que tienen que funcionar en tiempo real.
La interfaz SIPREC de Voicegain se ha probado en las siguientes plataformas:
- Avaya Enterprise SBC: también admite la integración AES/TSAPI de Avaya para obtener más metadatos de llamadas
- Broadsoft SIPREC Sipá
- Puente integrado de Cisco (BIB): la funcionalidad de puente integrado está disponible en algunos de los teléfonos VoIP de tercera generación de Cisco y es compatible con la versión 6.0 y superior del UCM de Cisco.
- Elemento fronterizo unificado de Cisco (CUBE) de Cisco
- Metaswitch SIPREC sipua - La versión mínima de Metaswitch compatible con SIPREC es la 9.0.10
- Oracle SBC SIPREC - Grabación selectiva de llamadas SIPREC (oracle.com)
- Twilio Twiml <Siprec>
Voicegain puede capturar los metadatos relevantes de la llamada además de obtener el audio (la funcionalidad de captura de metadatos puede diferir en sus capacidades según la plataforma del cliente).
La plataforma Voicegain se puede configurar para iniciar automáticamente la transcripción y el análisis de voz tan pronto como se establezca la nueva sesión de SIPREC.
La compatibilidad con SIPREC está disponible en las implementaciones en la nube y Edge (OnPrem) de la plataforma Voicegain.
SIPREC es una función empresarial de la plataforma Voicegain y no está incluida en el paquete básico. Ponte en contacto con support@voicegain.ai o envía un ticket de Zendesk para obtener más información sobre SIPREC y si quieres usarlo con tu cuenta de Voicegain actual.
SORBO, INVITACIÓN
Algunas plataformas, como Genesys, por ejemplo, no son compatibles con SIPREC. En su lugar, pueden ofrecer la posibilidad de enviar una transmisión de audio de canales separados o combinados a un destino negociado mediante un SIP INVITE. La plataforma Genesys, por ejemplo, admite la transmisión de los medios RTP entrantes y salientes a dos puntos finales SIP independientes.
La plataforma Voicegain le permite definir direcciones SIP que aceptarán dicho SIP INVITE. Como parte del SIP INVITE, se pueden enviar cabeceras SIP personalizadas para proporcionar información que permita cerrar la sesión y transmitir cualquier metadato adicional. Al establecer la conexión SIP, Voicegain realizará una llamada HTTP a un punto final específico para confirmar la conexión y transferir todos los datos de la conexión.
Integración programable
Algunas plataformas UC, en particular las versiones más recientes, proporcionan capacidades adicionales para acceder a la transmisión de audio en tiempo real. En muchas de ellas, esta capacidad se añadió específicamente para simplificar la integración con los servicios de conversión de voz a texto en la nube.
Algunos ejemplos de este tipo de integración son:
- Utilice Avaya DMCC (que forma parte de los servicios de habilitación de aplicaciones (AE) de Avaya Aura®) para abrir transmisiones de RTP con el contenido de la llamada
- Utilice la bifurcación de medios extendida (XMF) proporcionada por Cisco Servicios de pasarela de comunicaciones unificadas
- Cinco 9 Flujo de voz
La plataforma Voicegain proporciona varios protocolos que permiten una integración programable flexible:
- websockets - se admite el envío de datos de audio binarios a través de websocket. Además de los datos binarios, también se admiten los protocolos de mensajes utilizados en Twilio y SignalWire para la transmisión de audio a través de websocket. (Si es necesario, podemos añadir fácilmente la compatibilidad con protocolos de mensajes adicionales).
- gRPC - los datos de audio binarios también se pueden enviar mediante el protocolo gRPC. Tenga en cuenta que esta capacidad se encuentra actualmente en fase beta.
- RTP simple. Voicegain también es compatible con RTP simple. Sin embargo, la negociación de IP, puerto y codificación debe realizarse mediante nuestra API HTTP. No admitimos RTCP ni RTSP. La API HTTP es muy sencilla y algunos de nuestros clientes ya han integrado este tipo de transmisión RTP simple mediante XMF en el entorno UC de Cisco.
Todos esos protocolos admiten la codificación ULaw, aLaw y Linear de 16 bits con una frecuencia de muestreo de 8 o 16 kHz.
¿Te interesa Voicegain? ¡Llévanos a hacer una prueba de manejo!
1. Haga clic aquí para obtener instrucciones sobre cómo acceder a nuestro sitio de demostración en vivo.
2. Si estás creando una aplicación de voz genial y quieres probar nuestras API, haz clic aquípara crear una cuenta de desarrollador y recibir 50$ en créditos gratis.
3. Si quieres usar Voicegain como tu propio asistente de transcripción con IA para las reuniones, haz clic aquí.