CPaaS

Soporte de dos canales para Twilio Media Streams

La plataforma Voicegain Speech-to-Text ya admite desde hace tiempo muchas de las funciones de Twilio, como:

  • <Connect><Stream> for IVR/VoiceBot applications with voice capacity
  • SORBO, INVITACIÓN - para la integración de la API de devolución de llamadas de Voicegain en las llamadas originadas en Twilio, y también se centra principalmente en las aplicaciones de VR y Voicebot
  • SIPREC - for voice analysis to text in time real or of voice to text and without connection
  • medios simples<Stream>, pero hasta ahora solo en aplicaciones de 1 canal con el objetivo de ofrecer una alternativa para <Gather>

La versión 1.26.0 de la plataforma Voicegain finalmente ofrece un soporte completo de 2 canales para Twilio Media Streams. Esto permite la transcripción en tiempo real de los canales entrantes y salientes al mismo tiempo.

How work?

<Stream>El comando Twilio toma un parámetro de URL de websocket como destino al que se transmiten los canales seleccionados, por ejemplo:


La URL de wss se puede obtener iniciando una nueva sesión de transcripción en tiempo real de Voicegain mediante la API https://api.voicegain.ai/v1/asr/transcribe/async. La parte de sesión de la solicitud puede tener el siguiente aspecto (observe que se inician dos sesiones y cada una recibirá un canal diferente a la izquierda/derecha de la transmisión de audio):

También necesitamos decirle a Voicegain que tome la entrada en el protocolo TWIML en estéreo:


Tenga en cuenta que podemos habilitar la captura de audio, lo que además nos dará una grabación estéreo de la llamada una vez que se complete la sesión.

Como respuesta al inicio de la sesión de Voicegain, obtenemos 3 URL de websocket:

  • <Stream>one for the entrante audio; this the pasé to command Twilio TwiML
  • dos para recibir los resultados de la transcripción en tiempo real; los mensajes individuales tendrán un aspecto similar a, por ejemplo, {"utt»: «one», «conf»: 0.4047, «start»: 440}

Example code

In our github proporcionamos un ejemplo de código python que inicia una simple llamada telefónica saliente de Twilio y luego transcribe en tiempo real tanto el audio entrante como el saliente.

El código de ejemplo ilustra un ejemplo de llamada saliente que es algo más simple porque no implica ninguna devolución de llamada. En el caso de una llamada entrante, la solicitud a Voicegain tendría que hacerse desde la función de devolución de llamada de Twilio, que se invoca cuando se recibe una nueva llamada; de lo contrario, el resto del código sería muy similar al de nuestro ejemplo de github.

Casos de uso

Algunos de ellos ya figuran en Twilio Media Streams Page:

  • transcripción en tiempo real
  • NLU: por ejemplo, detectar y responder a eventos durante la llamada
  • search automatische in knowledge base
  • análisis de sentimientos: use texto para determinar el sentimiento durante la llamada

Próximamente

Probaremos la <Stream>funcionalidad en el Lámpara L lenguaje de comandos proporcionado por la plataforma SignalWire, que es muy similar a Twilio Twiml; actualizaremos nuestro blog con los resultados de esas pruebas.

También estamos trabajando en una versión en tiempo real de nuestro Voice analysis API. Una vez completada, todas las funciones de Speech Analytics estarán disponibles en tiempo real para los usuarios de las plataformas Twilio y SignalWire.

Si estás interesado en Voicegain, ¡llévanos a hacer una prueba de manejo!

1. Haga clic here para obtener instrucciones sobre cómo acceder a nuestro sitio de demostración en vivo.

2. Si estás creando una aplicación de voz genial y quieres probar nuestra API, haz clic herepara crear una cuenta de desarrollador y recibir 50$ en créditos gratis

3. Si quieres usar Voicegain como tu propio asistente de transcripción con IA para las reuniones, haz clic here.

Ganancia de voz: La IA de voz bajo tu control

Ganancia de voz: Cree aplicaciones de IA de voz con nuestras API de NLU de voz a texto y LLM. Graba y transcribe reuniones, llamadas a centros de atención al cliente, vídeos, etc. Obtén resúmenes, opiniones y mucho más basados en LLM. Cree bots de voz conversacionales que se integren con su plataforma CCaaS local o en la nube. Comience hoy mismo.

Descubre cómo funciona Voicegain — obtén una demostración de Voicegain hoy mismo.

Inscríbase hoy mismo en una aplicación
* No se requiere tarjeta de crédito.

Empresarial

¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?

Póngase en contacto con nosotros →
Voicegain - Speech-to-Text
Under Your Control