El MRCP ASR permite a los desarrolladores de telefonía integrarse con el ASR de aprendizaje profundo de Voicegain mediante el protocolo MRCP. Intégralo con FreeSwitch o con cualquier plataforma VoiceXML que pueda utilizar el MRCP.
Invoque nuestro ASR con gramáticas de voz o utilice la transcripción de vocabulario extenso para bots de voz, IVR, subtítulos en tiempo real y más.
En un amplio índice de referencia, nuestra precisión del 89% está a la altura de las mejores
Hable con nosotros en inglés, español, alemán, portugués, coreano, hindi (más en breve)
Probado en instancias informáticas de Google, AWS, Azure, IBM y Oracle
Se integra con VXML, FreeSwitch y otras plataformas que hablan sobre MRCP
Voicegain STT platform has supported MRCP (Media Resource Control Protocol) for a long time now. Our ASR can be accessed using MRCP and we support both grammar-based recognition (e.g. GRXML) and large-vocabulary transcription. MRCP is a communication protocol designed to connect telephony based IVRs and Voice Bots with speech recognizers (ASR) and speech synthesizers (TTS).
Previously we tested connecting to Voicegain using MRCP from VXML platforms like Dialogic PowerMedia XMS or Aspect Prophecy. We had not tested connecting from FreeSWITCH, a popular open source telephony platform, using its MRCP plugin mod_unimrcp.
We are pleased to announce that Voicegain platform works out-of-the box with mod_unimrcp, the MRCP plugin for FreeSWITCH. However, getting the mod_unimrcp plugin to work on FreeSWITCH is not particularly trivial. Here are some pointers to help those who would like to use mod_unimrcp with our platform.
There are currently 2 options to do this. We plan to add a third option very soon
Also, the current TTS option accessible over MRCP are not great. Our focus has been on the use of prerecorded prompts for IVRs and Voice Bots. We plan to shortly allow developers to access the Google or Amazon TTS.
mod_unimrcp does not get built by default when you build FreeSWITCH from source. To get it built you need to enable it in build/modules.conf.in by uncommenting this line: #asr_tts/mod_unimrcp
After the build, before starting FreeSWITCH you will need to:
Here is an example MRCP v2 profile for connecting to Voicegain MRCP:
Here are some additional notes about the configuration file:
Here is an example of how to play a question prompt and to invoke the ASR via mod_unimrcp to recognize a spoken phone number:
What this example does is:
The result of the recognition is a string in XML format (NLSML). You will need to parse it to get the utterance and any semantic interpretations. NLSML result also contains confidence.
The normal command "play_and_detect_speech" holds onto ASR session until the end of the call - this makes subsequent recognitions more responsive, but you are paying for the MRCP session. You can also use this command "play_and_detect_speech_close_asr" to release ASR session immediately after recognition.
If you have any questions about the use of Voicegain ASR via MRCP please contact us at: support@voicegain.ai
On our roadmap we have a mod_voicegain plugin for FreeSWITCH which will bypass the need for mod_unimrcp and unimrcp server and will be talking from FreeSWITCH directly to the Voicegain ASR using gRPC.
Esta entrada de blog está dirigida a cualquier persona responsable de actualizar o migrar un Nuance ASR basado en MRCP que se acerca al final de su vida útil (EOL). Pueden explorar cómo Voicegain ASR simplifica y prolonga económicamente la vida útil de las plataformas Speech-IVR existentes. Sirve como un sustituto inmediato del Nuance ASR basado en la gramática.
Hay varios cientos (si no miles) de IVR con voz basados en telefonía que actúan como «puerta de entrada» para todas las llamadas telefónicas de servicio al cliente para empresas de todos los tamaños. Estos IVR habilitados para voz se basan en plataformas como Genesys Voice Portal (GVP), Genesys Engage, Avaya Aura Experience Portal (AAEP) /Avaya Voice Portal, Cisco Voice Portal (CVP), la plataforma Aspect o Voxeo ProphecyVoiceXML y varias otras soluciones de IVR basadas en VoiceXML. Los sistemas utilizan principalmente el ASR de Nuance como motor de reconocimiento de voz.
A diferencia de los motores ASR/STT contemporáneos basados en redes neuronales de gran vocabulario, el ASR tradicional de Nuance es un ASR basado en la gramática. Utiliza el protocolo MRCP para comunicarse con plataformas IVR basadas en VoiceXML. La mayoría de estos sistemas se adquirieron en las dos últimas décadas (años 2000 y 2010). Los clientes solían pagar una licencia perpetua basada en el puerto (las plataformas IVR también recibían licencias similares). La mayoría de las empresas tienen contratos de mantenimiento de software o AMC para el ASR de Nuance y, por lo general, este contrato se incluye junto con la plataforma IVR. Las versiones de Nuance Recognizer del mercado varían entre la 9.0 y la 11.0. En junio de 2022, Nuance anunció el fin del soporte para Nuance 10.0. Al hablar con los clientes, tenemos entendido que la última versión de Nuance vendida, Nuance 11.0 Recognizer, se acercará al final de su ciclo de vida útil o al final de los pedidos en 2025*.
Además, al hablar con los clientes, hemos entendido que los clientes que actualmente licencian el ASR de Nuance basado en la gramática MRCP deberán actualizarse al motor Krypton de Nuance, el nuevo ASR basado en el aprendizaje profundo, en 2025. Solo se puede acceder a Nuance Krypton mediante la moderna API basada en gRPC y no mediante MRCP, lo que hace que esta actualización sea cara y lleve mucho tiempo. Por este motivo, los clientes tendrían que actualizar no solo el ASR, sino también toda la plataforma de IVR. Esto se debe a que la mayoría de las plataformas IVR antiguas, especialmente, no son compatibles con el gRPC. Esto también podría implicar migrar la lógica de flujo de llamadas existente (que probablemente esté escrita en un estudio de aplicaciones de VoiceXML o escrita en una herramienta de compilación y generada como páginas de VoiceXML).
Todos los pasos anteriores hacen que el proceso de actualización sea muy difícil. Si bien hay argumentos sólidos a favor de las ventajas de actualizar a un ASR basado en el aprendizaje profundo para respaldar las interacciones conversacionales (mejores tasas de automatización y una experiencia de usuario más natural), es fundamental para los clientes que esta actualización o migración se realice dentro de los plazos establecidos por el cliente y no a contrarreloj del proveedor.
Voicegain ofrece un reemplazo inmediato para el ASR basado en la gramática de Nuance. Somos el único ASR moderno del mercado basado en el aprendizaje profundo y la inteligencia artificial (redes neuronales) que admite de forma nativa tanto las gramáticas orales tradicionales (grxml, SRGS) como las interacciones conversacionales con gran cantidad de vocabulario. También somos uno de los pocos proveedores de ASR a los que se puede acceder mediante un protocolo tradicional basado en la telefonía, como el MRCP, y mediante un método moderno basado en la web, como los sockets web (o gRPC). Por lo tanto, el mismo modelo de red neuronal es compatible con los protocolos antiguos y nuevos. Esto le permite disponer de un método preparado para el futuro para reemplazar el ASR de Nuance con un mínimo esfuerzo y, al mismo tiempo, proteger esta inversión a largo plazo.
Net-net, simplemente «apuntando» el recurso ASR de la plataforma VoiceXML a la dirección IP del ASR MRCP de Voicegain de su red, puede reemplazar todo el ASR de Nuance por el Voicegain ASR. Los clientes no necesitarían ni siquiera cambiar o modificar una sola línea de código de la lógica de la aplicación Speech-IVR.
En otras palabras, un cliente puede conservar la configuración de telefonía e IVR existente y simplemente realizar una «sustitución inmediata» del MRCP ASR de Nuance por el MRCP ASR de Voicegain.
A largo plazo, el mismo Voicegain ASR puede realizar transcripciones de gran cantidad de vocabulario porque se trata de un ASR basado en redes neuronales; por lo tanto, cuando el cliente esté listo para reemplazar el IVR de voz con diálogo directo por una interacción conversacional, la plataforma Voicegain ya lo admitirá.
Para analizar su situación de actualización con más detalle, póngase en contacto con nosotros por correo electrónico a sales@voicegain.ai. Podemos responder a cualquier pregunta que tenga. También puedes empezar con una cuenta de desarrollador gratuita siguiendo estas instrucciones. No se requiere tarjeta de crédito y ofrecemos 1500 horas de uso de forma gratuita. Aquí tienes un enlace a las instrucciones; después de registrarte, ponte en contacto con nosotros en support@voicegain.aiy solicite acceso al MRCP.
* Nuance ASR y Nuance Krypton son marcas comerciales de Nuance, Inc., que ahora forma parte de Microsoft. Confirme directamente con la empresa el anuncio del fin de su ciclo de vida útil y la funcionalidad del protocolo. La información que incluimos en esta entrada de blog es anecdótica y no se ha verificado con Nuance.
¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?