Casos de uso

Reconocimiento de voz Voicegain para selección de voz en almacenes

Entre las diversas API de conversión de voz a texto que proporciona Voicegain se encuentra una API de reconocimiento de voz que utiliza gramáticas y admite el reconocimiento continuo. Esta API es ideal para su uso en aplicaciones de selección por voz de almacén. Los sistemas de gestión de almacenes pueden integrar las API de Voicegain para ofrecer la selección por voz como parte de su conjunto de funciones.

Aquí tienes más detalles de esa API específica:

  • Entrada de audio - admite la transmisión de audio a través de websockets para una integración muy sencilla con aplicaciones basadas en la web o para Android/iOS (la compatibilidad con gRPC está en versión beta)
  • Resultados de reconocimiento están disponibles mediante devoluciones de llamadas websocket o http en formato JSON. El envío de los resultados del reconocimiento a través de websockets es una incorporación reciente y facilita mucho la creación de aplicaciones de selección por voz basadas en la web.
  • Soportes reconocimiento basado en gramática - más adecuado para un conjunto de comandos bien definido en comparación con un vocabulario amplio de voz a texto. Tiene una mayor precisión, rechaza mejor el ruido, maneja mejor los distintos acentos, etc. El uso de gramáticas proporciona la ventaja de señalar rápidamente al final: el reconocedor sabe que la orden se ha pronunciado por completo y no se necesita tiempo de espera adicional para determinar el final del discurso. Admitimos una variante del formato gramatical JSGF que es muy intuitiva y fácil de usar.
  • Soportes reconocimiento continuo - se pueden reconocer varios comandos en una sola sesión http. El reconocimiento continuo permite que los comandos estén más cerca y permite la corrección natural de los errores de reconocimiento mediante una simple repetición.

Además de eso, la plataforma Voicegain Speech-to-Text ofrece beneficios adicionales para las aplicaciones de selección de voz:

  • El modelo acústico/lingüístico es personalizable, lo que permite una precisión de reconocimiento muy alta para dominios específicos
  • Herramientas basadas en la web disponibles para revisar los reconocimientos de expresiones. Estas herramientas permiten ajustar la gramática y recopilar enunciados para el entrenamiento de modelos.

En conjunto, esto permite que su aplicación Voice Picking aprenda y mejore continuamente.

Nuestras API están disponibles en la nube, pero también se pueden alojar en Edge (in situ), lo que puede aumentar la confiabilidad y reducir las latencias, que ya son bajas.

Si quieres probar nuestra API y ver cómo encajarían en tus aplicaciones de almacén, puedes empezar con la aplicación web de ejemplo completamente funcional que hemos puesto a disposición en github: platforma/examples/comandos-gramática-aplicación web en master · voicegain/platform (github.com)

Si tiene alguna pregunta, envíenos un correo electrónico a Correo electrónico: info@voicegain.ai. También puedes registrarte para obtener una cuenta gratuita en la plataforma Voicegain a través de nuestra consola web en: https://console.voicegain.ai/signup

Ganancia de voz: La IA de voz bajo tu control

Ganancia de voz: Cree aplicaciones de IA de voz con nuestras API de NLU de voz a texto y LLM. Graba y transcribe reuniones, llamadas a centros de atención al cliente, vídeos, etc. Obtén resúmenes, opiniones y mucho más basados en LLM. Cree bots de voz conversacionales que se integren con su plataforma CCaaS local o en la nube. Comience hoy mismo.

Descubre cómo funciona Voicegain — obtén una demostración de Voicegain hoy mismo.

Inscríbase hoy mismo en una aplicación
* No se requiere tarjeta de crédito.

Empresarial

¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?

Póngase en contacto con nosotros →
Voicegain - Speech-to-Text
Under Your Control