Precios de pago por uso sin compromisos.50$ en créditos proporcionado al registrarse, No se requiere tarjeta de crédito para empezar hoy. Se aplican límites de tarifas; obtenga límites de tarifas personalizados con compromisos de ingresos. El soporte premium conlleva costos adicionales. Póngase en contacto para obtener más información.
Comenzar - Crédito gratuito1. El uso de la plataforma se mide y se factura por segundo, pero las facturas generadas por nuestro sistema de facturación indican el uso en horas.
2. Cada solicitud de API está sujeta a una facturación mínima de 6 segundos y a un incremento de 1 segundo a partir de ese momento. Una solicitud de API de 4 segundos se factura durante 6 segundos o 0,0012 USD (0,00020 USD*6) y una solicitud en tiempo real de 7 segundos se factura 0,00020*7 USD.
3. El modelo básico ofrece STT en un solo canal sin diarización ni redacción de PII. El modelo mejorado ofrece STT para audio de dos canales para centros de llamadas (el agente y la persona que llama en canales separados). También incluye la diarización (un canal con varios altavoces) y la redacción de la PII.
4. STT Realtime-Basic y STT Realtime-Enhanced son para transmitir audio a través de Web-socket. Basic es para monocanal sin diarización. Enhanced es para audio de centro de llamadas estéreo o de dos canales para aplicaciones de centro de llamadas.
5. La API Telephony Bot es una combinación de IVR y conversión de voz a texto de Voicegain.
6. El MRCP ASR es el ASR de voz a texto en tiempo real que forma parte de una sesión de MRCP. Este precio se aplica durante toda la sesión del MRCP. No incluye el costo de la grabación total de las sesiones durante toda la llamada.
7. Se aplican límites de tarifas al pago por uso. Ofrecemos límites de tarifas más altos y precios más bajos con compromisos de volumen y plazo. Póngase en contacto con nosotros en sales@voicegain.ai para obtener los detalles.
Implemente Voicegain en su infraestructura privada. Se ofrece una prueba gratuita de 30 días. Licencias basadas en puertos o en uso disponibles. Se aplica la compra mínima de puertos y usos. Además, hay un costo de soporte anual.
Póngase en contacto con nosotros1. Voicegain Edge hace referencia a que nuestra plataforma se implementa en la infraestructura privada del cliente (sin uso en un centro de datos o en una nube privada). Voicegain se implementa en un clúster de Kubernetes. Preferimos las GPU de NVIDIA para las aplicaciones que requieren una alta concurrencia. Las CPU son compatibles con las aplicaciones con baja concurrencia. La orquestación del clúster se realiza desde la nube Voicegain.
2. El cliente incurrirá en costos de infraestructura y es responsable de monitorear Kubernetes. Para la nube privada, recomendamos administrar Kubernetes desde el proveedor de la nube. Para Datacenter, ponte en contacto con nosotros para conocer las opciones de asistencia.
3. El «puerto», para STT Offline, se define como el rendimiento. Por lo tanto, 25 puertos le permitirían transcribir 25 horas de audio sin conexión por hora. En el caso del STT en tiempo real, el puerto es el número de sesiones de websocket simultáneas. Por ejemplo, 25 puertos significan un máximo de 25 sesiones STT simultáneas en tiempo real durante un mes.
4. En el caso de las licencias basadas en el uso, cada solicitud está sujeta a una facturación mínima de 6 segundos y a un incremento de 1 segundo después. Por ejemplo, una solicitud en tiempo real de 4 segundos se facturará por 6 segundos o 0,0012 USD (0,00020 dólares*6 USD) y una solicitud en tiempo real de 7 segundos se facturará por 7 segundos.
5. Voicegain ofrece descuentos para confirmaciones por volumen y plazo. Póngase en contacto con nosotros en sales@voicegain.ai para recibir precios personalizados.
Puedes transmitir audio para la API de transcripción de Voicegain desde cualquier computadora, pero a veces es útil tener un dispositivo económico dedicado solo para esta tarea. A continuación, compartimos las experiencias de uno de nuestros clientes al usar una Raspbery Pi para transmitir audio y transcribirlo en tiempo real. Reemplazó a un Mac Mini que se usó inicialmente para ese propósito. El uso del Pi tenía dos ventajas: a) obviamente el coste, y b) es menos probable que el Mac Mini sea «secuestrado» para otros fines.
Voicegain Audio Streaming Daemon requiere muy pocos recursos informáticos, por lo que incluso en una Raspberry Pi Zero es suficiente; sin embargo, recomendamos usar Raspberry Pi 3 B+ principalmente porque tiene un puerto Ethernet cableado de 1 Gbps incorporado. Es más probable que las conexiones WiFi tengan problemas con la transmisión mediante el protocolo UDP.
Esta es una lista de todo el hardware utilizado en el proyecto (con los precios de Amazon (a partir de julio de 2019)):
Todos los componentes sumaron un total de 101,97 dólares. La razón por la que se incluyeron un minimonitor y un miniteclado es porque facilitan el control del dispositivo mientras está en el soporte de audio. Por ejemplo, el mezclador de audio Alsa se puede ajustar fácilmente de esta manera y, al mismo tiempo, monitorear el nivel del audio con auriculares.
Raspberry PI con AudioDaemon
El dispositivo funciona con Raspbian estándar, que se puede instalar fácilmente desde una imagen utilizando, por ejemplo, BalenaEtcher. Tras la instalación básica, se necesitó lo siguiente para que todo funcionara:
Estas son algunas de las lecciones aprendidas al usar esta configuración durante los últimos 6 meses:
Puede encontrar el código completo (menos la lógica RASA; tendrá que proporcionar el suyo propio) en nuestra github repositorio.
La configuración le permite llamar a un número de teléfono y luego interactuar con un Voicebot que usa RASA como motor lógico de diálogo.
Actualización de noviembre de 2021: No recomendamos S3 ni AWS Lambda para una configuración de producción. Se describe una revisión más actualizada de varias opciones para crear un Voice Bot aquí. Debería considerar reemplazar la funcionalidad de S3 y AWS Lambda por un servidor web que pueda mantener el estado, como Node.js o Python Flask.
El diagrama de secuencia se proporciona a continuación. Básicamente, la secuencia de operaciones es la siguiente:
¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?