Precios de pago por uso sin compromisos. 50$ en créditos proporcionado al registrarse, No se requiere tarjeta de crédito para empezar hoy. Se aplican límites de tarifas; obtenga límites de tarifas personalizados con compromisos de ingresos. Ponte en contacto para obtener más información.
Comenzar - Crédito gratuito1. El uso de la plataforma se mide y se factura por segundo, pero nuestro sistema de facturación muestra el uso en horas.
2. Cada solicitud de API está sujeta a una facturación mínima de 6 segundos y a un incremento de 1 segundo a partir de ese momento. Una solicitud en tiempo real de 4 segundos se factura durante 6 segundos o 0,0012 USD (0,00020 USD*6) y una solicitud en tiempo real de 7 segundos se factura 0,00020*7 USD.
3. STT Offline-Basic ofrece STT en un solo canal sin diarización ni redacción de PII. Voicegain Whisper-small se ofrece al precio básico. STT Offline-Enhanced ofrece diarización y redacción de PII además de la transcripción. Voicegain Whisper-Medium se ofrece a un precio mejorado. También admite grabaciones de 2 canales para centros de llamadas, en las que el agente y la persona que llama están en canales separados. STT-Offline: el modo multicanal sirve para grabar reuniones en Zoom o en cualquier otra plataforma de reuniones en la que cada orador esté en un archivo de audio independiente.
4. STT Realtime-Transcription es para la transmisión de voz a texto de Voicegain a través de sockets web. El precio sobre la mesa es por canal. Ofrecemos un descuento del 50% a los clientes de centros de llamadas en los que el canal del agente y el canal de la persona que llama se transmiten en canales distintos.
5. El modelo personalizado de conversión de voz a texto se basa en el entrenamiento de nuestro modelo estándar con datos adicionales del cliente (mediante el aprendizaje por transferencia). Póngase en contacto con nosotros para conocer los precios.
6. El precio del uso de nuestra API Speech-to-Text/ASR es STT-Realtime con MRCP o Telephony Bot API como parte de una sesión de MRCP o Telephony Bot API. Este precio se aplica durante toda la sesión de MRCP o del bot de telefonía o SIP. No incluye la grabación total de las sesiones durante toda la llamada.
7. Se aplican límites de tarifas al pago por uso. Ofrecemos límites de tarifas más altos y precios más bajos con compromisos de volumen y plazo. Póngase en contacto con nosotros en sales@voicegain.ai para obtener los detalles.
Implemente Voicegain en su infraestructura privada. Se ofrece una prueba gratuita de 30 días. Se ofrecen licencias basadas en puertos o en el uso. Se aplica la compra mínima de puertos y usos. Es posible que se apliquen costos de soporte anuales adicionales.
Póngase en contacto con nosotros1. Voicegain Edge hace referencia a que nuestra plataforma se implementa en la infraestructura del cliente (sin sistema operativo o VPC). Voicegain se implementa en un clúster de Kubernetes. Preferimos las GPU de NVIDIA para las aplicaciones que requieren una alta concurrencia. Las CPU son compatibles con las aplicaciones con baja concurrencia. La orquestación del clúster se realiza desde la nube Voicegain.
2. El cliente incurrirá en costos de infraestructura y es responsable de monitorear Kubernetes. En el caso de la VPC, recomendamos administrar Kubernetes desde el proveedor de la nube y, en el caso de Datacenter, puedes ponerte en contacto con nosotros para conocer las opciones de asistencia.
3. El «puerto», para STT Offline, se define como el rendimiento. Por lo tanto, 25 puertos le permitirían transcribir 25 horas de audio sin conexión por hora. En el caso del STT en tiempo real, el puerto es el número de sesiones de websocket simultáneas. Por ejemplo, 25 puertos significan un máximo de 25 sesiones STT simultáneas en tiempo real durante un mes.
4. En el caso de las licencias basadas en el uso, cada solicitud está sujeta a una facturación mínima de 6 segundos y a un incremento de 1 segundo después. Por ejemplo, una solicitud en tiempo real de 4 segundos se facturará por 6 segundos o 0,0012 USD (0,00020 dólares*6 USD) y una solicitud en tiempo real de 7 segundos se facturará por 7 segundos.
5. Voicegain ofrece descuentos para confirmaciones por volumen y plazo. Póngase en contacto con nosotros en sales@voicegain.ai para recibir precios personalizados.
Puedes transmitir audio para la API de transcripción de Voicegain desde cualquier computadora, pero a veces es útil tener un dispositivo económico dedicado solo para esta tarea. A continuación, compartimos las experiencias de uno de nuestros clientes al usar una Raspbery Pi para transmitir audio y transcribirlo en tiempo real. Reemplazó a un Mac Mini que se usó inicialmente para ese propósito. El uso del Pi tenía dos ventajas: a) obviamente el coste, y b) es menos probable que el Mac Mini sea «secuestrado» para otros fines.
Voicegain Audio Streaming Daemon requiere muy pocos recursos informáticos, por lo que incluso en una Raspberry Pi Zero es suficiente; sin embargo, recomendamos usar Raspberry Pi 3 B+ principalmente porque tiene un puerto Ethernet cableado de 1 Gbps incorporado. Es más probable que las conexiones WiFi tengan problemas con la transmisión mediante el protocolo UDP.
Esta es una lista de todo el hardware utilizado en el proyecto (con los precios de Amazon (a partir de julio de 2019)):
Todos los componentes sumaron un total de 101,97 dólares. La razón por la que se incluyeron un minimonitor y un miniteclado es porque facilitan el control del dispositivo mientras está en el soporte de audio. Por ejemplo, el mezclador de audio Alsa se puede ajustar fácilmente de esta manera y, al mismo tiempo, monitorear el nivel del audio con auriculares.
Raspberry PI con AudioDaemon
El dispositivo funciona con Raspbian estándar, que se puede instalar fácilmente desde una imagen utilizando, por ejemplo, BalenaEtcher. Tras la instalación básica, se necesitó lo siguiente para que todo funcionara:
Estas son algunas de las lecciones aprendidas al usar esta configuración durante los últimos 6 meses:
Puede encontrar el código completo (menos la lógica RASA; tendrá que proporcionar el suyo propio) en nuestra github repositorio.
La configuración le permite llamar a un número de teléfono y luego interactuar con un Voicebot que usa RASA como motor lógico de diálogo.
Actualización de noviembre de 2021: No recomendamos S3 ni AWS Lambda para una configuración de producción. Se describe una revisión más actualizada de varias opciones para crear un Voice Bot aquí. Debería considerar reemplazar la funcionalidad de S3 y AWS Lambda por un servidor web que pueda mantener el estado, como Node.js o Python Flask.
El diagrama de secuencia se proporciona a continuación. Básicamente, la secuencia de operaciones es la siguiente:
¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?