API de conversión de voz a texto

Las API de conversión de voz a texto (STT) permiten a los desarrolladores incorporar la transcripción automática en cualquier aplicación compatible con voz. Las API se basan en modelos ASR de aprendizaje profundo altamente precisos y fáciles de entrenar, y admitimos casos de uso por lotes y de streaming.

* No se requiere tarjeta de crédito.
Voicegain - Speech-to-Text
Under Your Control
Empresas que crean productos increíbles confían en nosotros
Transcribe audio a escala,
en nuestra nube o en la suya

Invoca nuestras API de STT con nuestro servicio en la nube altamente escalable o implementa una versión en contenedores de Voicegain en tu VPC o centro de datos. Nuestras API pueden convertir archivos de audio/vídeo por lotes o una transmisión multimedia en tiempo real en texto, y admitimos más de 40 formatos de audio.

Precisión

89%

En un amplio índice de referencia, nuestra precisión del 89% está a la altura de las mejores

Idiomas

8

Hable con nosotros en inglés, español, alemán, portugués, coreano (más en breve)

VPC

5

Probado en instancias informáticas de Google, AWS, Azure, IBM y Oracle

CCAAS/CPaaS

Más de 10

Se integra con Twilio, Genesys, FreeSwitch y otras plataformas CCaaS y CPaaS

Fácil de usar,
Flexible para satisfacer sus necesidades
  • Preciso y asequible
    Nuestras API tienen un precio desorbitado y la precisión es mejor o está a la altura de la mejor
  • Soporte en varios idiomas
    Inglés, español, portugués, alemán, coreano. Próximamente -> holandés, francés e hindi
  • Despliegue flexible
    Invoca como un servicio en la nube o impleméntalo en tu VPC o centro de datos
  • Procesamiento rápido sin conexión
    Procesa audio 100 veces más rápido que en tiempo real
  • Adaptación de voz en tiempo real
    Usa sugerencias, fichas de clase y gramáticas para obtener una mayor precisión
  • Entrene modelos personalizados
    Entrene modelos acústicos y lingüísticos para obtener una precisión sin igual
  • Soporte de streaming
    Transmita mediante WebSockets o mediante telefonía (SIPREC, MRCP, etc.)
  • Diarización de altavoces
    Diariza el audio monocanal para separar los altavoces
  • Soporte CCaaS/CPaaS
    Intégrese con las plataformas CPaaS/CPaaS más populares
  • GPU NVIDIA
    Se ejecuta en instancias de procesamiento de GPU de NVIDIA de Google, AWS y Azure
Preguntas frecuentes
¿Puedo acceder a la documentación de la API?
¿Cuál es el precio de las API STT de Voicegain?
¿Ofrecen soporte?
¿Cómo puedo transmitir audio a Voicegain?
¿Qué idiomas hablas actualmente?
¿apoyo?
Dónde se procesan mis datos y
almacenado?
¿Cómo protegen mis datos?
Integraciones
Fuentes de audio
Marcos de bots
Plataformas de reuniones
Consulte nuestro blog para obtener información, puntos de referencia, códigos de muestra y más
Blog Voicegain
Lo que dicen nuestros clientes...
Inscríbase hoy mismo en una aplicación
* No se requiere tarjeta de crédito.

Empresarial

¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?

Póngase en contacto con nosotros →
Voicegain - Speech-to-Text
Under Your Control