Edge

Raspberry Pi as Audio Streaming Client

Puedes transmitir audio para la API de transcripción de Voicegain desde cualquier computadora, pero a veces es útil tener un dispositivo económico dedicado solo para esta tarea. A continuación, compartimos las experiencias de uno de nuestros clientes al usar una Raspbery Pi para transmitir audio y transcribirlo en tiempo real. Reemplazó a un Mac Mini que se usó inicialmente para ese propósito. El uso del Pi tenía dos ventajas: a) obviamente el coste, y b) es menos probable que el Mac Mini sea «secuestrado» para otros fines.

Hardware

Voicegain Audio Streaming Daemon requiere muy pocos recursos informáticos, por lo que incluso en una Raspberry Pi Zero es suficiente; sin embargo, recomendamos usar Raspberry Pi 3 B+ principalmente porque tiene un puerto Ethernet cableado de 1 Gbps incorporado. Es más probable que las conexiones WiFi tengan problemas con la transmisión mediante el protocolo UDP.

Esta es una lista de todo el hardware utilizado en el proyecto (con los precios de Amazon (a partir de julio de 2019)):

  • Placa base Element14 Raspberry Pi 3 B+ - 37,78$
  • Pantalla Miuzei Raspberry Pi 3 b+, 3.5 pulgadas - 23,99 dólares
  • Funda de pantalla Miuzei de 3.5 pulgadas para LCD de 3.5 pulgadas - $9.99
  • Mini teclado portátil inalámbrico iPazzPort - 13,99$
  • Adaptador de audio USB UGREEN - 8,99 dólares
  • Tarjeta microSDHC UHS-I SanDisk Ultra de 32 GB - 7,23$
  • además, se utilizó alguna fuente de alimentación USB de 5 V existente.

Todos los componentes sumaron un total de 101,97 dólares. La razón por la que se incluyeron un minimonitor y un miniteclado es porque facilitan el control del dispositivo mientras está en el soporte de audio. Por ejemplo, el mezclador de audio Alsa se puede ajustar fácilmente de esta manera y, al mismo tiempo, monitorear el nivel del audio con auriculares.



Raspberry PI con AudioDaemon

Software

El dispositivo funciona con Raspbian estándar, que se puede instalar fácilmente desde una imagen utilizando, por ejemplo, BalenaEtcher. Tras la instalación básica, se necesitó lo siguiente para que todo funcionara:

  • habilitar el acceso ssh
  • cambiar el dispositivo de audio predeterminado a una tarjeta de sonido USB (Raspbian viene por defecto con alsa y controladores de sonido USB básicos)
  • instalar el controlador para la pantalla (de lo contrario, la fuente de salida es demasiado pequeña y no se puede leer)
  • instalar OpenJDK 9
  • utilice el enlace generado desde el portal Voicegain para descargar el archivo jar de Voicegain AudioDaemon y corregir la configuración de JSON
  • establecer el número de fuente de audio correcto, el script de inicio de AudioDaemon y lanzar el daemon

Observaciones

Estas son algunas de las lecciones aprendidas al usar esta configuración durante los últimos 6 meses:

  • Durante la transmisión, el uso de la CPU se mantiene por debajo del 10%
  • El montón de Java está establecido en 128 millones, lo que parece ser más que suficiente porque los GC logran reducirlo a unos 54 millones
  • La Raspberry Pi resultó ser muy fiable: no hemos tenido un solo problema con el hardware ni con el sistema operativo Raspbian
  • La tarjeta de audio USB barata ofrece una calidad de sonido muy buena (al menos para el reconocimiento de voz)
  • Deben evitarse las fuentes de alimentación USB muy baratas, ya que a veces provocan un zumbido en el audio (pero eso también depende del dispositivo de audio que se esté conectando).

Ganancia de voz: La IA de voz bajo tu control

Ganancia de voz: Cree aplicaciones de IA de voz con nuestras API de NLU de voz a texto y LLM. Graba y transcribe reuniones, llamadas a centros de atención al cliente, vídeos, etc. Obtén resúmenes, opiniones y mucho más basados en LLM. Cree bots de voz conversacionales que se integren con su plataforma CCaaS local o en la nube. Comience hoy mismo.

Descubre cómo funciona Voicegain — obtén una demostración de Voicegain hoy mismo.

Inscríbase hoy mismo en una aplicación
* No se requiere tarjeta de crédito.

Empresarial

¿Está interesado en personalizar el ASR o implementar Voicegain en su infraestructura?

Póngase en contacto con nosotros →
Voicegain - Speech-to-Text
Under Your Control