Saltar al contenido principal

Introducción

Sofya Transcription es una biblioteca JavaScript que proporciona una solución robusta y flexible para la transcripción de audio en tiempo real. Está diseñada para transcribir flujos de audio y puede integrarse fácilmente en aplicaciones web. La biblioteca también incluye funcionalidad para capturar audio a partir de elementos multimedia.

Requisitos

Requisitos del Navegador

Para usar Sofya Transcription en una aplicación web, asegúrese de que su entorno cumpla con estos requisitos:

  • Navegador Web Moderno: Chrome, Safari o Edge con soporte para WebSocket
  • Web Audio API: Necesario para el procesamiento y streaming de audio
  • MediaStream API: Necesario para el acceso al micrófono y captura de audio
  • Acceso al Micrófono: Los usuarios deben conceder permiso para acceder a su micrófono
  • Soporte para WebSocket: Necesario para la comunicación en tiempo real con el servicio de transcripción
Compatibilidad con Firefox

Actualmente, Firefox tiene un problema conocido con la compatibilidad de la tasa de muestreo de audio al usar la Web Audio API. Esto puede resultar en el siguiente error:

Error: DOMException: AudioContext.createMediaStreamSource: Connecting AudioNodes from AudioContexts with different sample-rate is currently not supported.

Estamos trabajando activamente en una solución para este problema y lo abordaremos en una versión futura. Por ahora, recomendamos usar Chrome, Safari o Edge para la mejor experiencia.

Requisitos de Desarrollo

Para fines de desarrollo y pruebas, necesitará:

  • Node.js: Versión 18.x o superior

Características

Transcripción en Tiempo Real

Sofya Transcription proporciona transcripción rápida y precisa de flujos de audio en tiempo real, asegurando que la información importante se capture con eficiencia y alta precisión.

Integración Flexible

Diseñado para una integración perfecta, Sofya Transcription ofrece un enfoque flexible y modular que se adapta fácilmente a varios flujos de trabajo. Puede implementarse sin interrumpir los procesos existentes, permitiendo una experiencia fluida al agregar funcionalidad de transcripción a sus aplicaciones web.

Múltiples Modos de Conexión

El SDK admite diferentes modos de conexión para acomodar varios escenarios de implementación:

  • Autenticación basada en clave de API
  • Conexiones directas con proveedores (Sofya Compliance y Sofya as Service)
  • Opciones de configuración personalizables para cada tipo de conexión

Captura de Audio de Elementos Multimedia

Capture y transcriba audio de elementos multimedia como <video> y <audio> con facilidad. Esta funcionalidad permite la transcripción eficiente de contenido pregrabado, facilitando la documentación y revisión de datos de audio de fuentes multimedia, mejorando la accesibilidad y usabilidad.

Sistema Integral de Eventos

El SDK proporciona un sistema rico de eventos que permite:

  • Monitorear el progreso de la transcripción en tiempo real
  • Manejar errores de manera elegante
  • Responder a cambios en el estado de la conexión
  • Gestionar eventos del ciclo de vida de la transcripción

Desarrollo con Tipado Seguro

Construido con TypeScript, el SDK proporciona:

  • Definiciones de tipos completas para todos los componentes
  • Soporte para IntelliSense en IDEs modernas
  • Verificación de errores en tiempo de compilación
  • Mejor experiencia de desarrollo

Comenzando

Para comenzar a usar Sofya Transcription en su proyecto:

  1. Instale el paquete:

    npm install sofya.transcription
  2. Importe los componentes necesarios:

    import { SofyaTranscriber } from 'sofya.transcription'
  3. Cree una instancia del transcriber y comience a transcribir:

    const transcriber = new SofyaTranscriber({
    apiKey: 'SU_CLAVE_API',
    config: {
    language: 'es-419'
    }
    })

Para información detallada sobre la API y sus características, consulte la documentación de la API.