Introducción
Sofya Transcription es una biblioteca JavaScript que proporciona una solución robusta y flexible para la transcripción de audio en tiempo real. Está diseñada para transcribir flujos de audio y puede integrarse fácilmente en aplicaciones web. La biblioteca también incluye funcionalidad para capturar audio a partir de elementos multimedia.
Requisitos
Requisitos del Navegador
Para usar Sofya Transcription en una aplicación web, asegúrese de que su entorno cumpla con estos requisitos:
- Navegador Web Moderno: Chrome, Safari o Edge con soporte para WebSocket
- Web Audio API: Necesario para el procesamiento y streaming de audio
- MediaStream API: Necesario para el acceso al micrófono y captura de audio
- Acceso al Micrófono: Los usuarios deben conceder permiso para acceder a su micrófono
- Soporte para WebSocket: Necesario para la comunicación en tiempo real con el servicio de transcripción
Actualmente, Firefox tiene un problema conocido con la compatibilidad de la tasa de muestreo de audio al usar la Web Audio API. Esto puede resultar en el siguiente error:
Error: DOMException: AudioContext.createMediaStreamSource: Connecting AudioNodes from AudioContexts with different sample-rate is currently not supported.
Estamos trabajando activamente en una solución para este problema y lo abordaremos en una versión futura. Por ahora, recomendamos usar Chrome, Safari o Edge para la mejor experiencia.
Requisitos de Desarrollo
Para fines de desarrollo y pruebas, necesitará:
- Node.js: Versión 18.x o superior
Características
Transcripción en Tiempo Real
Sofya Transcription proporciona transcripción rápida y precisa de flujos de audio en tiempo real, asegurando que la información importante se capture con eficiencia y alta precisión.
Integración Flexible
Diseñado para una integración perfecta, Sofya Transcription ofrece un enfoque flexible y modular que se adapta fácilmente a varios flujos de trabajo. Puede implementarse sin interrumpir los procesos existentes, permitiendo una experiencia fluida al agregar funcionalidad de transcripción a sus aplicaciones web.
Múltiples Modos de Conexión
El SDK admite diferentes modos de conexión para acomodar varios escenarios de implementación:
- Autenticación basada en clave de API
- Conexiones directas con proveedores (Sofya Compliance y Sofya as Service)
- Opciones de configuración personalizables para cada tipo de conexión
Captura de Audio de Elementos Multimedia
Capture y transcriba audio de elementos multimedia como <video>
y <audio>
con facilidad. Esta funcionalidad permite la transcripción eficiente de contenido pregrabado, facilitando la documentación y revisión de datos de audio de fuentes multimedia, mejorando la accesibilidad y usabilidad.
Sistema Integral de Eventos
El SDK proporciona un sistema rico de eventos que permite:
- Monitorear el progreso de la transcripción en tiempo real
- Manejar errores de manera elegante
- Responder a cambios en el estado de la conexión
- Gestionar eventos del ciclo de vida de la transcripción
Desarrollo con Tipado Seguro
Construido con TypeScript, el SDK proporciona:
- Definiciones de tipos completas para todos los componentes
- Soporte para IntelliSense en IDEs modernas
- Verificación de errores en tiempo de compilación
- Mejor experiencia de desarrollo
Comenzando
Para comenzar a usar Sofya Transcription en su proyecto:
-
Instale el paquete:
npm install sofya.transcription
-
Importe los componentes necesarios:
import { SofyaTranscriber } from 'sofya.transcription'
-
Cree una instancia del transcriber y comience a transcribir:
const transcriber = new SofyaTranscriber({
apiKey: 'SU_CLAVE_API',
config: {
language: 'es-419'
}
})
Para información detallada sobre la API y sus características, consulte la documentación de la API.