Pular para o conteúdo principal

Introdução

Sofya Transcription é uma biblioteca JavaScript que fornece uma solução robusta e flexível para transcrição de áudio em tempo real. Ela foi projetada para transcrever fluxos de áudio e pode ser facilmente integrada em aplicações web. A biblioteca também inclui funcionalidade para captura de áudio a partir de elementos de mídia.

Requisitos

Requisitos do Navegador

Para usar o Sofya Transcription em uma aplicação web, certifique-se de que seu ambiente atenda a estes requisitos:

  • Navegador Web Moderno: Chrome, Safari ou Edge com suporte a WebSocket
  • Web Audio API: Necessário para processamento e streaming de áudio
  • MediaStream API: Necessário para acesso ao microfone e captura de áudio
  • Acesso ao Microfone: Os usuários devem conceder permissão para acessar seu microfone
  • Suporte a WebSocket: Necessário para comunicação em tempo real com o serviço de transcrição
Compatibilidade com Firefox

Atualmente, o Firefox tem um problema conhecido com a compatibilidade da taxa de amostragem de áudio ao usar a Web Audio API. Isso pode resultar no seguinte erro:

Error: DOMException: AudioContext.createMediaStreamSource: Connecting AudioNodes from AudioContexts with different sample-rate is currently not supported.

Estamos trabalhando ativamente em uma solução para este problema e o resolveremos em uma versão futura. Por enquanto, recomendamos o uso do Chrome, Safari ou Edge para a melhor experiência.

Requisitos de Desenvolvimento

Para fins de desenvolvimento e teste, você precisará de:

  • Node.js: Versão 18.x ou superior

Funcionalidades

Transcrição em Tempo Real

O Sofya Transcription fornece transcrição rápida e precisa de fluxos de áudio em tempo real, garantindo que informações importantes sejam capturadas com eficiência e alta precisão.

Integração Flexível

Projetado para integração perfeita, o Sofya Transcription oferece uma abordagem flexível e modular que se adapta facilmente a vários fluxos de trabalho. Ele pode ser implementado sem interromper processos existentes, permitindo uma experiência suave ao adicionar funcionalidade de transcrição às suas aplicações web.

Múltiplos Modos de Conexão

O SDK suporta diferentes modos de conexão para acomodar vários cenários de implantação:

  • Autenticação baseada em chave de API
  • Conexões diretas com provedores (Sofya Compliance e Sofya as Service)
  • Opções de configuração personalizáveis para cada tipo de conexão

Captura de Áudio de Elementos de Mídia

Capture e transcreva áudio de elementos de mídia como <video> e <audio> com facilidade. Esta funcionalidade permite a transcrição eficiente de conteúdo pré-gravado, facilitando a documentação e revisão de dados de áudio de fontes multimídia, melhorando a acessibilidade e usabilidade.

Sistema Abrangente de Eventos

O SDK fornece um sistema rico de eventos que permite:

  • Monitorar o progresso da transcrição em tempo real
  • Tratar erros graciosamente
  • Responder a mudanças no estado da conexão
  • Gerenciar eventos do ciclo de vida da transcrição

Desenvolvimento com Tipagem Segura

Construído com TypeScript, o SDK fornece:

  • Definições de tipos completas para todos os componentes
  • Suporte a IntelliSense em IDEs modernas
  • Verificação de erros em tempo de compilação
  • Melhor experiência de desenvolvimento

Começando

Para começar a usar o Sofya Transcription em seu projeto:

  1. Instale o pacote:

    npm install sofya.transcription
  2. Importe os componentes necessários:

    import { SofyaTranscriber } from 'sofya.transcription'
  3. Crie uma instância do transcriber e comece a transcrever:

    const transcriber = new SofyaTranscriber({
    apiKey: 'SUA_CHAVE_API',
    config: {
    language: 'pt-BR'
    }
    })

Para informações detalhadas sobre a API e suas funcionalidades, consulte a documentação da API.