Introdução
Sofya Transcription é uma biblioteca JavaScript que fornece uma solução robusta e flexível para transcrição de áudio em tempo real. Ela foi projetada para transcrever fluxos de áudio e pode ser facilmente integrada em aplicações web. A biblioteca também inclui funcionalidade para captura de áudio a partir de elementos de mídia.
Requisitos
Requisitos do Navegador
Para usar o Sofya Transcription em uma aplicação web, certifique-se de que seu ambiente atenda a estes requisitos:
- Navegador Web Moderno: Chrome, Safari ou Edge com suporte a WebSocket
- Web Audio API: Necessário para processamento e streaming de áudio
- MediaStream API: Necessário para acesso ao microfone e captura de áudio
- Acesso ao Microfone: Os usuários devem conceder permissão para acessar seu microfone
- Suporte a WebSocket: Necessário para comunicação em tempo real com o serviço de transcrição
Atualmente, o Firefox tem um problema conhecido com a compatibilidade da taxa de amostragem de áudio ao usar a Web Audio API. Isso pode resultar no seguinte erro:
Error: DOMException: AudioContext.createMediaStreamSource: Connecting AudioNodes from AudioContexts with different sample-rate is currently not supported.
Estamos trabalhando ativamente em uma solução para este problema e o resolveremos em uma versão futura. Por enquanto, recomendamos o uso do Chrome, Safari ou Edge para a melhor experiência.
Requisitos de Desenvolvimento
Para fins de desenvolvimento e teste, você precisará de:
- Node.js: Versão 18.x ou superior
Funcionalidades
Transcrição em Tempo Real
O Sofya Transcription fornece transcrição rápida e precisa de fluxos de áudio em tempo real, garantindo que informações importantes sejam capturadas com eficiência e alta precisão.
Integração Flexível
Projetado para integração perfeita, o Sofya Transcription oferece uma abordagem flexível e modular que se adapta facilmente a vários fluxos de trabalho. Ele pode ser implementado sem interromper processos existentes, permitindo uma experiência suave ao adicionar funcionalidade de transcrição às suas aplicações web.
Múltiplos Modos de Conexão
O SDK suporta diferentes modos de conexão para acomodar vários cenários de implantação:
- Autenticação baseada em chave de API
- Conexões diretas com provedores (Sofya Compliance e Sofya as Service)
- Opções de configuração personalizáveis para cada tipo de conexão
Captura de Áudio de Elementos de Mídia
Capture e transcreva áudio de elementos de mídia como <video>
e <audio>
com facilidade. Esta funcionalidade permite a transcrição eficiente de conteúdo pré-gravado, facilitando a documentação e revisão de dados de áudio de fontes multimídia, melhorando a acessibilidade e usabilidade.
Sistema Abrangente de Eventos
O SDK fornece um sistema rico de eventos que permite:
- Monitorar o progresso da transcrição em tempo real
- Tratar erros graciosamente
- Responder a mudanças no estado da conexão
- Gerenciar eventos do ciclo de vida da transcrição
Desenvolvimento com Tipagem Segura
Construído com TypeScript, o SDK fornece:
- Definições de tipos completas para todos os componentes
- Suporte a IntelliSense em IDEs modernas
- Verificação de erros em tempo de compilação
- Melhor experiência de desenvolvimento
Começando
Para começar a usar o Sofya Transcription em seu projeto:
-
Instale o pacote:
npm install sofya.transcription
-
Importe os componentes necess ários:
import { SofyaTranscriber } from 'sofya.transcription'
-
Crie uma instância do transcriber e comece a transcrever:
const transcriber = new SofyaTranscriber({
apiKey: 'SUA_CHAVE_API',
config: {
language: 'pt-BR'
}
})
Para informações detalhadas sobre a API e suas funcionalidades, consulte a documentação da API.