
Whisper (OpenAI)
0 Preferiti
Whisper è un sistema di riconoscimento automatico della voce open-source addestrato su 680.000 ore di dati supervisionati multilingue e multitask raccolti dal web. È progettato per essere robusto agli accenti, al rumore di fondo e al linguaggio tecnico, e può trascrivere e tradurre la voce in più lingue in inglese. Si tratta di un approccio semplice end-to-end, implementato come un encoder-decoder Transformer. È in grado anche di eseguire l'identificazione della lingua e i timestamp a livello di frase. È progettato per essere facile da usare e avere un'alta precisione, consentendo agli sviluppatori di aggiungere interfacce vocali a più applicazioni.
Whisper è un sistema di riconoscimento automatico della voce open-source addestrato su 680.000 ore di dati supervisionati multilingue e multitask raccolti dal web. È progettato per essere robusto agli accenti, al rumore di fondo e al linguaggio tecnico, e può trascrivere e tradurre la voce in più lingue in inglese. Si tratta di un approccio semplice end-to-end, implementato come un encoder-decoder Transformer. È in grado anche di eseguire l'identificazione della lingua e i timestamp a livello di frase. È progettato per essere facile da usare e avere un'alta precisione, consentendo agli sviluppatori di aggiungere interfacce vocali a più applicazioni.
Modello di prezzo:
price unknown / product not launched yet
Top 5
Tools of the DAY