Whisper Large V3

Ljud

Whisper Large V3 är OpenAI:s mest avancerade modell för automatisk taligenkänning (ASR) som stöder över 100 språk inklusive svenska. Modellen kan transkribera tal till text, översätta tal mellan språk och identifiera talat språk automatiskt. Med 1,5 miljarder parametrar levererar Whisper V3 markant bättre noggrannhet än tidigare versioner, särskilt för icke-engelska språk. Modellen är öppen källkod under MIT-licens och kan köras lokalt, vilket gör den idealisk för integritetskänsliga applikationer.

Modalitet:LjudLicens:Open Source

Specifikationer

Parametrar1.5B

ModalitetLjud

LicensOpen Source

Utgivning2023-11-06

API

Whisper Large V3

Specifikationer

Relaterade entiteter

Utvecklad av