Umělá inteligence zamířila i do Spotify. Díky nové funkci od OpenAI nyní Spotify nabízí překlady podcastů do více jazyků. AI napodobí i tón a barvu hlasu autora.
Novinky
Umělá inteligence dokáže překládat a generovat text z audio nahrávky, a dokonce syntetizovat zvuk. Díky nové funkci nyní Spotify nabízí překlady podcastů do více jazyků.
Společnost se rozhodla využít nové funkce Voice Translation, založené na technologii od OpenAI.
Funkce nejprve využije model Whisper od OpenAI k přepsání podcastu do textu. Tento text je pak pomocí strojového překladu přeložen do požadovaného jazyka. A na závěr je znovu namluven generativním AI modelem.
AI přitom napodobí i tón a barvu hlasu autora. Dočkáme se tak konkrétních podcastů v různých jazycích.
Právě poslední fáze je z celého procesu ta nejzajímavější. Spotify tvrdí, že syntetizují takový hlas, který bude od původní verze de facto nerozeznatelný. Vznikne tak klon původního podcastu, pouze v jiném jazyce.
Zatím jsou k dispozici generované nahrávky u vybraných dílů anglických podcastů, které jsou přeložené do španělštiny. Hlas autora v nich zní skutečně velmi přirozeně a téměř nerozeznatelně od toho původního.
V plánu jsou nyní překlady do francouzštiny a němčiny s tím, že se uvidí, jak se nástroj osvědčí.
Připravila: Petra Sauerová