CoolClub pro IT odborníky

Nejlepší české univerzitní start-upy 4: Neuronový překladač od UK

18.03.2022

Kdo z vás rád používá Google překladač? Není sice perfektní, ale na přeložení a základní porozumění vystačí. Co kdyby ale existoval ještě sofistikovanější a propracovanější nástroj? Na správné cestě jsou absolventi Matfyzu se svým CUBBITTem. Některé texty přeloží lépe než profesionál.

 

Magazín

 

Umělá inteligence má čím dál širší uplatnění ve všech sférách – výjimkou nejsou ani strojové překlady z jednoho jazyka do druhého. I ten má ale stále své mouchy, proto mnoho z nás raději sáhne po službách profesionálních překladatelů.

Na obzoru se ale vynořuje nová konkurence – je to automatický překladač CUBBITT, jenž mají na svědomí absolventi MFF UK a tým Google Brain. Jedná se o překladač, který funguje na bázi neuronové sítě a umí neuvěřitelných 58 milionů párů vět v anglickém a českém jazyce. 

 


Méně plynulý, ale přesnější než překladatelé

Vědci se rozhodli podrobit svůj výtvor zkoušce a dali mu za úkol přeložit vzorek anglických novinových textů. Aby měl překladač zdatnou konkurenci, do experimentu zapojili také profesionální překladatele. Výsledek překladů pak porovnávalo 15 Čechů, kteří posuzovali přesnost a plynulost překladu – neměli však tušení, kdo co překládal. A jak to dopadlo? Lépe než byste očekávali.

„Výsledek srovnání můžeme považovat za průlomový. Automatický překladač sice nepatrně pokulhával za lidskými překladateli v hodnocení plynulosti, byl ale v průměru o něco přesnější, pokud jde o obsahovou správnost překladu. Naměřený výsledek byl statisticky signifikantní“, komentuje hlavní autor studie Mgr. Martin Popel, Ph.D. z MFF UK. 

 

Hlavní autor studie Martin Popel

 

V čem tkví úspěch překladače?

Ptáte se, jak to, že je překladač tak dobrý? Odpověď vám prozradí opět Martin Popel: „Již v roce 2016 se ve strojovém překladu používala technika takzvaného back translation, kdy se neuronová síť trénuje na dvou zdrojích dat – autentických (anglických větách přeložených lidmi do češtiny) a syntetických (českých větách strojově přeložených do angličtiny). My jsme ale stávající postup vylepšili tím, že jsme se zaměřili na to, jak se tyto dva zdroje dat míchají dohromady. Do té doby se neuronová síť překladačů trénovala na obou typech dat najednou. My jsme náš překladač trénovali na autentických a syntetických datech zvlášť, čímž jsme dosáhli celkově lepších výsledků.“

 

 

Stane se CUBBITT novým Google překladačem?

V rozhovoru pro ScienceMag Popel odpovídá, že kvalitu Google Translate se týmu z Matfyzu podařilo překonat již v roce 2013 se svým předchozím modelem. Aby ale CUBBIT překonal práci lidských překladatelů, potrvá ještě mnoho let. 

Toužíte si překladač vyzkoušet na vlastní pěst? Zkusit to můžete přímo tady. Nejvydařenější jsou podle Martina Popela překlady z češtiny do angličtiny či francouzštiny a zpět. Překlady v dalších jazycích prý ještě trošku pokulhávají. 

 

Tip! Nejlepší české univerzitní start-upy 2: Létající dozimetr od ČVUT

 

 

Připravila: Petra Pruden

Foto: René Volfík, UK Forum; Shutterstock