CoolClub pro IT odborníky

Nejlepší české univerzitní start-upy 8: Strojové rozpoznávání řeči od VUT

26.05.2022

Pokud existuje technologie, která má pro svět obrovský potenciál, je to strojové rozpoznávání řeči. Lidskou řeč se dnes snaží naučit každé chytré zařízení, a to včetně ledničky, aut nebo robotů na telefonních linkách. Na tom, aby měla tato technologie ještě lepší využití, už usilovně pracuje také vědecký tým z VUT. 

 

Magazín

 

Strojové rozpoznávání řeči mají v malíčku giganti, jako je Google nebo Facebook. Určitě jste ale netušili, že mezi špičku v oboru se řadí také skupina BUT Speech@FIT. Tu založil docent Jan Černocký, vedoucí Ústavu počítačové grafiky a multimédií na Fakultě informačních technologií VUT.

Skupina je známá hlavně pro svůj fonémový rozpoznávač PHREC, který si vydobyl mezinárodní renomé. 

 

Revoluční využití strojového rozpoznávání řeči

Strojové rozpoznávání řeči má široké možnosti uplatnění. V současné době vědci z VUT trénují počítače, aby dokázaly identifikovat hlasy z vojenských vysílaček. Těžit z toho budou rovněž policisté, kteří by díky analýze odposlechů mohli říct, s kým mají po telefonu tu čest. Do třetice všeho dobrého za zmínku stojí i využití technologie v bankovnictví. 

„Banky pak začínají využívat ověření hlasu při přístupu na klientský účet a úvěrovým společnostem se zase líbí, že díky strojovému rozpoznávání řeči chytnou toho, kdo žádá o půjčku třeba podesáté a vždy pod jinou identitou,“ doplňuje Černocký v rozhovoru pro časopis Forbes.

 

 

Strojové rozpoznávání řeči versus koronavirus

Věděli jste, že strojové rozpoznávání řeči může přijít vhod také v boji s koronavirem? Vědci z VUT se pomocí této techniky snaží získat z audiozáznamů informace o zdravotním stavu pacientů. Před pandemií se zaměřovali hlavně na diagnostikování nemocí, jako je kašel, plicní choroby či astma, nicméně situace je povolala k palčivější otázce – diagnostikování koronaviru.

„Zatím ale stále nejsme s výzkumem a rozvojem u konce. Velkým tématem této doby je také trénování modelů strojového učení jen na malém množství dat. Přeci jen získat data z audiozáznamů je dost náročné i finančně nákladné, proto se teď výzkumné týmy z celého světa snaží naučit stoje, jak se mají učit jen z malých databází, které lze jednoduše stáhnout z YouTube či internetu obecně," vysvětluje Černocký.

Aby toho nebylo málo, během svého výzkumu se setkávají s celou řadou komplikací. Tvrdým oříškem je například identifikace zvuku ve zhoršených podmínkách, jako je ozvěna nebo šum v prostoru plném lidí. Skupina BUT Speech@FIT je však na dobré cestě a v budoucnu od ní můžeme očekávat velké věci.

 

Tip! Nejlepší české univerzitní start-upy 6: Nanoorgány od Technické univerzity v Liberci

 

 

Připravila: Petra Pruden