CoolClub pro IT odborníky

Dostupnost e-obsahu pro nevidomé? AI to zařídí!

27.07.2020

Technologické firmy stále více využívají nástrojů umělé inteligence. Při vytváření přístupných produktů podporujících začlenění zrakově hendikepovaných s cílem pomáhat jim při práci, životě a sociálních spojeních, se dnes již celá řada společností velmi snaží. A nejde jen např. o popisky na sociálních sítích. AI s rozpoznáváním textu na řeč a rozpoznávání objektů již zlepšuje život milionů uživatel internetu. A v nepříliš vzdálené budoucnosti budou mít i díky autonomním vozům zrakově postižení svobodu cestovat bez pomoci pečovatele, přítele nebo člena rodiny.

 

Magazín

 

 

Instagram minulý rok oznámil, že přidává dvě nové funkce pro službu sdílení fotografií a videa pro zrakově postižené. Prvním z nich je automatický alternativní text, který poskytne zvukové popisy fotografií, na které uživatelé narazí ve zdroji, vyhledávání a profilu. Popis bude založen na seznamu položek, které se objeví na fotografii, generované technologií rozpoznávání objektů Instagramu. Uživatelé si také mohou vytvořit vlastní textové popisy svých fotografií, které si uživatelé přečtou, když se posouvají obsahem nebo kliknou na fotografii.

Jiné weby sociálních médií, včetně Facebooku a Twitteru, mají již několik let k dispozici alternativní textové popisy pro zrakově postižené uživatele. Je však pozoruhodné, že Instagram tyto nástroje přidává, protože jeho služba je zcela závislá na vizuálních obrázcích - takže to může aplikaci otevřít uživatelům, kteří se do Instagramu dosud nezaregistrovali, protože si mysleli, že by pro ně nebylo možné použít plně obrazovou službu.

 

Tech-firmy se musí snažit

Technologické firmy stále více získávají pomoc od AI při vytváření přístupných produktů podporujících začlenění. Minulý rok společnost Microsoft vyčlenila 25 milionů dolarů na svůj program AI pro usnadnění přístupu s cílem pomáhat lidem se zdravotním postižením při práci, životě a lidských spojeních, a Facebook nedávno uvedl, že shromažďuje data od zdravotně postižených uživatelů. Společnost Microsoft představila adaptér Xbox Adaptive Controller, herní ovladač navržený tak, aby vyhovoval celé řadě zvláštních potřeb.

To je jen špička ledovce. AI s rozpoznáváním textu na řeč a rozpoznávání objektů již zlepšuje životy více než zhruba 40 milionů lidí v USA s problémy se zrakem a řečí. A v nepříliš vzdálené budoucnosti budou mít i díky autonmním vozům zrakově postižení svobodu cestovat bez pomoci pečovatele, přítele nebo člena rodiny.

 

 

Navíc, inteligentní domácí reproduktory, jako je Google Home, řada Echo od Amazonu a Apple HomePod, daly digitálním hlasovým asistentům nový způsob používání, což je pro lidi s určitým postižením jako dar z nebes. Ve spojení s inteligentními domácími spotřebiči se inteligentní domácí reproduktory stanou ještě výkonnějšími. Lidé se ztrátou zraku a fyzickým onemocněním mohou zapínat světla a nastavovat teplotu hlasovým příkazem, aniž by museli hledat nástěnné spínače.

Divize DeepMind společnosti Google mezitím používá AI ke generování skrytých titulků pro neslyšící uživatele. Ve společné studii s vědci z Oxfordské univerzity v roce 2016 sledoval algoritmus DeepMind více než 5 000 hodin televize a analyzoval 17 500 jedinečných slov. Výsledný model výrazně překonal profesionální retenční čtečku a úspěšně přeložil 46,8 procent slov bez chyby do 200 náhodně vybraných klipů ve srovnání s 12,4 procenty slov profesionála.

 

Automatické rozpoznávání obrazu

Programy čtení obrazovky pomáhají nevidomým a zrakově postiženým lidem procházet webové stránky, ale většina webových stránek obsahuje obrázky a ne každý obrázek má vhodný název nebo alternativní text. Jedním z řešení je umělá inteligence, která dokáže fotografie automaticky třídit. Facebook vyvinul nástroje pro titulky, který popisují fotografie uživatelům se zrakovým postižením, a Google Cloud Vision API dokáže porozumět kontextu objektů na fotografiích. Mohlo by to například označit obrázek „dýně“, „vyřezávání“, „Halloween“ a „svátek“.

Další výkonná platforma počítačového vidění, Microsoft Seeing API, umí číst ručně psaný text, popisovat barvy a scény a další. V nezapomenutelném demu na hlavní přednášce Microsoft Build 2016, Saqib Shaikh, technologický vedoucí divize AI společnosti Microsoft a výzkumné divize, použil pár chytrých brýlí s AI k rozpoznání tváří a emocí kolegů.

 

Abstraktní shrnutí

Lidé s kognitivními poruchami, jako jsou poruchy pozornosti a dovednosti s nízkou gramotností, mají také prospěch z umělé inteligence. V roce 2016 tým Google Brain zveřejnil model pro TensorFlow, framework pro výuku otevřených zdrojů od společnosti Google, který dokáže generovat shrnutí novinových článků do jednoho řádku. A právě v loňském roce vědci na Salesforce vyvinuli algoritmus strojového učení, který dokáže sesumírovat článek, e-mail nebo zdlouhavý dokument do jediného stručného odstavce.

 

Dlouhá cesta

I přes povzbudivé náznaky pokroku v dostupnosti umělé inteligence je zde však stále ještě dlouhá cesta. "Vývojáři opravdu musí zvážit dostupnost," řekl Jennison Asuncion, vedoucí inženýrství přístupu na LinkedIn. "Potřebujeme více nástrojů, které pomohou automatizovat dostupnost. Lidé se zdravotním postižením se chtějí bavit a dělat věci, které mohou dělat všichni ostatní," řekl Asuncion.

 

 

Připravil: Radek Svoboda