Club

Big Data po bouřlivém roce 2019: Co bude dál?

Na hlavní události datového průmyslu konané v New Yorku - Strata Data Conference - tisíce vědců a analytiků dat hledali odpovědi na aktuální chaos v našem obchodním a technologickém ekosystému. Kterých pět zásadních bodů probírali a s jakým výsledkem?

 

Magazín

 

V roce 2019 jsme zaznamenali tektonické posuny v datovém a analytickém prostoru, poháněné zdánlivě nekonečnou vlnou akvizic, z nichž některé byly skutečně epické ve svém poměru. Salesforce získala Tableau za 15,7 miliardy dolarů a Google získal Looker za 2,6 miliardy dolarů. Společnost CommVault, která byla hodnocena spíše do budoucna, ale je neméně významná, koupila společnost Hedvig za 225 milionů dolarů, Cloudera koupila Arcadia Data, Logi Analytics koupila Zoomdata, Sisense koupila Periscope Data a Alteryx koupila ClearStory za 20 milionů USD. To je více než 18 miliard dolarů akvizic. A to uplynuly pouze tři čtvrtiny z tohoto roku.

Zároveň se tento rok prudký pokles Hadoopu ještě zvýšil, když v červnu poklesla cena akcií společnosti Cloudera a hodnota MapR klesla. Vzhledem k tomu, že v Hadoopu je zahrnuto tolik podnikových dat, jeho pokles vyvolává spoustu nejistoty. Vzhledem ke všem těmto otřesům ve světě dat se očekává, že celý letošek v oblasti Big Data se bude výrazně lišit od předchozích let. Zde je pět věcí, které byly nejvíce diskutované na zmiňované konferenci Strata.

 

1. Akvizice teprve začaly

Vlna akvizic 2019 je teprve začátek. To znamená, že se nedíváme na zásadní posun v prostředí business intelligence. Spíše vidíme přirozený vývoj, protože podniky se snaží maximalizovat své investice do business intelligence (BI) - získávají rychlejší, jednodušší a přesnější informace. BI se stěhuje z rukou vědců s údaji do rukou tvůrců rozhodnutí - což je přesně důvod, proč uvidíme větší konsolidaci na straně interpretace BI a méně na straně prezentace.

 

2. Sledujte AI

Je to otevřené tajemství v podnikatelské komunitě: pokud ve svém tagline nemáte „AI“, získáte méně finančních prostředků. Ale za tím je více než jen humbuk. Podniky postupují vpřed ve svém životním cyklu velkých dat. Fáze stanovení datové disciplíny - tj. dosažení schopnosti nevynechávat žádná data - je za námi. Nyní jsou společnosti ve stadiu hledání čitelných a přístupných poznatků ze svých dat. A jen takové aplikace na učení se stroji s umělou inteligencí umí takové masivní soubory dat zpracovat. A nemluvíme o doporučeních na sledování Netflixu poháněných umělou inteligencí na základě vaší minulé historie. Mluvíme o uvedení pružné AI do vaší firemní cesty tak, aby vážně ovlivnila příjmy a konkurenční výhodu.

 

 

3. Velká investice do aplikací pro cloud

Výkon zpracování tzv. on-prem, který by byl potřebný pro efektivní BI v reálném čase u rozsáhlých datových souborů, je neúměrně drahý. Technika on-prem byla vyvinuta pro dávkové zpracování, ale dnešní firmy nemohou čekat na úlohy, které zabírají desítky hodin nebo více. To je také důvod, proč dochází k migracím dat do cloudu. A nyní je na čase, aby společnosti sklízely plody tohoto kroku pomocí cloudových verzí aplikací, které provozují jejich podnikání. Nové projekty aplikací začínají cloudovými nativními verzemi. Přesto bylo 90% podnikových aplikací vytvořeno tak, aby fungovaly na serveru prem - a ty je třeba masivně přizpůsobit nebo úplně přestavět, aby fungovaly v cloudu.

 

4. Hadoop ještě není úplně mrtvý

Hadoop je open source distribuovaný procesní rámec, který řídí zpracování a ukládání dat pro velké datové aplikace v škálovatelných klastrech počítačových serverů. Pracuje v centru ekosystému velkých datových technologií, které se primárně používají k podpoře pokročilých analytických iniciativ, včetně prediktivní analýzy, těžby dat a strojového učení. Systémy Hadoop dokážou zpracovat různé formy strukturovaných a nestrukturovaných dat, což uživatelům poskytuje větší flexibilitu při shromažďování, zpracování a analýze dat, než poskytují relační databáze a datové sklady.

Volný pád Hadoopu letos - zejména s ohledem na pokles cen akcií společnosti Cloudera a prudký pokles hodnoty MapR - svědčí o technice z jiné éry. Dnes se svět přesunul z úložiště on-prem a miliard dávkových dotazů k analytice v reálném čase přes rozsáhlé datové sady založené na cloudu. Přesto přes tento humbuk, Hadoop ještě není úplně mrtvý. Avšak již nyní jsou slyšet takové hlasy jako: „Jaké jsou možnosti mimo Hadoop?“ a „Co mám dělat po Hadoop? “

 

5. Zabezpečení a soukromí

Ve vnějším světě neexistuje téměř žádná diskuse o datech, která se nedotýkají soukromí a bezpečnosti. V rozkvětu Hadoopu proběhly nekonečné diskuse o zmatku, datových liniích a dalších bezpečnostních aspektech. Dnes je z důvodu přechodu do cloudu v datové a analytické komunitě vnímána bezpečnost dat jako starost pro velké technologické a infrastrukturní společnosti - nikoli o přímou odpovědnost komunity.

 

Sečteno a podtrženo

Kdykoli se setkají tisíce vědců a obchodních analytiků, věci se nevyhnutelně stávají zajímavými. Letos ale hovoříme o ekvivalentu konference stavitelů lodí po potopení Titanicu. Zánik Hadoopu a rychle se rozvíjející krajina business intelligence byly na letošní Strata Data Conference zajímavými tématy.

 

 

Připravil: Radek Svoboda