CoolClub pro IT odborníky

Výkon cloudového úložiště: Rozdíl mezi dostupností a trvanlivostí

13.07.2020

Když otočíte klíčem v zapalování automobilu, zapojíte spotřebič do zásuvky nebo poklepete na dokument uložený na pevném disku, víte, co se bude dít dál. Tyto věci prostě fungují. Ale v cloudu jsou vaše cenné soubory v rukou někoho jiného. Jste si jisti, že se můžete vždy spolehnout na výsledky?

 

Magazín

 

 

Než odevzdáte data do svého úložiště objektů, měli by vaši potenciální poskytovatelé cloudového úložiště odpovědět na několik otázek. Můžete si být jisti, že IT společnost, na které závisí vaše podnikání, je dobře chráněna? A jaké jsou šance, že vaše data budou nečekaně nedostupná?

 

Trvanlivost

Pevné disky odcházejí a v datovém centru s pevnými disky odumírají často. Podle posledních publikovaných statistik pevného disku poskytovatele úložiště Backblaze 474 z 108 461 disků selhalo ve druhém čtvrtletí roku 2019 - roční míra selhání 1,8%. Žádné z těchto selhání však nezasáhlo zákazníky, protože životnost nebo zdraví vašich dat je pro společnosti jako Backblaze, Microsoft, Amazon a Google nanejvýš důležité. Přijímají extrémní opatření, aby se zabránilo ztrátě nebo poškození hostovaných souborů.

Každý hlavní poskytovatel cloudových služeb používá technologii pro opravu chyb nazvanou výmaz kódování (erasure coding), která vezme soubor a rozdělí jej na mnoho kusů. Poté vypočítá další paritní kousky použité k rekonstrukci souborů v případě ztráty některého z originálů. Podle Ahina Thomase, viceprezidenta marketingu v Backblaze, Java knihovna společnosti Reed-Solomon rozděluje každý soubor na 17 úlomků, poté vypočítá tři další kusy, aby byla udržena parita. Tyto úlomky pak distribuují do 20 různých zdrojů.

 

 

Jak Thomas sdělil, v každém okamžiku by bylo možné mohli ztratit tři pevné disky a všechno by bylo stále v pořádku. Pak je otázkou, můžete vyměnit a přestavět tři ztracené jednotky, než ztratíte čtvrtou? Facebook také používá mazání kódování Reed-Solomon napříč svými chladicími boxy, zatímco Microsoft Azure Storage má své vlastní kódy místní obnovy, které údajně snižují počet vymazaných kódovacích fragmentů potřebných k rekonstrukci.

Vyzbrojeni statistikami poruchovosti pevného disku, důvěrnými znalostmi architektury výmazů kódování daného poskytovatele cloudu a obecnou představou o tom, jak dlouho trvá opětovné sestavení po selhání, můžeme vypočítat trvanlivost dat pomocí nějaké složité matematiky. Cloudové služby (jiné než Backblaze) tyto informace obecně nesdílejí, takže se musíme spoléhat na jejich nároky na trvanlivost, které se projevují v procentech. Není neobvyklé vidět trvanlivost specifikovanou z hlediska sestav specifickým číslem 9-16 v případě geofundančního plánu Azure Storage společnosti Microsoft. Číslo 11-9, které vidíme, běžně znamená životnost 99,999999999%.

 

Ztráta dat spíše nehrozí

Pravděpodobnost, že jakákoli cloudová služba ztratí vaše data, je velmi nízká. Je například mnohem pravděpodobnější, že došlo k potížím s vaší kreditní kartou a že nekontrolujete svůj e-mail a nedostáváte oznámení o vašem účtu. Ve skutečnosti existuje větší šance, že Země bude zasažena nebezpečným asteroidem v příštím století než náhodná ztráta dat od hlavního poskytovatele cloudu. Jde o to, že poskytovatelé vědí, že jejich hardware nakonec selže, a navrhují vše s ohledem na selhání. U každého vážného dodavatele cloudového úložiště je trvanlivost vašich dat zaručena. 

Upozorňujeme však, že výpočty trvanlivosti neberou v úvahu lidský faktor. Zavedení chyby přes chybnou řadu kódu by mohlo celý systém vymazat. Ozbrojený konflikt může vést ke ztrátě datového centra. Nebo by řada přírodních katastrof mohla teoreticky ovlivnit více umístění datových center, která udržují vaše soubory geograficky distribuované. To vše jsou faktory mimo rozsah výpočtu trvanlivosti, proto o nich musí přemýšlet spíše IT manažeři. Bez ohledu na specifikace trvanlivosti, které jsou citovány, je nejlepší praxe udržovat tři kopie důležitých dat. Zatímco většina organizací tento ideál nedosahuje, manažeři společností i domácí uživatelé by měli zvážit všechny proměnné ovlivňující trvanlivost.

 

Budou dostupné vaše soubory, když je budete potřebovat?

Uklidníte se s vědomím, že vaše data jsou v cloudu bezpečně uložená. Máte však stejnou jistotu, že k němu budete mít přístup kdykoli budete potřebovat? Úplná jistota zde není, i když moderní datová centra se mohou přiblížit všudypřítomným provozuschopnostem. Dostupnost kvantifikuje dobu, po kterou jsou vaše data přístupná. Nezohledňuje žádné další proměnné ovlivňující vaše připojení k poskytovateli cloudového úložiště, například problémy s poskytovatelem služeb Internetu, selhání síťového hardwaru nebo výpadky napájení. A přesto je to stále mnohem nižší procento než specifikace trvanlivosti. Záruky dostupnosti ve výši 99%, 99,9% nebo 99,99% jsou běžné, což zahrnuje i občasnou údržbu datového centra.

Požadovaná úroveň dostupnosti závisí na tom, co děláte s vašimi údaji a kolik jste ochotni zaplatit. Na 99% byste akceptovali až 3,65 dní prostojů za rok. Zaneprázdněné weby elektronického obchodování nebudou tolerovat tyto ztracené prodeje. Přidáním devíti (99,9%) se dostanete na 8,75 hodin nedostupnosti za rok, zatímco 99,99% omezuje prostoje na přibližně 53 minut ve stejném intervalu.

 

 

Když poskytovatel nesplní závazek

Poskytovatelé cloudových služeb publikují a zaručují dostupnost ve svých dohodách o úrovni služeb (SLA). Pokud prodejce tento závazek nesplní, může vrátit určité procento svých poplatků ve formě kreditů za služby vztahujících se k vyúčtování za příští měsíc. Obvykle jsou odstupňovány, aby se staly agresivnějšími jako servisní doklady. Například třída úložiště objektů Amazonu S3 Standard, navržená pro dostupnost 99,99%, poskytuje 10% procent kreditu za služby, pokud vaše měsíční provozuschopnost klesne mezi 99,9% a 99,0%. To se zvýší na 25%, pokud zaznamenáte méně než 99,0% dostupnosti, ale více než 95,0% dostupnosti v daném měsíci. A získáte až na 100% kredit, pokud služba klesne pod 95%. Samozřejmě, že vás ale nezajímají kredity. Chcete poskytovatele, který vyhovuje dostupnosti stanovené v jeho SLA. Dohoda jednoduše vyjadřuje důvěru dodavatele v jeho schopnost dodávat.

 

Musíte mít všechno nebo nic?

Není vždy nutné nakupovat za nejlepší možnou dostupnost nebo odolnost proti selhání. Cloudové úložiště se vyvinulo do bodu, kdy můžete určit třídy úložiště, určit měsíční dostupnost za běhu nebo prodloužit trvanlivost pro nekritická data. Google Cloud Storage lze rozdělit do tříd Standard, Nearline a Coldline Storage. Standard je navržen pro často přístupná (nebo „horká“) data uložená na krátkou dobu. Společnost vám umožňuje podrobněji rozeznat a definovat jeden region, duální region nebo více regionů a doladit tak výkon a geoprostor.

Samozřejmě by nemělo být žádným překvapením, že ukládání dat na samostatných místech dává Googlu flexibilitu při zvyšování SLA z 99,0% na 99,95% dostupnosti, přičemž typická měsíční dostupnost je vyšší než 99,99%. Úložiště Nearline je lepší pro data, která plánujete číst nebo upravovat jednou za měsíc nebo méně, například pro zálohování, archivaci a multimediální. Naproti tomu uložiště Coldline stojí mnohem méně, ale nabízí o něco nižší dostupnost, podléhá minimální délce úložiště 90 dní a způsobuje větší náklady na přístup k datům.

 

Zaměřeno na poskytovatele

Služba Amazon Simple Storage Service (S3) má vlastní řadu tříd úložiště, které vyhovují různým případům použití. Na jednom konci spektra nabízí S3 Standard vysokou odolnost, dostupnost a výkon pro často přístupná data. Na druhé straně S3 One Zone-Infrequent Access (IA) vynechává geografickou redundanci a nabízí významnou slevu na poplatcích za ukládání, ale má zase vyšší ceny za vyhledávání dat. 

Amazon, Google a Microsoft nabízejí dostatečnou flexibilitu pro konfiguraci řešení zakázkových cloudových řešení, která mohou být dobrá i náročná. Při vytváření služby založené na úložišti, požadavcích, správě, přenosech, zrychlení a replikaci napříč regiony je snadné se ztratit při analýze jejich stejně sofistikovaných cenových tabulek. Poskytovatel, jako je Backblaze, je jednodušší a cenově dostupnější než kterýkoli z velkých tří, pokud hledáte čistě cloudové úložiště s 99,9% dostupností.

Díky důkladnému pochopení koncepcí trvanlivosti a dostupnosti je snazší věřit službám, které nabízejí poskytovatelé cloudových úložišť. Úspora nákladů na vybavení, údržbu, napájení a personální náklady spojené s úložištěm v areálu může být klíčem k úspoře peněz vaší organizace při ochraně nejcennějších souborů.

 

 

 

Připravil: Radek Svoboda