Co je Enterprise Data Lake?
4 minut čtení

Co je Enterprise Data Lake?

Vzestup multicloudových architektur založených na datech a široké portfolio pokročilých datově řízených aplikací, které se díky tomu objevily, spoléhají na datová jezera, která ukládají všechna data. Datové jezero je open source a průmyslové standardní úložiště pro ukládání velkého množství dat. Následně an podnikové datové jezero nejen ukládají data, ale také poskytují podnikové služby pro shromažďování, zkoumání, správu, řízení, přípravu a vytváření kanálů pro podniková data.

Podniková datová jezera buď ukládají data „tak jak jsou“ v době příjmu, aby se předešlo časově náročným a drahým procesům ETL, nebo poskytují služby přípravy dat. Tyto služby profilují, čistí, obohacují, transformují, modelují a vytvářejí datové kanály pro splnění specifických požadavků aplikací. Cílem je umožnit aplikace založené na datech v reálném čase. Příprava dat zlepšuje kvalitu dat a umožňuje pokročilé analytické a business intelligence aplikace.

Datové kanály pro podnik založený na datech

Aplikace založené na datech využívají rozsáhlé a komplexní sítě dat a služeb. Podniková datová jezera poskytují připojení nezbytná k přesunu dat z jakéhokoli zdroje do libovolného cílového umístění. Protože zpracovávají velmi velké objemy dat a horizontálně se škálují komoditní cloudová infrastrukturaPodniková datová jezera jsou ideální platformou pro migraci cloudových dat, podnikovou archivaci a úložiště provozních dat (ODS). Navíc mají schopnost budovat potrubí mezi produkčními systémy a navazujícími analytiky, datovým skladem SQL, aplikacemi umělé inteligence (AI) a strojového učení (ML).

Co je Enterprise Data Lake? Datové jezero SOLIXCloud

Datové kanály jsou série datových toků. Výstup jednoho prvku je vstupem dalšího prvku a tak dále. Podniková datová jezera slouží jako sběrné a přístupové body v datovém potrubí a jsou zodpovědná za řízení přístupu. Jak se v podniku objevují datové kanály, podniková datová jezera stát se centry distribuce dat s centralizovaným ovládáním pro federaci dat napříč sítěmi datových jezer. Datová federace centralizuje správu metadat, správu dat a kontrolu dodržování předpisů a zároveň umožňuje decentralizované operace s datovým jezerem.

Správa dat v tak velkém měřítku samozřejmě znamená, že kontroly správy dat jsou zásadní. Podnikové datové jezero řídí data pomocí zásad správy životního cyklu informací (ILM). Ty zavádějí systém kontrol a obchodních pravidel, včetně zásad uchovávání dat a právních blokování. Zabezpečení a kontroly ochrany osobních údajů spotřebitelů, jako jsou NIST 800-53, PCI, HIPAA a GDPR, nejsou nezbytné pouze pro dodržování právních předpisů, ale správná implementace také zlepšuje kvalitu dat.

Centralizovaná správa metadat

Podniková datová jezera potřebují správa metadat k zobrazení celého datového prostředí (včetně strukturovaných, polostrukturovaných a nestrukturovaných dat) a pomáhá uživatelům lépe porozumět jejich datům. Analytici data klasifikují, profilují a vytvářejí konzistentní popisy a obchodní kontext. Centralizovaná správa metadat umožňuje uživatelům prozkoumat své datové prostředí třemi způsoby:

  • Data lineage pomáhá uživatelům porozumět životnímu cyklu dat, včetně historie pohybu a transformace dat. To zjednodušuje analýzu hlavních příčin sledováním chyb v datech a zvyšuje spolehlivost zpracování následnými systémy.
  • Katalog dat je pohled portfolia na inventář dat a datových aktiv. Jinými slovy, uživatelé procházejí data, která potřebují, a jsou schopni vyhodnocovat data pro zamýšlené použití.
  • Obchodní glosář je seznam obchodních pojmů s jejich definicemi. Programy správy dat vyžadují, aby obchodní koncepty pro organizaci byly definovány a používány konzistentně.

Středobodem cloudových programů pro správu dat

Digitální transformace vyžaduje interoperabilitu s cloudem a jeho rozsáhlou sítí datových a webových služeb. Data lakes jsou otevřený zdroj, průmyslový standardní přístup k bezpečnému a bezpečnému shromažďování a ukládání velkého množství dat. Enterprise Data Lake navíc poskytuje služby na podnikové úrovni pro zkoumání, správu, řízení, přípravu a poskytování řízení přístupu. Manažeři, kteří hledají tyto výhody založené na datech, proto nasazují podniková datová jezera ke zlepšení zapojení zákazníků nebo poskytují vylepšené analýzy založené na úplnějších datech řízených událostmi.

Na závěr lze říci, že architektury založené na datech vyžadují levné a efektivní ukládání objektů, přístup v reálném čase, správu dat, správu metadat, přípravu dat a konektivitu pro vybudování koncových datových kanálů. s podnikové datové jezero, každá organizace je schopna velmi rychle implementovat tyto kritické schopnosti, dosáhnout digitální transformace a stát se podnikem řízeným daty.