Perché l'archiviazione aziendale a livelli è l'applicazione vincente per Hadoop
3 minuti di lettura

Perché l'archiviazione aziendale a livelli è l'applicazione vincente per Hadoop

La ricerca suggerisce che il 70% delle distribuzioni Hadoop fallirà quest'anno. Questa strategia infallibile ti aiuterà a gestire i tuoi dati e a battere le probabilità.

A un recente rapporto di Gartner stima che il 70% delle implementazioni Hadoop nel 2018 non riuscirà a soddisfare gli obiettivi chiave, citando competenze e sfide di integrazione. Apparentemente, molte organizzazioni stanno intraprendendo progetti Hadoop ma non riescono a portarli in piena produzione, perché non hanno una roadmap chiara o le competenze necessarie per completarli, diventando alla fine progetti personali.

Distribuzioni Hadoop nel 2018

Ciò mi ha fatto riflettere su una cosa: le organizzazioni detengono molti dati, l'80% dei quali è inattivo (un'altra statistica di Gartner). Quale può essere una migliore applicazione killer dell'archiviazione/ritiro di questi dati in un repository di big data? Poiché i repository di big data possono essere creati tramite storage di base, elaborazione e software open source, generano un ROI immediato, il che li rende una vendita rapida per l'alta dirigenza e facili da implementare.

L'archiviazione aziendale è una best practice di gestione del ciclo di vita delle informazioni e una strategia di inserimento dati per distribuire i dati in livelli accessibili, in base all'importanza, all'età o ai requisiti di conformità dei dati, una capacità resa possibile dal potente file system HDFS di Hadoop. Sebbene i dati e le esigenze di ogni organizzazione siano diversi, un buon punto di partenza per un sistema di archiviazione aziendale è basarlo sui seguenti livelli, idealmente distribuiti su infrastrutture di elaborazione ibride e multi-cloud:

– Livello Data Lake: per dati attivi a cui è necessario accedere frequentemente.

– Livello di archivio: per i dati che devono essere completamente separati dall'ambiente di produzione, utile per progetti di analisi di big data e data science.

Le migliori pratiche di gestione del ciclo di vita delle informazioni

Progettato per hardware di base a basso costo

Poiché Hadoop è stato creato pensando all'hardware di base, distribuire l'archiviazione aziendale su servizi cloud come S3 lo rende un modo estremamente conveniente per archiviare i tuoi dati. Oltre all'archiviazione, puoi espanderla a Enterprise Data Lake e aprire la piattaforma per l'analisi per prevedere e prevenire i problemi, anziché rispondere ai problemi. Ciò crea nuove opportunità per i tuoi data scientist di fare cose che prima non erano possibili.

Ma l'archiviazione aziendale non dovrebbe essere un mezzo per raggiungere un fine, è solo la base per iniziare a monetizzare e organizzare i tuoi dati. Ancora più importante, è la roadmap delle app che crei, che determinerà il successo del tuo progetto Hadoop. Ed è altrettanto importante implementare un processo di governance delle informazioni appropriato insieme all'archiviazione aziendale.

La base per ogni progetto Hadoop

Tuttavia, implementare l'archiviazione aziendale a livelli come base del tuo prossimo progetto Hadoop all'inizio del processo di inserimento dei dati è fondamentale per garantire la stabilità, la sicurezza e l'organizzazione dei tuoi dati. Una volta inseriti i dati, l'archiviazione aziendale può aiutare a creare app per risolvere problemi come GDPR, piattaforme di servizi condivisi e molto altro. E questo è più evidente quando decidi di portare il tuo progetto in produzione dove il volume, la varietà e la velocità futuri dei dati in arrivo sono sconosciuti, con un impatto su prestazioni, costi e disponibilità.

Scopri di più su Solix Enterprise Archiving qui.

Scopri di più sulla piattaforma Solix Common Data qui.