階層型エンタープライズアーカイブが Hadoop のキラーアプリである理由
読む3分

階層型エンタープライズアーカイブが Hadoop のキラーアプリである理由

調査によると、今年は Hadoop の導入の 70% が失敗すると予想されています。この確実な戦略は、データを整理し、可能性を克服するのに役立ちます。

A 最近のガートナー社のレポートでは、スキルと統合の課題を理由に、70 年の Hadoop 導入の 2018% が主要目標を達成できないと予測されています。どうやら、多くの組織が Hadoop プロジェクトに取り組んでいますが、明確なロードマップや完了に必要なスキルがないため、完全な実稼働に移行できず、最終的には趣味のプロジェクトになってしまうようです。

2018 年の Hadoop 導入

それで、あることを考えました。組織は大量のデータを保有していますが、その 80% は非アクティブです (ガートナーの別の統計)。このデータをビッグ データ リポジトリにアーカイブ/廃棄するよりも優れたキラー アプリケーションは他に何があるでしょうか。ビッグ データ リポジトリは、コモディティ ストレージ、コンピューティング、オープン ソース ソフトウェアで構築できるため、即座に ROI が得られ、上層部にすぐに受け入れられ、導入も簡単です。

エンタープライズ アーカイブは、情報ライフサイクル管理のベスト プラクティスであり、データの重要性、古さ、コンプライアンス要件に基づいてデータをアクセス可能な層に分散するデータ取り込み戦略です。この機能は、Hadoop の強力な HDFS ファイル システムによって実現されています。組織ごとにデータとニーズは異なりますが、エンタープライズ アーカイブ システムの適切な出発点は、理想的にはハイブリッドおよびマルチクラウド コンピューティング インフラストラクチャ全体に分散された次の層をベースにすることです。

– データ レイク層: 頻繁にアクセスする必要があるアクティブ データ用。

– アーカイブ層: 運用環境から完全に分離する必要があるデータ用。ビッグデータ分析やデータ サイエンス プロジェクトに役立ちます。

情報ライフサイクル管理のベストプラクティス

低コストの汎用ハードウェア向けに設計

Hadoop はコモディティ ハードウェアを念頭に構築されているため、S3 などのクラウド サービスにエンタープライズ アーカイブを展開すると、非常にコスト効率の高い方法でデータを保存できます。アーカイブ以外にも、エンタープライズ データ レイクに拡張して、問題に対応するのではなく、問題を予測して防止するための分析プラットフォームを開くことができます。これにより、データ サイエンティストがこれまでは不可能だったことを行う新しい機会が生まれます。

しかし、エンタープライズ アーカイブは目的を達成するための手段ではなく、データの収益化と整理を開始するための基盤にすぎません。さらに重要なのは、構築するアプリのロードマップが Hadoop プロジェクトの成功を決定するということです。また、エンタープライズ アーカイブと並行して適切な情報ガバナンス プロセスを実装することも同様に重要です。

あらゆるHadoopプロジェクトの基盤

ただし、データ取り込みプロセスの早い段階で、次の Hadoop プロジェクトの基盤として階層型エンタープライズ アーカイブを実装することは、データの安定性、セキュリティ、および整理を確保するために重要です。データが取り込まれると、エンタープライズ アーカイブは、GDPR、共有サービス プラットフォームなどの問題を解決するアプリの構築に役立ちます。これは、プロジェクトを本番環境に導入することを決定したときに最も顕著になります。このとき、将来の受信データの量、種類、速度は不明であり、パフォーマンス、コスト、および可用性に影響を及ぼします。

Solix Enterprise Archivingの詳細はこちら こちら.

Solix共通データプラットフォームの詳細 こちら.