Solix共通データプラットフォームのご紹介
読む3分

Solix共通データプラットフォームのご紹介

F企業や組織がデータ駆動型になるには、ソーシャル、IoT、マシンデータなど、新しいタイプのエンタープライズデータを処理し、リアルタイムで意思決定を行う必要があります。企業がデータ駆動型の組織に進化しなければ、競合他社や新興企業による深刻なビジネス混乱のリスクにさらされます。

現在のデータ ウェアハウスは、この新しいデータの量、速度、多様性に対応できる状態ではありません。Apache Hadoop に基づく新しいデータ レイクは、低コストのインフラストラクチャとオープン ソース ソフトウェアを使用して、この大量の構造化/非構造化データを取得するという問題に対する低コストの解決策を提供します。データ レイクは、データ スキーマや要件を課すことなく、必要になるまでネイティブ形式で大量の生データを保持するストレージ リポジトリです。ビジネス上の質問が発生すると、データ レイクで関連データを照会し、質問に合わせて調整されたスキーマをその小さなデータ セットに適用できます。

しかし、このコンセプトには大きな反対意見もあります。ガートナーによると、データ レイクは監視やガバナンスなしであらゆるデータを受け入れます。説明的なメタデータとそれを維持するメカニズムがなければ、データ レイクはデータ スワンプに変わる危険性があります。また、メタデータがなければ、その後のデータの使用はすべてアナリストがゼロから始めることを意味します。適切なガバナンス対策がなければ、データ レイクは「データの無制限使用」を生み出し、データ品質とデータ リネージの問題を悪化させる可能性があります。

半構造化データと非構造化データは、データの意味を確かめるために、ガバナンス原則によって正式に定義されたメタデータ規則に従うことが不可欠です。データに統一されたメタデータ標準があることを保証することで、ユーザーは、たとえば CRM の独自データが感情データとどのように関連しているかなど、データが他のデータとどのように関連しているかを理解できます。データ レイクの危険性は、個々のエンド ユーザーが、特定のビジネス問題や使用の特定のコンテキスト内で必要な属性を、ガバナンス規則に従わない可能性のあるデータ セット全体に帰属させる傾向があることです。

もう 1 つのリスクは、セキュリティとアクセス制御です。中央データ レイク テクノロジーのセキュリティ機能はまだ未熟です。メタデータとセマンティクスは、個人を特定できる医療情報など、特定の種類のデータのセキュリティ、使用、場所を管理する規制に準拠するために不可欠です。理論上は、データ レイクによって企業がサイロベースの文化から距離を置き、共有と統合を重視できるようになるため、独立したデータ マートはもはや必要ありません。実際には、メタデータがない場合、データ マートは規制への準拠と適切なデータ セキュリティを確保するための最良の方法です。

私たちは、データ取り込みのための明確に定義されたビジネス プロセスと情報ガバナンスがあれば、問題に対処し、データ レイクをエンタープライズ対応にできると考えています。さらに、データ レイクにエンタープライズ アーカイブを追加すれば、分析の範囲を大幅に拡大し、高度な分析プラットフォームを作成できます。これはデータ ウェアハウスに代わる戦略ではなく、むしろ既存の投資を補完するものであると考えています。それを目標として、私たちは新しい製品である Solix Common Data Platform に取り組んできました。

Solix 共通データ プラットフォーム = エンタープライズ アーカイブ + エンタープライズ データ レイク + 情報ガバナンス

従来のデータ ウェアハウスやデータ レイクとの違いを比較すると次のようになります。

Solix 共通データ プラットフォーム比較表