Solix Technologies, Inc.、第3世代クラウドデータプラットフォームで比類のないデータガバナンス、プライバシー、セキュリティを実現
SOLIXCloud Enterprise Data Lakeは、Apache Hudiを使用した包括的なデータエンジニアリング、データ統合、リアルタイムトランザクションを提供します。
カリフォルニア州サンタクララ、24年2024月XNUMX日 – ソリックステクノロジーズ株式会社エンタープライズデータ管理ソリューションの大手プロバイダーであるは、本日、 SOLIXクラウドエンタープライズデータレイク.
長い間、顧客は企業全体に広がるデータ資産を管理、理解、活用するのに苦労してきました。第 1 世代のデータ プラットフォームは、リアルタイム レポートが限られていること、ETL の読み込みが複雑で高価であること、リアルタイム更新が欠如していることなどの問題がありました。第 2 世代のデータ プラットフォームでさえ、主要な管理機能とガバナンス機能の欠如、クエリが遅くて面倒であること、メタデータとカタログの管理が不十分であることなどの問題がありました。
その結果、運用データ ストアやデータ ウェアハウスから前世代のデータ レイクに至るまで、顧客はデータ プラットフォームの構築に時間、資金、人材を投資してきましたが、企業のデータ資産を収益に変えるには至っていません。
さらに、生成型 AI、機械学習、エンタープライズ インテリジェンス アプリケーションの収益源を強化するリアルタイムのエンタープライズ データだけでなく、データ ライフサイクル全体にわたってデータ エンジニアリングとデータ統合ソリューションをサポートするデータ ガバナンス フレームワークの需要も高まっています。
第3世代データプラットフォームが登場
SOLIXCloud Enterprise Data Lake は、顧客が企業データ資産を管理、マイニング、収益化できるように支援する革新的な第 3 世代クラウド データ プラットフォームであり、拡張性が高く、SOLIXCloud の顧客が長年頼りにしてきた安全なガバナンスを備えた最善のクラウド データ管理に加えて、新規顧客と既存顧客の両方にエンドツーエンドのデータ統合およびデータ エンジニアリング ソリューションを提供します。
今年 8 月に提供開始予定の新しいデータ レイクには、ACID トランザクションを備えた Apache Hudi と統合データ カタログが追加され、企業が増大する構造化および非構造化エンタープライズ データを管理および分析する方法が変革され、ジャストインタイムの意思決定や将来の重要なビジネス予測の改善が可能になります。
SOLIXCloud Enterprise Data Lake は、安全性、セキュリティ、コンプライアンス、データのライフサイクルに対する堅牢なガバナンスに加え、AWS、Azure、IBM Cloud、Oracle Cloud、Google Cloud、ハイブリッドオンプレミス展開をサポートするマルチクラウドソリューションです。
「データウェアハウスと第一世代のデータレイクは、企業データを保存、整理、分析して収益性を最大化するというビジネス要件を満たしていません。」 と サンディエゴ スーパーコンピュータ センターの主任科学者、ジェームズ ショート博士. 「Solix のエンタープライズ データ レイクは、データ サイエンティスト、データ エンジニア、ビジネス アナリストのニーズに合わせて整理された履歴データとリアルタイム データを利用できるようにすることで、新しい洞察を発見し、利益重視の新しい AI および機械学習ソリューションを構築できるようにします。」
クラウドネイティブで実行 Solix 共通データプラットフォーム (CDP)SOLIXCloud Enterprise Data Lakeは、第3世代のトランザクション型 ストリーミングデータレイク コアデータウェアハウスとデータベース機能をデータレイクに直接提供します。高性能でリアルタイムのクラウドデータベースワークロード向けに設計されたSOLIXCloud Enterprise Data Lakeは、ストリーミングデータの取り込み、データパイプラインをサポートし、一貫性のあるアトミック書き込みと、長時間実行されるデータレイクトランザクションに合わせた同時実行制御により、データレイクにトランザクション保証を提供します。データインフラストラクチャが特定のベンダーに縛られないように、SOLIXCloud Enterprise Data Lakeは、 アパッチ・フディ 顧客早期アクセスで提供され、Apache Iceberg および Delta 向けの Open Table Formats もそれに続く予定です。
SOLIXCloud Enterprise Data Lake は、生成 AI、ストリーミング分析、機械学習オペレーション (MLOps) などのインテリジェントなエンタープライズ アプリケーション向けのサーバーレスで低遅延のトランザクションをサポートするエンドツーエンドのデータ ファブリック ソリューションに対するお客様からの高まる需要に応えるものです。SOLIXCloud Enterprise Data Lake は、メタデータを含むあらゆるデータをあらゆるソースから収集し、データ セキュリティ、消費者データ プライバシー、コンプライアンス、情報ライフサイクル管理 (ILM) などのフェデレーション データ ガバナンス コントロールを備えたリアルタイムのデータ パイプライン ソリューションを提供します。SOLIXCloud Enterprise Data Lake を既存の SOLIXCloud ソリューション ランドスケープに追加して、データ プラットフォーム機能を迅速に拡張することもできます。
「クラウドデータプラットフォームはあらゆるデジタル変革戦略の基盤となる」 と Solix Technologies, Inc. の取締役会長、ジョン・オットマン氏 「SOLIXCloud Enterprise Data Lake は、データ ストリーミング、データ ガバナンス、データ統合、データ エンジニアリング機能を提供し、顧客がデータ資産を最大限に活用して収益化できるようにします。」
Apache Hudi のオープン テーブル形式 (Hadoop-Upserts-Deletes-Incrementals) を備えた SOLIXCloud Enterprise Data Lake データベースの主な機能は次のとおりです。
ACID トランザクション – Apache Hudiデータレイクフレームワークは、リアルタイムの ACIDトランザクション 長時間実行されるデータ レイク トランザクションに合わせて調整された、一貫性のあるアトミック書き込みと同時実行制御のための分離された読み取りにより、データ レイクを保証します。これらの機能には、テーブル、トランザクション、アップサート/削除、大規模なデータセットを管理およびクエリするための高度なインデックス作成方法、クラスタリング/コンパクション、書き込みと読み取りを個別に拡張してインフラストラクチャを最適化するパフォーマンス最適化、一括挿入とトランザクション書き込み、読み取りが書き込みをブロックせず、書き込みが読み取りをブロックしないスナップショット、監査証跡やロールバックに役立つデータセットの過去のバージョンのクエリを可能にするタイム トラベルが含まれます。
高速データ処理 – ストリーミング取り込みを使用したデータの読み取りと書き込みの強力な新しい増分アプローチにより、低速のバッチ データ処理ジョブを再考します。高速データ処理はバッチ データ処理と並行して実行され、実行速度が遅く、リソースを大量に消費している Hive および Spark ジョブの ETL プロセスを再考および再設計する方法を顧客に提供します。増分データ処理により、最後のバッチ以降の新規データまたは更新されたデータのみの処理が容易になり、データ パイプラインの効率が向上します。
高性能ローディング – 中規模サイズの NoSQL データベース インストールでも数十億行が保存されるため、完全な一括ロードは実行不可能であり、このようなデータ量を取り込むにはより効率的なアプローチが必要です。コストがかかり非効率的な一括ロードを、Upsert と増分ストリーミングによる管理された取り込みに置き換えて、データを最新の状態に保ちます。
SOLIXCloud Enterprise Data Lake の追加機能には以下が含まれます。
データカタログ – データ サイエンティストやデータ プロフェッショナルは、あらゆる分析やエンタープライズ インテリジェンスの目的に最適なデータをすばやく見つけられるように、すべてのデータ資産の詳細なインベントリを必要とします。機能には、ロール ベースのアクセス制御、ビジネス用語集、データ分類、メタデータ リポジトリ、データ リネージなどがあります。
ローコードの増分データパイプライン – 人工知能 (AI)、機械学習 (ML)、高度な分析に適した、ソースからターゲットへのリアルタイムの増分データ パイプラインを作成するには、データ エンジニアはドラッグ アンド ドロップ ツールを使用して任意のソースからデータを収集し、データ クレンジング、データ エンリッチメント、その他の準備を適用する必要があります。Solix Data Pipeline は、ファイルの変換、誤ったレコードの削除、機密データのマスキング、タグ付けとラベル付け、またはデータ オブジェクトをエンタープライズ ビジネス レコードに結合することにより、データ品質とデータ ウェアハウス、機械学習、高度な分析アプリケーションの精度を向上させます。
継続的データ配信処理フレームワークは、低レイテンシ、分単位の分析、変更データ キャプチャ ワークロードに最適です。増分取り込みと変換用の宣言型テンプレートを作成し、機械学習操作用の継続的データ配信パイプラインをプロビジョニングします。エンタープライズ データのスケジュール設定、監視、移動の運用上の負担を自動化します。
変更データキャプチャ (CDC) – 変更データキャプチャにより、シームレスで効率的なデータベースの取り込みがデータレイクに可能になります。SOLIXCloud Enterprise Data Lakeは、次のような用途に適したデータの高速なアップサートと削除をサポートするように設計されています。 CDC ストリーミングのユースケース。
Apache Spark – Apache Spark の並列インメモリ データ処理は、構造化データと非構造化データに対するスケーラブルな計算を行う世界で最も広く使用されているエンジンです。現在、Fortune 80 企業の 500% を含む数千の企業が Apache Spark™ を使用しています。
フェデレーテッドデータガバナンス – フェデレーテッド データ ガバナンスは、複数のグループがデータに対する権限を持つ場合の集中管理フレームワークを提供します。委任された権限、仮想ポリシーの適用、監査管理を通じて、フェデレーテッド データ ガバナンスは、リモート テーブルとデータに対するコンプライアンス管理を可能にし、リスクを軽減し、分散されたマルチクラウド データ操作のセキュリティを向上させます。
デモをスケジュールするには ここをクリック,
早期アクセスプログラムに申し込むには ここをクリック:
これらの機能の詳細や詳細については、 ソリックス.
さらに、 ここをクリック ホワイトペーパーをダウンロードするには
フォローをお願いします Facebook, LinkedIn, Twitter, 心 と YouTube.
ソリックステクノロジーズについて
Solix Technologies, Inc.は、エンタープライズデータ、AI、データファブリックソリューションの大手プロバイダーであり、デジタルトランスフォーメーションとデータ駆動型オペレーションにおいてFortune 2000企業から信頼を得ています。 Solix 共通データプラットフォーム (CDP) クラウドネイティブなエンタープライズデータプラットフォームです クラウドデータ管理 アプリケーションには以下が含まれます エンタープライズ データ レイク, エンタープライズアーカイブ, エンタープライズ セキュリティとコンプライアンス と エンタープライズ AISolix はカリフォルニア州サンタクララに本社を置き、直接販売と付加価値再販業者 (VAR) およびシステム インテグレーターの確立されたネットワークを通じて世界中で事業を展開しています。
メディア連絡先
リー・ブラント、ライトスピード PR/M
お問い合わせ