Qu'est-ce que la gestion des données dans le cloud ?
Temps de lecture 5 minutes

Qu'est-ce que la gestion des données dans le cloud ?

L’essor de l’architecture multi-cloud axée sur les données et le large portefeuille d’applications avancées axées sur les données qui en résultent nécessitent gestion des données en nuage systèmes permettant de collecter, gérer, gouverner et créer des pipelines pour les données d'entreprise. Les architectures de gestion des données cloud couvrent les environnements de cloud privé, multi-cloud et hybride se connectant à des sources de données non seulement à partir de systèmes de transaction, mais également à partir de serveurs de fichiers, d'Internet ou de référentiels multi-cloud.

La gestion des données dans le cloud couvre les lacs de données d'entreprise, l'archivage d'entreprise, les services de contenu d'entreprise et les solutions de confidentialité des données des consommateurs. Ces solutions gèrent les défis liés à l'utilité, aux risques et à la conformité liés au stockage de grandes quantités de données.

Plateforme de gestion de données cloud solixcloud

 

Plateformes de données cloud

Plateformes de données cloud Les services d'archivage, de lac de données et de contenu sont la pièce maîtresse des programmes de gestion des données dans le cloud et assurent une collecte et un stockage uniformes des données au moindre coût. Les archives, les lacs de données et les services de contenu permettent aux projets de migration vers le cloud de connecter, d'ingérer et de gérer tout type de données provenant de n'importe quelle source. Par exemple, les plateformes de données dans le cloud collectent des données héritées et en temps réel à partir de mainframes, d'ERP, de CRM, de magasins de fichiers, de bases de données relationnelles et non relationnelles, et même d'environnements SaaS comme Salesforce ou Workday.

Archivage d'entreprise

Des études ont montré que les données sont consultées de moins en moins fréquemment à mesure qu'elles vieillissent. Les données actuelles, telles que les données en ligne, sont consultées plus fréquemment, mais après deux ans, la plupart des données d'entreprise ne sont pratiquement jamais consultées. À mesure que la croissance des données s'accélère, la charge sur l'infrastructure de production augmente et le défi de maintenir les performances des applications s'accroît.

Les portefeuilles d'applications doivent être examinés régulièrement pour identifier les applications héritées qui ne sont plus utilisées et ces applications doivent être retirées ou mises hors service. En outre, les données historiques des bases de données de production doivent être archivées pour améliorer les performances, optimiser l'infrastructure et réduire les coûts globaux. La gestion du cycle de vie des informations (ILM) doit être utilisée pour établir la gouvernance des données et les contrôles de conformité.

Archivage d'entreprise prend en charge toutes les données d'entreprise, y compris les bases de données, les données en streaming, les serveurs de fichiers et les e-mails. Grâce à ILM, l'archivage d'entreprise déplace les données les moins fréquemment consultées des systèmes de production vers des référentiels de proximité. Les données d'archive restent hautement accessibles et sont stockées dans des compartiments à faible coût. Les grandes organisations exploitant des silos de serveurs de fichiers dans plusieurs départements et divisions utilisent l'archivage d'entreprise pour consolider ces silos dans un référentiel cloud unifié et conforme.

Lac de données d'entreprise

Les entreprises axées sur les données exploitent des réseaux vastes et complexes de données et de services, et les lacs de données d’entreprise fournissent les connexions nécessaires pour déplacer les données de n’importe quelle source vers n’importe quel emplacement cible. Lacs de données d'entreprise gérer de très gros volumes de données et évoluer horizontalement à l'aide d'une infrastructure cloud de base pour fournir des services de pipeline de données et de préparation de données pour les applications en aval telles que l'entrepôt de données SQL, l'intelligence artificielle (IA) et l'apprentissage automatique (ML).

Les pipelines de données sont une série de flux de données dans lesquels la sortie d'un élément est l'entrée du suivant, et ainsi de suite. Les lacs de données servent de points de collecte et d'accès dans un pipeline de données et sont responsables de l'organisation des données et du contrôle d'accès.

La préparation des données permet d'optimiser la qualité des données. Les services de préparation des données incluent le profilage, le nettoyage, l'enrichissement, la transformation et la modélisation des données. En tant que solution open source et standard du secteur, les lacs de données d'entreprise collectent et stockent de manière sécurisée de grandes quantités de données pour la migration vers le cloud et fournissent des services de qualité professionnelle pour explorer, gérer, gouverner, préparer et fournir un contrôle d'accès aux données.

Services de contenu d'entreprise (ECS)

Les partages de fichiers d’entreprise regorgent de fichiers et de données abandonnées depuis longtemps. Services de contenu d'entreprise collectez et stockez les données historiques de l'entreprise qui seraient autrement dispersées sur plusieurs îlots de stockage, sur des appareils personnels, des partages de fichiers, Google Drive, Dropbox ou des OneDrive personnels. Les organisations qui prévoient une migration des données vers le cloud pour lutter contre la prolifération du contenu doivent envisager ECS pour un stockage de fichiers sécurisé et conforme au moindre coût. La migration des données vers le cloud avec ECS consolide les données de l'entreprise sur une plate-forme unique et unifie les silos de serveurs de fichiers de manière innovante pour devenir plus efficaces et réduire les coûts.

Confidentialité des données des consommateurs

Réglementation sur la confidentialité des données des consommateurs Les nouvelles réglementations se multiplient, avec près de 100 pays qui adoptent désormais des réglementations. La loi californienne sur la protection de la vie privée des consommateurs (CCPA) et le règlement général sur la protection des données (RGPD) de l'Europe sont peut-être les lois les plus connues, mais de nouvelles réglementations se multiplient partout, alors que les failles de sécurité, les cyberattaques et les divulgations non autorisées d'informations personnelles continuent de croître sans relâche. Ces nouvelles réglementations imposent des contrôles stricts sur le traitement des informations personnelles identifiables (PII), mais les variations selon les régions géographiques rendent la conformité légale une exigence complexe.

La gestion du cycle de vie des informations (ILM) gère les données tout au long de leur cycle de vie et établit un système de contrôles et de règles commerciales, notamment des politiques de conservation des données et des conservations légales. Les outils de sécurité et de confidentialité tels que la classification des données, le masquage des données et la découverte de données sensibles aident les administrateurs de données à se conformer aux politiques de gouvernance des données telles que NIST 800-53, PCI, HIPAA et GDPR. La confidentialité des données des consommateurs et la gouvernance des données ne sont pas seulement essentielles pour la conformité légale, elles améliorent également la qualité des données.

Quelle est l'urgence ?

La croissance exponentielle des données est un fait connu, mais les conséquences ne se font sentir que depuis quelques années dans les entreprises. D’un côté, de plus en plus de données sont nécessaires pour prendre en charge les applications et les analyses basées sur les données. De l’autre côté, la croissance des données entraîne des inefficacités opérationnelles, des dettes techniques et des risques accrus en matière de conformité. La croissance des données est une arme à double tranchant si elle n’est pas gérée et offre une grande valeur ajoutée en permettant aux entreprises de gérer plus efficacement leurs données.