Barry Art

Préface

La mise en œuvre de lacs de données en entreprise présente un double défi : concilier une gouvernance des données robuste et le besoin de solutions de stockage évolutives. Cet article explore les contraintes opérationnelles, les compromis stratégiques et les modes de défaillance associés aux architectures de lacs de données, notamment dans le contexte d’organisations telles que la Securities and Exchange Commission (SEC) américaine. En analysant les implications des cadres de gouvernance par rapport aux capacités de stockage, les décideurs d’entreprise peuvent faire des choix éclairés, conformes aux exigences réglementaires et aux meilleures pratiques de gestion des données.

Définition

Un lac de données est un référentiel centralisé permettant le stockage à grande échelle de données structurées et non structurées, rendant possible l'analyse avancée et les applications d'apprentissage automatique. Contrairement aux entrepôts de données traditionnels, les lacs de données prennent en charge une plus grande variété de types et de formats de données, ce qui peut engendrer à la fois des opportunités et des défis en matière de gouvernance et de gestion du stockage.

Réponse directe

Dans le contexte des lacs de données, les entreprises doivent privilégier les cadres de gouvernance afin d'atténuer les risques de non-conformité, tout en veillant à ce que les solutions de stockage puissent gérer la croissance rapide des données. La matrice de décision doit tenir compte des exigences de conformité spécifiques de l'organisation et des projections de croissance des données.

Pourquoi maintenant

L'urgence d'une gouvernance efficace des lacs de données est accentuée par le renforcement du contrôle réglementaire et la croissance exponentielle des données. Des organisations comme la SEC sont confrontées à des exigences accrues en matière de gestion des données, ce qui nécessite une approche stratégique de la gouvernance capable de s'adapter à l'évolution des normes de conformité. L'absence d'une gouvernance robuste peut entraîner des répercussions juridiques et opérationnelles importantes.

Tableau de diagnostic

Question Description Impact
Silos de données Une gouvernance inadéquate conduit à des ensembles de données isolés. Intégrité et accessibilité des données compromises.
Échecs de conformité L'absence de cadres de gouvernance entraîne la non-conformité. Sanctions légales et atteinte à la réputation.
Problèmes de qualité des données Les sources de données non réglementées introduisent des inexactitudes. La prise de décision éclairée est compromise.
Violations de la politique de rétention Non-respect des politiques de conservation des données. Risques juridiques et amendes potentielles.
Accès non autorisé Contrôles d'accès utilisateur mal configurés. Risque accru de violation de données.
Perte de données Les systèmes de stockage dépassent leurs limites de capacité. Des données critiques sont définitivement perdues.

Sections analytiques approfondies

Gouvernance des données vs. Stockage dans les lacs de données

Les cadres de gouvernance des données sont essentiels à la conformité et à la gestion des risques, notamment dans les environnements réglementés comme celui de la SEC. Ces cadres définissent la manière dont les données sont gérées, consultées et conservées, permettant ainsi aux organisations de respecter leurs obligations légales. Parallèlement, les solutions de stockage doivent s'adapter à la croissance rapide des données tout en garantissant leur accessibilité. Le compromis entre gouvernance et capacités de stockage peut engendrer des difficultés opérationnelles s'il n'est pas géré avec soin. Les organisations doivent évaluer leurs exigences de conformité spécifiques au regard de la croissance des données prévue afin de prendre des décisions éclairées.

Contraintes opérationnelles dans les architectures de lac de données

La mise en place de lacs de données soulève plusieurs défis opérationnels. Sans une gouvernance adéquate, ces lacs peuvent engendrer des silos de données, fragmentant ainsi les données et rendant leur analyse globale difficile. Une gouvernance inadéquate peut également entraîner des problèmes de conformité, les organisations pouvant avoir des difficultés à retracer la provenance des données et à appliquer les politiques de conservation. Ces contraintes opérationnelles exigent une approche proactive de la gouvernance, incluant des audits réguliers et des mises à jour des politiques, afin de garantir la conformité et l'efficacité des lacs de données.

Risques stratégiques et coûts cachés

Les organisations doivent être conscientes des risques stratégiques liés à la mise en œuvre d'un lac de données. Privilégier la gouvernance au détriment du stockage peut engendrer des coûts cachés, tels qu'une augmentation des frais opérationnels liés à la gouvernance et d'éventuelles amendes pour non-conformité. À l'inverse, l'augmentation des capacités de stockage sans gouvernance adéquate peut entraîner des pertes de données et des risques juridiques. Les décideurs doivent mener une analyse approfondie de ces risques afin d'aligner leurs stratégies de lac de données sur les objectifs de l'organisation.

Contrepoint de l'Homme d'Acier

Bien que l'accent mis sur la gouvernance soit essentiel, certains affirment que privilégier les capacités de stockage peut apporter des avantages immédiats, tels qu'une meilleure accessibilité aux données et des analyses plus rapides. Cependant, cette perspective néglige souvent les conséquences à long terme d'une gouvernance inadéquate, notamment les risques de non-conformité et les problèmes de qualité des données. Une approche équilibrée intégrant à la fois la gouvernance et les considérations de stockage est indispensable à la réussite durable d'un lac de données.

Intégration de solution

L'intégration de cadres de gouvernance aux solutions de stockage exige une approche stratégique alignée sur les objectifs organisationnels. La mise en œuvre de cadres de gouvernance des données permet de prévenir la croissance incontrôlée des données et les manquements à la conformité. L'établissement de politiques de conservation des données est également essentiel pour limiter les risques juridiques liés aux violations de ces politiques. Les organisations doivent privilégier les solutions technologiques qui facilitent la gouvernance tout en garantissant l'évolutivité des capacités de stockage face à la croissance des données.

Scénario d'entreprise réaliste

Prenons l'exemple de la SEC qui met en place un lac de données pour gérer d'importants volumes de données financières. Sans cadre de gouvernance robuste, l'agence risque de ne pas respecter la réglementation fédérale et de s'exposer à des sanctions juridiques. En privilégiant la gouvernance, la SEC peut garantir une gestion efficace des données, réduire les risques de fuites et améliorer leur qualité globale. Ce scénario illustre l'importance cruciale d'un équilibre entre gouvernance et stockage lors de la mise en œuvre d'un lac de données.

QFP

Q : Quel est le principal avantage de la mise en place d'un lac de données ?
A : Le principal avantage d'un lac de données est sa capacité à stocker de vastes quantités de données structurées et non structurées, permettant des applications d'analyse avancée et d'apprentissage automatique.

Q : Comment les organisations peuvent-elles garantir la conformité lorsqu'elles utilisent des lacs de données ?
A: Les organisations peuvent garantir la conformité en mettant en œuvre des cadres de gouvernance des données robustes qui définissent comment les données sont gérées, consultées et conservées.

Q : Quels sont les risques liés à une gouvernance des données inadéquate ?
A: Une gouvernance des données inadéquate peut entraîner des manquements à la conformité, des silos de données et des problèmes de qualité des données, ce qui peut compromettre la prise de décision et exposer les organisations à des sanctions légales.

Mode de défaillance observé en lien avec le sujet de l'article

Lors d'un incident récent, nous avons découvert une défaillance critique dans notre cadre de gouvernance des données, plus précisément liée à application de la conservation légale pour les actions liées au cycle de vie du stockage d'objets non structurésAu départ, nos tableaux de bord indiquaient que tous les systèmes fonctionnaient correctement, mais à notre insu, les mécanismes de gouvernance avaient déjà commencé à dysfonctionner silencieusement.

La première défaillance est survenue lorsque nous avons constaté que la propagation des métadonnées de conservation légale entre les versions d'objets ne fonctionnait pas comme prévu. Ce dysfonctionnement a été aggravé par le découplage de l'exécution du cycle de vie des objets et de leur état de conservation légale, ce qui a conduit à la suppression d'objets qui auraient dû être conservés. Le plan de contrôle, responsable de la gouvernance, a divergé du plan de données, entraînant une incohérence entre la classe de conservation et les étiquettes réelles des objets. De ce fait, nous avons été confrontés à un risque important de non-conformité aux exigences réglementaires.

Notre groupe d'analyse de la récupération et de la gouvernance (RAG) a détecté l'erreur lorsqu'une recherche d'objet a révélé qu'il avait été marqué à tort comme expiré, malgré une conservation légale. La dérive au niveau de la classe de rétention et de l'indicateur de conservation légale a rendu la situation irréversible : la purge du cycle de vie était déjà terminée et les instantanés immuables avaient écrasé l'état précédent. Cette erreur irréversible a mis en évidence le besoin crucial d'une intégration plus étroite entre les contrôles de gouvernance et les processus de gestion des données.

Il s'agit d'un exemple hypothétique ; nous ne citons pas de clients ou d'institutions figurant au classement Fortune 500 à titre d'exemples.

  • fausse hypothèse architecturale
  • Qu'est-ce qui a cassé en premier ?
  • Leçon d'architecture générale liée au « Data Lake : Domination des SERP à forte valeur ajoutée – Le guide d'entreprise des solutions de lac de données : Gouvernance vs. Stockage »

Perspective unique tirée de « » Sous les contraintes du « Data Lake : Domination des SERP à forte valeur ajoutée – Le guide d’entreprise des solutions de Data Lake : Gouvernance vs. Stockage »

L'une des principales contraintes de la gestion des lacs de données réside dans l'équilibre à trouver entre la croissance des données et le contrôle de la conformité. À mesure que les organisations se développent, la complexité du maintien de la gouvernance s'accroît, ce qui conduit souvent à des compromis susceptibles de compromettre l'intégrité des données. Le modèle de « séparation des plans de contrôle et de données » appliqué à la récupération réglementée des données apparaît comme un cadre essentiel pour appréhender ces enjeux.

La plupart des recommandations publiques tendent à négliger l'importance du suivi et de la validation continus des mécanismes de gouvernance, ce qui peut engendrer des risques importants de non-conformité. Les organisations présument souvent qu'une fois mis en place, les contrôles de gouvernance resteront efficaces sans surveillance constante. Cette supposition peut avoir de graves conséquences, car la réalité est que les environnements de données sont dynamiques et nécessitent une attention permanente.

Test EEAT Ce que font la plupart des équipes Ce qu'un expert fait différemment (sous la pression réglementaire)
Quel facteur donc ? Mettre en place des mécanismes de gouvernance dès le départ Valider et ajuster en continu les contrôles en fonction des changements du cycle de vie des données
Preuves d'origine S’appuyer sur les audits de conformité initiaux Effectuer des audits réguliers et une surveillance en temps réel
Delta unique / Gain d'information Supposons que la conformité soit statique. Reconnaître que la conformité est un processus évolutif qui nécessite des stratégies adaptatives

Références

  • NISTSP 800-53 – Fournit des lignes directrices pour la mise en œuvre de contrôles de gouvernance efficaces.
  • – Énonce les principes de gestion et de conservation des documents.
Barry Art

Barry Art

Vice-président du marketing, Solix Technologies Inc.

Barry Art Il dirige les initiatives marketing chez Solix Technologies, où il traduit les défis complexes liés à la gouvernance des données, à la mise hors service des applications et à la conformité en stratégies claires pour les clients figurant au classement Fortune 500.

Expérience en entreprise : Barry avait auparavant travaillé avec IBM zSeries écosystèmes soutenant l'activité mainframe multimilliardaire de CA Technologies, avec une exposition pratique à l'économie des infrastructures d'entreprise et aux risques liés au cycle de vie à grande échelle.

Référence orale vérifiée : Inscrit comme panéliste au programme du symposium sur l'IA explicable et sécurisée de l'UC San Diego ( Consulter l'agenda au format PDF ).

AVERTISSEMENT : LE CONTENU, LES POINTS DE VUE ET LES OPINIONS EXPRIMÉS DANS CE BLOG SONT LA RESPONSABILITÉ EXCLUSIVE DES AUTEURS ET NE REFLÈTENT PAS LA POLITIQUE OU LA POSITION OFFICIELLE DE SOLIX TECHNOLOGIES, INC., DE SES SOCIÉTÉS AFFILIÉES OU DE SES PARTENAIRES. CE BLOG EST EXPLOITÉ DE MANIÈRE INDÉPENDANTE ET N'EST NI RÉVISÉ NI APPROUVÉ PAR SOLIX TECHNOLOGIES, INC. À TITRE OFFICIEL. TOUTES LES MARQUES, LOGOS ET DOCUMENTS PROTÉGÉS PAR LE DROIT D'AUTEUR TIERS MENTIONNÉS DANS CE BLOG APPARTIENNENT À LEURS PROPRIÉTAIRES RESPECTIFS. TOUTE UTILISATION EST STRICTEMENT À DES FINS D'IDENTIFICATION, DE COMMENTAIRE OU ÉDUCATIVES CONFORMÉMENT À LA DOCTRINE DE L'US FAIR USE (US COPYRIGHT ACT § 107 ET ÉQUIVALENTS INTERNATIONAUX). AUCUN PARRAINAGE, AUCUNE APPROBATION OU AFFILIATION AVEC SOLIX TECHNOLOGIES, INC. N'EST IMPLICITE. LE CONTENU EST FOURNI « EN L'ÉTAT », SANS GARANTIE D'EXACTITUDE, D'EXHAUSTIVITÉ OU D'ADÉQUATION À UN USAGE PARTICULIER. SOLIX TECHNOLOGIES, INC. DÉCLINE TOUTE RESPONSABILITÉ POUR LES ACTIONS PRISES SUR LA BASE DE CE MATÉRIEL. LES LECTEURS ASSUMENT L'ENTIÈRE RESPONSABILITÉ DE LEUR UTILISATION DE CES INFORMATIONS. SOLIX RESPECTE LES DROITS DE PROPRIÉTÉ INTELLECTUELLE. POUR SOUMETTRE UNE DEMANDE DE RETRAIT DMCA, ENVOYEZ UN E-MAIL À INFO@SOLIX.COM AVEC : (1) L'IDENTIFICATION DE L'ŒUVRE, (2) L'URL DU MATÉRIEL CONTREFAÇANT, (3) VOS COORDONNÉES ET (4) UNE DÉCLARATION DE BONNE FOI. TOUTE RÉCLAMATION VALIDE RECEVRA UNE EXAMEN RAPIDE. EN ACCÉDANT À CE BLOG, VOUS ACCEPTEZ CET AVIS DE NON-RESPONSABILITÉ ET NOS CONDITIONS D'UTILISATION. CE CONTRAT EST RÉGI PAR LES LOIS DE LA CALIFORNIE.