L'essor des plateformes de données cloud
SIl y a environ 60 ans, les premiers à adopter l'entreprise pilotée par les données ont mis en œuvre la planification des besoins en matériaux (MRP) pour améliorer le rendement et l'efficacité de la production. Pour la première fois, les directeurs d'usine ont utilisé une plateforme de données pour prévoir les résultats en fonction de plans et de calendriers optimisés.
À partir de ce grand succès, l’entreprise axée sur les données a évolué vers la planification des ressources d’entreprise (ERP) et l’entreposage de données d’entreprise (EDW) pour répondre aux demandes toujours croissantes de rapports en ligne, d’analyses et d’intelligence d’affaires améliorée.
« Si vous ne pouvez pas le mesurer, vous ne pouvez pas l'améliorer », a dénoncé le gourou du management Peter Drucker, et la quête de l'entreprise axée sur les données a pris une ampleur vertigineuse.

Cliquez ici pour voir l'infographie complète
Ces premières plateformes de données ont permis d'établir une version unique de la vérité pour décrire les performances commerciales des entreprises à l'aide du traitement des transactions en ligne, des rapports en ligne et de la veille stratégique. En stockant et en traitant les données de transaction critiques dans une seule instance de base de données, les organisations ont acquis un contrôle et une efficacité considérables pour libérer du capital et augmenter le rendement. Enfin, les chefs d'entreprise pouvaient mesurer les résultats en temps réel et exploiter les analyses pour améliorer la connaissance de la situation et la prise de décision.
Cependant, ces plans de gestion des données d'entreprise ne fournissaient qu'une image partielle, car ils ne traitaient que des données structurées. Aujourd'hui, jusqu'à 80 % des données d'entreprise sont non structurées ou semi-structurées et comprennent des images, des e-mails, des médias sociaux, de l'audio, etc. Et comme les données non structurées augmentent à un rythme soutenu, taux extrême jusqu'à 65% par an, bien plus rapides que les données structurées, ces plans de gestion des données à un stade précoce ne sont plus suffisants.
Plateforme commune de données (CDP)
Une architecture d'information de nouvelle génération est nécessaire pour soutenir l'entreprise moderne axée sur les données. Ces nouvelles plateformes de données ingèrent toutes les données et utilisent du matériel évolutif et standard ainsi qu'une gouvernance des données pour transformer la crise de la croissance des données en une opportunité commerciale axée sur les données. Les revenus du marché du Big Data augmentent à mesure que les entreprises réorganisent et font évoluer leurs stratégies de gestion des données d'entreprise pour en tirer parti.
Une plateforme commune de données (CDP) collecte, organise et gère toutes les données de l'entreprise dans un référentiel unique et évolutif pour optimiser l'infrastructure et stocker les données en masse à faible coût. Les données sont généralement stockées « telles quelles » ou transformées pour répondre à des exigences particulières, mais restent toujours disponibles pour un accès en temps réel par les applications en aval. Ces cas d'utilisation en aval constituent la prochaine génération d'applications pilotées par les données et sont alimentés par des données provenant de tous les domaines fonctionnels de l'entreprise.
Les plateformes de données modernes nécessitent une pile technologique cloud native comprenant des bases de données NoSQL, des conteneurs, des microservices et des magasins d'objets. Les données sont partout et les options de déploiement nécessitent la prise en charge de solutions de plateformes de données publiques, privées, hybrides ou multicloud. L'enjeu est de créer une entreprise moderne axée sur les données, exploitant un accès en temps réel et en lecture de schémas à toutes les données de l'entreprise. Grâce à cette nouvelle architecture d'information, les data scientists peuvent exécuter des applications d'analyse et de visualisation de données plus avancées, d'intelligence artificielle (IA) et d'apprentissage automatique (ML).
Solution de bout en bout
La portée de la solution pour la plate-forme de données de nouvelle génération est de bout en bout et comprend la structure de données complexe reliant des sources de données disparates à des magasins de données cibles. Les données sources sont archivées en tant que service à partir de systèmes de production basés sur Contrôles de gestion du cycle de vie de l'information. ILM fonde l'ingestion de données sur une bonne pratique avec des politiques de gouvernance des données, des plans de conformité et des règles de sécurité des données pour protéger correctement les données.
Les politiques de gouvernance, de sécurité et de conformité des données critiques sont gérées de manière centralisée tout au long du cycle de vie des données. Un référentiel de métadonnées centralisé permet des contrôles et des plans de conservation basés sur des politiques pour garantir que les données sont intégrées, consultées, partagées, liées, analysées et conservées de manière optimale dans toute l'organisation. L'objectif est de permettre un accès approprié et sécurisé aux recherches de texte, aux formulaires, aux rapports, aux requêtes, aux visualisations, aux analyses et aux applications d'IA/ML.
Cadre d'application Big Data
Le cadre d'application de Common Data Platform comprend à la fois des cas d'utilisation informatiques et fonctionnels essentiels à l'entreprise axée sur les données d'aujourd'hui. Les cas d'utilisation informatiques incluent l'optimisation de l'infrastructure et l'ingestion de données via archivage d'entreprise que le béton ey demande de retraite.
Capacités de gouvernance des données Les politiques de gouvernance, de risque et de conformité sur une plate-forme de données cloud sont polyvalentes et prennent en charge une grande variété d'exigences de conformité critiques pour l'entreprise. Les politiques de gouvernance, de risque et de conformité sont appliquées par des règles métier pour créer un système de contrôles permettant de satisfaire aux exigences de conformité les plus exigeantes. Les politiques critiques telles que ILM, GDPR et la série NIST 800 sont disponibles dans des configurations prêtes à l'emploi.
Finance basée sur les données permet des applications financières de nouvelle génération telles que la consolidation avancée pour les processus de commande à encaissement et d'approvisionnement au paiement. Les cas d'utilisation des applications sectorielles comprennent les data fabrics, la gouvernance des données et la transformation des données pour des solutions sectorielles spécifiques dans les domaines de la santé, du gouvernement et de la banque.
Les lacs de données d'entreprise sont des référentiels de données dotés de fonctions de gouvernance des données, de gestion des métadonnées et d'outils avancés d'analyse des données. Les magasins de données opérationnels (ODS) sont des lacs de données d'entreprise dont la structure de données prend en charge les mises à jour en temps réel. En stockant les données « telles quelles » et en les mettant à jour en temps réel, les lacs de données et les ODS réduisent les processus ETL lourds et libèrent les utilisateurs de la conception de schéma fixe et canonique des entrepôts de données d'entreprise. Les architectures de base de données NoSQL prennent en charge l'accès aux données par schéma lors de la lecture, ce qui permet aux data scientists de mieux décrire leurs données et d'obtenir des informations plus puissantes sur les données.
L'essor des plateformes de données repose sur une architecture de plateforme de données cloud native open source et sur un large portefeuille d'applications NoSQL avancées. Les plateformes de données communes effectuent une collecte de données uniforme en tant que service pour alimenter les archives et les lacs de données de l'entreprise, qui alimentent la prochaine génération d'entreprises axées sur les données.
Grâce à la recherche en texte enrichi, aux rapports, aux requêtes, aux analyses avancées, à l'IA/ML et aux applications NoSQL, l'entreprise axée sur les données aide les chefs d'entreprise à gérer au-delà d'une seule version de la vérité et à prévoir « que va-t-il se passer ? ». Exécutant des modèles de calcul parallèle avancés, CDP prend en charge une grande variété de charges de travail et exploite l'infrastructure de base et les magasins d'objets pour traiter et stocker des données en masse au moindre coût.





