Qu'est-ce que la gestion des métadonnées ?

La gestion des métadonnées est la discipline commerciale qui consiste à gérer les métadonnées relatives aux données. Elle donne un sens aux actifs informationnels de votre entreprise et les décrit. Les métadonnées débloquent la valeur de vos données en améliorant leur facilité d'utilisation et de recherche. Les métadonnées fournissent le contexte nécessaire pour comprendre et gouverner vos systèmes, vos données et votre entreprise. En utilisant la gestion des métadonnées, il est plus facile de trouver et d'utiliser les données et de fournir le contexte critique des données dont vos équipes commerciales et informatiques ont besoin.

Diagramme de gestion des métadonnées

Les métadonnées fournissent des informations de base sur les données, notamment le type de fichier, l'heure de création, la taille du fichier, l'auteur, etc. Il existe plusieurs types distincts de métadonnées, notamment les métadonnées descriptives, les métadonnées structurelles, les métadonnées administratives, les métadonnées de référence et les métadonnées statistiques, qui fournissent toutes des informations uniques sur vos données. Vous pouvez créer des métadonnées manuellement ou automatiquement. La création manuelle de métadonnées permet plus de détails, tandis que la création automatique ne contient généralement que des informations très basiques. En général, plus l'actif informationnel est important, plus il est important de gérer les métadonnées qui l'entourent. En effet, vous souhaitez obtenir davantage d'informations sur la manière d'utiliser ce précieux actif informationnel. Si l'actif informationnel n'est pas très important, peu de métadonnées sont nécessaires.

Une stratégie solide de gestion des métadonnées garantit que les données d'une entreprise sont de haute qualité, cohérentes et précises dans les différents systèmes. Les organisations qui utilisent une stratégie complète de gestion des métadonnées sont plus susceptibles de prendre des décisions commerciales basées sur des données correctes que celles qui n'ont pas de solution de gestion des métadonnées en place. Il s'agit d'un élément important de toute initiative de data governance.

Découvrez une solution unique pour gouverner, gérer et consommer toutes les shared data assets
Découvrez une solution unique pour gouverner, gérer et consommer toutes les shared data assets
Évitez les silos grâce à une approche tout-en-un de la gestion des ressources de données dans toute l'entreprise.

Pourquoi les entreprises veulent-elles documenter et gérer leurs métadonnées ?

La plupart des organisations ont une architecture d'information qui ressemble à une librairie surchargée et complètement désorganisée. Il y a des données partout. Les données de la plupart des entreprises ne sont ni organisées ni cataloguées, ce qui rend la recherche extrêmement difficile.

C'est là le problème principal : le manque de facilité à trouver les données et, par conséquent, le manque de facilité à les utiliser. Et ce problème ne fait que croître. Les entreprises peuvent passer de gigaoctets à téraoctets puis à pétaoctets en l'espace de 10 ans. À une époque où « les données sont le nouveau pétrole », les entreprises performantes doivent pouvoir trouver et utiliser toutes leurs données pour obtenir un avantage concurrentiel. Les capacités de description et de recherche de la gestion des métadonnées sont essentielles pour trouver et utiliser ces données avec succès.

La gestion des métadonnées est également importante, car les définitions peuvent changer en fonction du contexte de l'information. Regardez comment différents groupes peuvent penser et définir le terme « client ». Par exemple, si vous parlez à des personnes issues des services informatique, des ventes ou de la conformité, elles peuvent avoir des perceptions ou des points de vue différents sur ce que représentent les clients et comment ces données sont stockées. Pour le service informatique, les données relatives aux clients peuvent être axées sur la réalisation de rapports analytiques et de tableaux de bord pour l'entreprise et sur les aspects très techniques du stockage de ces données. Si vous demandez au service informatique de définir où se trouvent les données « clients », il peut répondre qu'« elles se trouvent dans notre entrepôt de données d'entreprise que nous utilisons pour le reporting et qui remonte à 2015 ». Sauf que nous avons aussi des données clients dans le lac de données qui proviennent de la nouvelle acquisition. Ces données sont dans le lac de données et doivent être transformées avant que nous fassions le reporting. » Ainsi, pour eux, les données « clients » peuvent être très axées sur l'analytique ou contenir un retour historique.

Votre équipe commerciale se concentre peut-être davantage sur les opérations, par exemple sur la manière dont elle utilise les données clients dans ses ventes aujourd'hui. Pour elle, les données clients peuvent signifier uniquement les clients actifs ou les données clients au niveau du compte (comme le nom de l'entreprise), par opposition à tous les clients que l'entreprise a eus. Les équipes de vente peuvent se référer aux données clients comme au nom de l'entreprise plutôt qu'aux données au niveau des personnes. Et le service de conformité peut penser aux données clients au niveau des personnes parce que leur principale utilisation des données est de se conformer aux réglementations, comme le RGPD.

Comme vous pouvez le constater, le défi ne réside pas seulement dans les définitions, mais dans l'incohérence des définitions entre ces différentes équipes et processus. En outre, les données ne cessent de croître. Vous devez être en mesure de facilement trouver vos données pour effectuer vos meilleures analyses. Pour les opérations, vous voulez comprendre les différentes applications et savoir d'où elles tirent leurs données. Pour la conformité, vous voulez vous assurer que l'organisation respecte les règles. Et pour l'informatique, il s'agit surtout de produire des analyses et de conserver un historique.

La gestion des métadonnées vous permet de donner à chaque partie de votre organisation les métadonnées dont elle a besoin pour comprendre et gouverner vos systèmes, vos données, votre organisation entière, et une vue cohérente des données dans toute l'organisation. C'est la seule façon pour une entreprise d'exécuter correctement ses fonctions et de s'assurer qu'elle fait bien les choses.

Cas d'utilisation de la gestion des métadonnées

La gestion des métadonnées aide les différents intervenants de votre organisation à répondre à leurs questions particulières tout en garantissant qu'ils adhèrent à une vision cohérente des données.

  • Analyses : pour des analyses plus approfondies, les utilisateurs recherchent, comprennent et fournissent des données à l'aide de data catalog en libre-service et de flux de travail régis pour leurs programmes d'analyse. Cela peut vous aider à répondre à des questions telles que « Quel est le meilleur ensemble de données de vente pour mon travail d'analyse ? »
  • Opérations : pour optimiser les opérations, les équipes découvrent, récoltent et gèrent toutes les métadonnées d'entreprise et les historiques de données afin d'améliorer la qualité des opérations. Cela peut contribuer à résoudre des questions telles que « Quels sont les systèmes impliqués dans l'exécution des commandes des clients ? »
  • Conformité : pour répondre aux mandats réglementaires (RGPD, CCPA, CBCB 239, etc.), vous pouvez soutenir vos programmes de conformité avec des capacités de data governance, y compris la confidentialité des données. Les équipes de data governance peuvent identifier les éléments de données critiques, documenter les définitions et établir des rapports sur la conformité. Elles peuvent aider à répondre à la question « Où stockons-nous et traitons-nous les informations personnelles ? »

Capacités d'une solution de gestion des métadonnées

Un logiciel de gestion des métadonnées complet est une solution unique qui capture et gère toutes vos métadonnées en un seul endroit. Les fonctionnalités de recherche de votre solution doivent inclure :

  • Un service de gestion des métadonnées : découvrez, récoltez et gérez toutes vos métadonnées en un seul endroit pour des éléments tels que les définitions commerciales, les glossaires et les règles.
  • Une solution de data governance : documentez et soutenez vos politiques de gouvernance et vos efforts de conformité réglementaire.
  • Un data catalog : cataloguez toutes les données physiques sur les systèmes sous-jacents abritant les ressources de données critiques pour la recherche, la collaboration et le provisionnement de l'accès à celles-ci.
  • Disponible en tant que service : 100 % SaaS et facile à approvisionner.

Une solution complète permettra une gestion des métadonnées de bout en bout. Cela inclut :

  • Découverte et extraction : automatisez la collecte de métadonnées à partir de vos systèmes sur site ou dans le cloud.
  • Magasin de métadonnées : un seul magasin de métadonnées pour toutes vos métadonnées commerciales et techniques.
  • Classification et lignage : classification des métadonnées par apprentissage automatique en fonction des éléments de données et de la lignée visuelle.
  • Gouvernance et sécurité : glossaire commercial, politiques de data governance et conformité réglementaire, le tout sur une seule plateforme.
  • Recherche et collaboration : effectuez des recherches dans l'ensemble du data catalog. Collaborez en utilisant des commentaires, des évaluations et des étiquettes.
  • Indicateurs clés de data quality : suivez les indicateurs clés de qualité des données sur toutes vos métadonnées.
  • Intégration et approvisionnement : exposez les métadonnées comme un service. Fournissez l'accès aux données par le biais du catalogue.
Rapport O'Reilly : Construire une infrastructure de données unifiée
Rapport O'Reilly : Construire une infrastructure de données unifiée
Seul un tiers des entreprises se sont transformées en organisations axées sur les données. Quelle est la solution ? Découvrez-la dans cet eBook.

Comment la gestion des métadonnées favorise la collaboration

Si une entreprise veut atteindre un certain niveau de maîtrise des données, les différents types d'intervenants de votre organisation doivent collaborer. La maîtrise des données exige un effort d'équipe. Ce n'est pas quelque chose que des équipes individuelles peuvent faire de façon isolée en espérant arriver au même niveau. Vous avez besoin d'une solution unique pour tout régir et pour permettre aux responsables des données d'interagir avec les utilisateurs de données.

Voyons comment différentes équipes utilisent la gestion des métadonnées. Par exemple, les équipes de gouvernance peuvent être plus concernées par les définitions et la conformité réglementaire, mais elles doivent travailler main dans la main avec l'équipe informatique. Les équipes informatiques peuvent cataloguer les systèmes physiques qui stockent les informations, documenter les différents contrôles et la sécurité qu'elles ont mis en place autour de ce système, travailler avec les différentes équipes qui gèrent le système pour s'assurer qu'elles ont toutes reçu une formation sur la confidentialité et la conformité, mais elles doivent interagir avec l'équipe de conformité. Ensuite, vous avez les utilisateurs de l'analyse qui consomment une grande partie de ces données, et qui veulent être alignés avec les politiques de gouvernance et suive les protocoles que les équipes de sécurité et d'informatique ont établis. Il doit y avoir une interaction entre toutes ces équipes à différents moments.

Conclusion : recherchez une solution de gestion des métadonnées dotée de processus de gouvernance collaborative, notamment : flux de travail, intendance, contrôle des versions et pistes d'audit.

Aujourd'hui, une grande partie de vos métadonnées sont réparties entre plusieurs applications et systèmes. Il en résulte un manque de connexion entre les silos de métadonnées. Par exemple, certaines entreprises utilisent certaines applications pour l'ETL et stockent leurs métadonnées en conséquence. Elles ont d'autres applications axées sur la data governance, et elles stockent ces données en conséquence. Elles ont d'autres applications qui stockent les informations du data catalog et les stockent séparément. Toutes ces informations sont liées et devraient se trouver au même endroit pour permettre une meilleure intégration, une meilleure cohérence et un meilleur contrôle grâce à une solution complète de gestion des métadonnées.

Gestion des métadonnées et IA

Un changement est en train de se produire dans la gestion des métadonnées en raison des dispositifs de périphérie, d'IoT et de l'IA. Il est de plus en plus nécessaire d'utiliser ces métadonnées pour extraire une valeur supplémentaire des données.

L'influence des métadonnées sur les environnements de production (et la productivité) reposera de plus en plus sur le catalogage de leurs différents types, la cartographie, la modélisation des données, le machine learning et l'informatique périphérique. Ceux qui parviendront à rendre les métadonnées opérationnelles dans ces domaines tireront profit de la gestion des métadonnées.

Les algorithmes intégrés d'intelligence artificielle (IA) et de machine learning (ML) facilitent la classification des métadonnées et des lignages de données (horizontaux, verticaux, réglementaires). Fournissez le contexte, la cohérence et le contrôle des données dont vous avez besoin pour atteindre la plus grande efficacité, les meilleures performances et la prise de décision la plus intelligente au sein de toutes vos équipes et services.