Cos'è la gestione dei metadati?

La gestione dei metadati è la disciplina aziendale della gestione dei metadati riguardanti i dati. Dà significato e descrive le risorse informative nella tua organizzazione. I metadati sbloccano il valore dei tuoi dati migliorandone l'usabilità e la reperibilità. I metadati forniscono il contesto necessario per capire e governare i tuoi sistemi, i tuoi dati e il tuo business. Utilizzando la gestione dei metadati, è più facile trovare e utilizzare i dati e fornire il contesto critico dei dati di cui hanno bisogno i team aziendali e IT.

Diagramma di gestione dei metadati

I metadati forniscono informazioni di base sui dati, tra cui il tipo di file, il tempo di creazione, la dimensione del file, l'autore e altro. Ci sono diversi tipi distinti di metadati, compresi i metadati descrittivi, i metadati strutturali, i metadati amministrativi, i metadati di riferimento e i metadati statistici che forniscono tutti informazioni uniche sui tuoi dati. Puoi creare i metadati manualmente o automaticamente. La creazione manuale dei metadati permette di avere più dettagli, mentre la creazione automatica generalmente contiene solo informazioni di base. In generale, più importante è la risorsa informativa, più importante è gestire i metadati intorno ad essa. Questo perché vuoi più informazioni su come usare quel prezioso patrimonio informativo. Se il patrimonio informativo non è così importante, non sono necessari molti metadati.

Una solida strategia di gestione dei metadati assicura che i dati di un'organizzazione siano di alta qualità, coerenti e accurati in vari sistemi. Le organizzazioni che utilizzano una strategia completa di gestione dei metadati hanno maggiori probabilità di prendere decisioni aziendali basate su dati corretti rispetto a quelle che non hanno una soluzione di gestione dei metadati. È una componente importante di qualsiasi iniziativa di governance dei dati.

Scopri una soluzione unica per disciplinare, gestire e consumare tutti i Data Assets condivisi
Scopri una soluzione unica per disciplinare, gestire e consumare tutti i Data Assets condivisi
Evita i silos con un approccio all-in-one alla gestione delle risorse di dati in tutta l'azienda.

Perché le organizzazioni vogliono documentare e gestire i loro metadati?

La maggior parte delle organizzazioni ha un'architettura delle informazioni che assomiglia a una libreria sovraccarica e completamente disorganizzata. Sono presenti dati ovunque. I dati della maggior parte delle organizzazioni non sono organizzati o catalogati, rendendo estremamente difficile trovare ciò che si sta cercando.

Questo è il problema centrale: la mancanza di reperibilità dei dati e quindi la mancanza di utilizzabilità dei dati. E questo problema sta solo aumentando. Le organizzazioni possono passare da gigabyte a terabyte a petabyte nell'arco di 10 anni. In un'epoca in cui "i dati sono il nuovo petrolio", le organizzazioni di successo devono essere in grado di trovare e utilizzare tutti i propri dati per ottenere un vantaggio competitivo. Le capacità descrittive e di ricerca della gestione dei metadati sono cruciali per trovare e usare con successo quei dati.

La gestione dei metadati è importante anche perché le definizioni possono cambiare a seconda del contesto delle informazioni. Guardate come diversi gruppi potrebbero pensare e definire il termine "cliente": per esempio, se parlate con persone dell'IT, delle vendite o della conformità, potrebbero avere percezioni o punti di vista diversi su ciò che i clienti rappresentano e su come quei dati vengono archiviati. Per l'IT, i dati sui clienti potrebbero essere focalizzati sull'esecuzione di report analitici e dashboard per l'azienda e sugli aspetti molto tecnici dell'archiviazione di quei dati. Se chiedete all'IT di definire dove si trovano i dati dei "clienti", potrebbero rispondere che "sono nel nostro data warehouse aziendale che usiamo per i report, risalenti al 2015". Solo che abbiamo anche dati dei clienti nel data lake che provengono dalla nuova acquisizione. Quei dati sono nel data lake e devono essere trasformati prima di fare il reporting". Quindi, per loro, i dati dei "clienti" potrebbero essere molto incentrati sull'analisi o contenere un riferimento storico.

Il tuo team commerciale potrebbe essere più concentrato sulle operazioni, ad esempio come stanno usando i dati dei clienti nelle vendite oggi. Per loro, i dati dei clienti possono significare solo clienti attivi o i dati dei clienti a livello di account (come il nome dell'azienda), al contrario di tutti i clienti che l'azienda ha mai avuto. I team commerciali possono riferirsi ai dati dei clienti secondo il nome dell'azienda piuttosto che secondo i dati a livello di persone. E la conformità può pensare ai dati dei clienti a livello di persone perché il loro uso principale dei dati è quello di rispettare i regolamenti, come il GDPR.

Come puoi vedere, la sfida non è solo con le definizioni, ma è l'incoerenza delle definizioni tra questi diversi team e processi. Inoltre, i dati crescono sempre di più. Devi essere in grado di trovare i tuoi dati per fare la tua migliore analisi. Nelle operazioni, devi comprendere tutte le diverse applicazioni e da dove si stanno estraendo i dati. Per la conformità, si deve essere sicuri che l'organizzazione stia aderendo alle regole, e per l'IT sarà per lo più preoccupata di produrre analisi dei dati e mantenere un archivio storico.

La gestione dei metadati ti permette di fornire ad ogni parte dell'organizzazione i metadati di cui ha bisogno per capire e governare i tuoi sistemi, i tuoi dati, la tua intera organizzazione e una visione coerente dei dati in tutta l'organizzazione. Questo è l'unico modo in cui un'organizzazione sarà in grado di eseguire correttamente le funzioni e di garantire che alla fine sta facendo le cose bene.

Casi d'uso della gestione dei metadati

La gestione dei metadati aiuta le diverse identità nella tua organizzazione a rispondere alle loro domande particolari, assicurando allo stesso tempo che stiano aderendo a una visione coerente dei dati.

  • Analisi: per ottenere analisi dei dati più approfondite, gli utenti cercano, comprendono e forniscono dati usando cataloghi di dati self-service e flussi di lavoro governati per i loro programmi di analisi. Può aiutarvi a rispondere a domande come "Qual è il miglior set di dati di vendita per il mio lavoro di analisi?".
  • Operazioni: per ottimizzare le operazioni, i team scoprono, raccolgono e gestiscono tutte le risorse di metadati aziendali e le linee di dati per migliorare la qualità delle operazioni. Può aiutare a rispondere a domande come "Quali sistemi sono coinvolti nell'evasione degli ordini dei clienti?
  • Conformità: per soddisfare i mandati normativi (GDPR, CCPA, BCBS 239, ecc.), è possibile supportare i programmi di conformità con funzionalità di governance dei dati, compresa la privacy dei dati. I team di governance dei dati possono individuare gli elementi critici dei dati, documentare le definizioni e riferire sulla conformità. Può aiutare a rispondere alla domanda "Dove conserviamo ed elaboriamo le informazioni personali?"

Capacità di una soluzione di gestione dei metadati

Un software di gestione dei metadati completo è una soluzione unica che cattura e gestisce tutti i tuoi metadati in un unico posto. Le funzionalità da cercare nella tua soluzione dovrebbero includere:

  • Servizio di gestione dei metadati: scopri, raccogli e gestisci tutti i tuoi metadati in un unico posto per elementi come definizioni aziendali, glossari e regole.
  • Soluzione di governance dei dati: documenti e supporti le tue politiche di governance e gli sforzi di conformità normativa.
  • Catalogo dei dati: cataloghi tutti i dati fisici riguardanti i sistemi alla base che ospitano le risorse di dati critici per la ricerca, la collaborazione e l'accesso ad essi.
  • Disponibile come servizio: 100% SaaS e facilmente fornibile

Una soluzione completa permetterà la gestione dei metadati end-to-end. Include:

  • Scoperta ed estrazione: automatizzi la raccolta di metadati dai tuoi sistemi in locale o cloud
  • Magazzino di metadati: un unico magazzino di metadati per tutti i tuoi metadati aziendali e tecnici
  • Classificazione e lignaggio: classificazione guidata dal machine learning delle risorse di metadati agli elementi di dati e al lignaggio visivo.
  • Governance e sicurezza: glossario aziendale, politiche di governance dei dati e conformità normativa in un'unica piattaforma.
  • Ricerca e collaborazione: ricerca nell'intero catalogo di dati. Collabora con commenti, valutazioni e tag.
  • KPI di qualità dei dati: tracci gli indicatori chiave della qualità dei dati su tutti i tuoi metadati.
  • Integrazione e provisioning: esponi i metadati come servizio. Fornisci l'accesso ai dati attraverso il catalogo.
Report O'Reilly: costruire un'infrastruttura di dati unificata
Report O'Reilly: costruire un'infrastruttura di dati unificata
Solo un terzo delle aziende si è evoluto in organizzazioni guidate dai dati. Qual è la soluzione? Scoprilo in questo eBook!

Come la gestione dei metadati favorisce la collaborazione

Se un'organizzazione vuole raggiungere un certo livello di alfabetizzazione dei dati, i diversi tipi di persone nella tua organizzazione devono collaborare. L'alfabetizzazione dei dati richiede uno sforzo di squadra. Non è qualcosa che i singoli team possono fare da soli e sperare di arrivare allo stesso punto. Hai bisogno di una soluzione per governare il tutto e per permettere agli amministratori di interagire con gli utenti dei dati.

Guardiamo come i diversi team usano la gestione dei metadati. Per esempio, i team di governance potrebbero essere più interessati alle definizioni e alla conformità normativa, ma hanno bisogno di lavorare mano nella mano con il team IT. I team IT potrebbero catalogare i sistemi fisici che memorizzano le informazioni, documentare i diversi controlli e la sicurezza che hanno avvolto intorno a quel sistema, lavorare con i diversi team che gestiscono il sistema per assicurarsi che tutti abbiano avuto una formazione sulla privacy e la conformità, ma hanno bisogno di interagire con il team della conformità. Poi, ci sono gli utenti di analisi che stanno consumando molti di quei dati e vogliono assicurarsi di essere in conformità con le politiche di governance e di seguire i protocolli che i team di sicurezza e IT hanno stabilito. Ci deve essere interazione fra tutti questi team in vari momenti.

In conclusione: cerca una soluzione di gestione dei metadati che abbia processi di governance collaborativi che includano: flussi di lavoro, amministrazione, controllo delle versioni e tracce di revisione.

Oggi, molti dei tuoi metadati sono separati tra più applicazioni e sistemi. Questo si traduce in una mancanza di connessione tra i silos di metadati. Per esempio, alcune aziende utilizzano alcune applicazioni per l'ETL e di conseguenza memorizzano i loro metadati. Hanno altre applicazioni focalizzate sulla governance dei dati e memorizzano conseguentemente quei dati. Hanno altre applicazioni che memorizzano le informazioni del catalogo dei dati e le memorizzano separatamente. Tutte queste informazioni sono collegate e dovrebbero essere in un unico posto per consentire una migliore integrazione, una migliore coerenza e un migliore controllo attraverso una soluzione completa di gestione dei metadati.

Gestione dei metadati e IA

Sta avvenendo un cambiamento nella gestione dei metadati a causa dei dispositivi edge, IoT e IA. C'è una maggiore necessità di usare quei metadati per estrarre ulteriore valore dai dati.

L'influenza dei metadati sugli ambienti di produzione (e sulla produttività) dipenderà sempre più dalla catalogazione dei suoi vari tipi, dalla mappatura, dalla modellazione dei dati, dal machine learning e dall'edge computing. Coloro che riusciranno a rendere operativi i metadati in queste aree trarranno vantaggio dalla gestione dei metadati.

L'intelligenza artificiale incorporata (IA) e gli algoritmi di machine learning (ML) facilitano la classificazione dei metadati e le linee di dati (orizzontale, verticale, normativa). Fornisci il contesto, la coerenza e il controllo dei dati di cui hai bisogno per ottenere la massima efficienza, le migliori prestazioni e il processo decisionale più intelligente in tutti i tuoi team e reparti.