Cos'è la Reference Data Management?
La Reference Data Management è il processo di gestione delle classificazioni e delle gerarchie nei sistemi e linee di business. Ciò può includere l'esecuzione di analisi sui Reference Data, il monitoraggio delle modifiche ai Reference Data, la distribuzione dei Reference Data e altro ancora. Per una Reference Data Management efficace, le aziende devono definire politiche, strutture e standard per governare e gestire i Reference Data sia interni che esterni.
Dopo essersi diffuso nel 2012, la Reference Data Management (RDM) è diventata un elemento chiave in Master Data Management (MDM). L'RDM fornisce i processi e le tecnologie per il riconoscimento, l'armonizzazione e la condivisione di set di dati codificati e relativamente statici per il "riferimento" da parte di diversi soggetti (persone, sistemi e altri domini di master data). Un tale sistema fornisce la governance, il processo, la sicurezza e il controllo dell'audit intorno al mastering dei reference data. Inoltre, i sistemi RDM gestiscono anche mappature complesse tra diverse rappresentazioni di reference data e diversi domini di dati in tutta l'azienda. La maggior parte dei sistemi RDM contemporanei fornisce anche la connettività, generalmente un livello di servizio dell'architettura orientata ai servizi (SOA) (noto anche come microservices), per la condivisione dei reference data con le applicazioni aziendali, le applicazioni analitiche/data science, e governance .

Perché la Reference Data Management è così importante?
Prima che fossero disponibili soluzioni RDM commerciali, le aziende costruivano soluzioni personalizzate usando software esistenti come RDBMS, fogli di calcolo, software di flusso di lavoro (business process management o BPM) e altri strumenti. Tali sistemi spesso non disponevano di gestione dei cambiamenti, controlli di audit e sicurezza/permessi granulari. Di conseguenza, queste soluzioni legacy hanno presentato rischi sempre maggiori per la conformità. Poiché i Reference Data sono utilizzati per guidare i processi aziendali chiave e la logica dell'applicazione, gli errori nei Reference Data possono avere un importante impatto aziendale negativo e moltiplicativo. Le discrepanze nei Reference Data: (1) hanno un impatto sulla Data Quality; (2) influenzano l'integrità dei report di BI; e, (3) sono anche una fonte comune di errori della Application Integration. Proprio come le aziende non costruiscono più i propri sistemi CRM, ERP e MDM, così anche le organizzazioni stanno iniziando ad acquisire soluzioni RDM o RDG commerciali, che possono essere facilmente adattate o configurate e hanno il pieno e continuo supporto di un importante fornitore di software.
Quali sono i vantaggi della Reference Data Management?
Un vantaggio della Reference Data Management è che centralizzando il controllo si può garantire che la coerenza e la conformità siano mantenute. Aiuta i team aziendali ad accedere, distribuire e aggiornare i Reference Data su più sistemi in modo coerente e disciplinato per soddisfare le esigenze aziendali. Una Reference Data Management efficace può permettere a un'azienda di scalare le sue operazioni e i processi di analisi. Può fornire la capacità di reagire rapidamente ai nuovi requisiti di dati o ai cambiamenti del mercato senza ristrutturare i dati dell'intera azienda.
La Reference Data Management può portare coerenza ai tuoi dati. Gestendo ogni versione dei Reference Data e collegandoli attraverso tabelle di corrispondenza, le aziende possono raggiungere la coerenza semantica nel tempo e tra diversi standard. Senza questa coerenza, le organizzazioni soffrirebbero di una scarsa Data Quality e di piccoli errori che potrebbero diventare costosi a lungo termine.

Criteri di valutazione di Reference Data Management
- Capacità di mappare i Reference Data: Oltre ai set di Reference Data canonici (codici Paese, valute, lingue, ecc.), un hub RDM deve essere in grado di gestire nuove versioni specifiche per applicazione, settore e casi d'uso nonché adattamenti locali (ad esempio, versioni in lingua straniera). Inoltre, le relazioni tra i set di Reference Data e tutte queste permutazioni devono essere gestite.
- Amministrazione dei tipi di Reference Data: Uno dei problemi comuni con le soluzioni di Reference Data sviluppate in loco è che un singolo modello di dati non può facilmente rappresentare i diversi tipi di Reference Data. Il modello di dati deve essere esteso per supportare nuovi set di Reference Data e nuove proprietà specifiche per i vari tipi di Reference Data gestiti.
- Gestione ed esperienza utente dei set di Reference Data: le soluzioni RDM dovrebbero essere progettate pensando all'utente aziendale. Fornendo IU intuitive e un modello di dati flessibile, un'azienda può installare, configurare e importare rapidamente i Reference Data con un bisogno minimo di coinvolgimento continuo dell'IT.
- Architettura/Performance: A causa della natura altamente correlata dei Reference Data, la modalità semantica è utile per gestire le relazioni tra i set di Reference Data nel tempo. Chiaramente, la necessità di documentare i Reference Data e le loro complesse connessioni ad altri domini richiede che la piattaforma abbia una robusta modellazione dati/semantica.
- Gestione delle gerarchie su set di Reference Data: Le tabelle dei codici di riferimento possono essere sia liste piatte che gerarchie. La struttura gerarchica è un aspetto chiave dei Reference Data che deve essere gestito oltre ai valori e alle relazioni di mappatura.
- Connettività: È fondamentale che una soluzione RDM fornisca mezzi di connessione multipli e flessibili per fornire la massima "accessibilità". I Reference Data devono essere resi facilmente disponibili ai sistemi applicativi a valle, agli abbonati remoti, ecc. Inoltre, ogni consumatore di dati RDM deve essere in grado di accedere ai dati nella modalità e nel formato più conveniente.
- Importazione ed esportazione: una soluzione RDM dovrebbe permettere l'importazione e l'esportazione di Reference Data in più formati. Per esempio, per mappature in entrata e in uscita da/a definizioni di dati, fonti e destinazioni come file piatti o database, nonché formati CSV e XML.
- Supporto di versioning: le soluzioni RDM dovrebbero anche supportare il versioning dei set di Reference Data e delle relative mappature. Tale versioning è usato insieme alla gestione del ciclo di vita per gestire le modifiche ai set di Reference Data e alle mappature nel tempo.
- Sicurezza e controllo degli accessi: Le moderne soluzioni RDM forniscono una robusta sicurezza basata sui ruoli. Per esempio, l'accesso CRUD a una particolare entità dovrebbe essere controllato dal ruolo dell'utente, dal gruppo di cui l'utente è membro e dalla relativa proprietà dell'entità, oltre che dallo stato del ciclo di vita dell'entità stessa.
- Gestione del ciclo di vita end-to-end: le soluzioni RDM dovrebbero impiegare IU di governance e processi di workflow per fornire supporto alla governance formale dei Reference Data, mettendo la gestione del ciclo di vita end-to-end (E2E) dei Reference Data aziendali nelle mani degli utenti aziendali, riducendo il carico sull'IT e migliorando la qualità complessiva dei dati utilizzati nell'azienda.