Cos'è una federazione di dati?

Una federazione di dati è un processo software che permette a più database di funzionare come uno solo. Il database virtuale prende i dati da una serie di fonti e li converte tutti in un modello comune. Questo fornisce una singola fonte di dati per le applicazioni front-end.

Diagramma della federazione dei dati

La federazione dei dati fa parte del quadro di virtualizzazione dei dati. La virtualizzazione dei dati si è sviluppata con la federazione dei dati, ma ha prodotto caratteristiche, applicazioni e funzioni extra. La virtualizzazione dei dati, quindi, ha una vasta gamma di funzioni al di fuori della compilazione del data warehouse. Include repository di metadati, astrazione dei dati, accesso in lettura e scrittura ai sistemi di dati sorgente e sicurezza avanzata.

Sebbene la federazione dei dati faccia parte della virtualizzazione dei dati, non sono la stessa cosa.

Federazione di dati nel commercio

Una delle più grandi sfide che le aziende devono affrontare oggi è la gestione efficace dei dati. Possono manifestarsi molteplici problemi con i dati:

  • Più database cloud e siti diversi limitano l'accesso
  • Grandi volumi di dati hanno bisogno di uno stoccaggio massiccio
  • Nessuna coerenza tra i dati, che richiede sforzo e tempo per la pulizia e l'organizzazione
  • Nessun formato unico riguardante come o dove vengono memorizzati i dati

La federazione di dati elimina molti dei problemi associati ai dati grezzi, facendo risparmiare alle aziende tempo e denaro. Per esempio, una federazione di dati converte le informazioni da più fonti e le combina in un unico formato. Quindi, posiziona tutti i database in un unico negozio virtualmente. Questo significa che invece di creare un'altra copia dei dati, li integra virtualmente, eliminando la necessità di un altro sistema di archiviazione.

La federazione dei dati dovrebbe essere parte di una strategia di gestione e virtualizzazione dei dati. Questa strategia combina sistemi cloud, estensioni di data warehouse, integrazione dei dati e una serie di altre strategie di gestione dei dati.

Modernizza la tua architettura di dati e analisi
Modernizza la tua architettura di dati e analisi
Dai un'occhiata a questi 13 casi d'uso per apprendere a supportare il complesso panorama odierno di dati e analisi.

Vantaggi della federazione dei dati

Nessuno spazio di archiviazione supplementare richiesto

Poiché il software non fa una copia completa dei dati dalla fonte, le aziende non hanno bisogno di investire in hardware. Non c'è bisogno di infrastrutture costose o di maggiori capacità di elaborazione dei dati; è tutto gestito dal software di federazione dei dati.

Un'unica fonte di verità

Una fonte di dati accurata è inestimabile. Non solo fa risparmiare tempo quando si cercano informazioni specifiche, ma queste sono più precise. Indipendentemente da dove vengono inseriti i dati aggiornati e più recenti, il database della federazione di dati li avrà. Questo significa meno errori, clienti più felici e informazioni commerciali più affidabili.

I silos di dati sono comuni, specialmente quando le aziende hanno una visione meno olistica dell'IT. Le federazioni di dati eliminano i silos e assicurano una facile condivisione in tutta l'azienda.

Dati più affidabili per il machine learning e l'intelligenza artificiale

Gran parte del ruolo di un data scientist è la pulizia dei dati: la rimozione dei punti dati non necessari e dei doppioni, la ricerca delle informazioni più recenti e l'eliminazione degli outlier. La federazione dei dati fa la maggior parte di questo automaticamente. I dati risultanti sono accurati, coerenti e offrono previsioni e risultati superiori.

Accesso veloce ai dati

Nessun hardware e nessuna infrastruttura complessa, solo un accesso ai dati incredibilmente veloce. Inoltre, se il software deve essere costruito, non c'è bisogno di creare il magazzino e la funzionalità di estrazione, trasformazione e caricamento. È molto più veloce creare una federazione di dati.

Accessibile con una minima codifica richiesta

Le barriere all'ingresso sono basse per creare una federazione di dati. La codifica è minima e non c'è bisogno di personale IT riservato e specializzato. Basta installare il software di runtime di sviluppo della federazione di dati su un server standard, creare visualizzazioni e servizi e mettere a punto le query.

Più economico delle opzioni alternative

Oltre a non aver bisogno di hardware fisico su cui memorizzare i dati, una federazione di dati non ha bisogno di licenze software, di una governance dei dati extra e di personale IT costoso.

Minimizzare il rischio

Poiché il sistema non sta replicando o spostando fisicamente nulla, il rischio di perdita di dati è minimo o nullo. Se il sistema di federazione dei dati è impostato correttamente, tutti i rapporti esistenti possono essere mappati in modo da essere eseguiti esattamente allo stesso modo. Nessun dato o rapporto mancante, perso o confuso, e nessun rischio.

Problemi con la federazione dei dati

Incapace di gestire una pulizia dei dati significativa

Anche se avviene un po' di messa a punto e pulizia dei dati, i dati molto incoerenti o problematici possono rappresentare una sfida per il software e mettere a rischio i risultati aziendali.

Soluzione: i dati devono essere in formato relazionale o XML. Se questo non è possibile, riconsiderare l'uso di una federazione di dati, specialmente con database molto grandi o complessi.

Nessun dato storico

Quando vengono effettuate modifiche nella maggior parte dei sistemi di dati, i dati storici vengono conservati in qualche forma. In questo modo diventa facile risalire agli errori, trovarli e risolverli. Tuttavia, le federazioni di dati dispongono solo dei dati più recenti e attuali.

Soluzione: i sistemi di archiviazione fisica dei dati sono ancora necessari per catturare i dati storici.

Necessita di una capacità di sistema coerente

Se i sistemi informatici di un'azienda stanno operando al massimo o stanno faticosamente tentando di gestire la capacità, allora una federazione di dati non funzionerà. L'infrastruttura deve gestire la natura ad-hoc delle richieste senza rallentare i compiti essenziali di elaborazione dei dati.

Soluzione: potrebbe essere necessario un aggiornamento del sistema per eseguire correttamente le federazioni di dati.

Report O'Reilly: costruire un'infrastruttura di dati unificata
Report O'Reilly: costruire un'infrastruttura di dati unificata
Solo un terzo delle aziende si è evoluto in organizzazioni guidate dai dati. Qual è la soluzione? Scoprilo in questo eBook!

Che aspetto ha la federazione di dati in un'organizzazione?

Un'organizzazione avrà spesso più database e silos di dati separati che sono difficili da raggiungere. Con un accesso frammentato ai dati, le informazioni aziendali sono incoerenti e inaffidabili.

Una federazione di dati riunisce tutti i dati. Il controllo dei database originali rimane al reparto o alla filiale, assicurando una precisione continua. Questo rende l'implementazione molto più supportata, con più buy-in politico a tutti i livelli dell'organizzazione.

Il personale e gli utenti finali possono accedere a una varietà di rapporti e informazioni accurate, consentendo una migliore business intelligence, dati per le previsioni e risultati per tutte le parti interessate, compresi clienti e fornitori.

Alternative alla federazione di dati

L'alternativa principale a una federazione di dati è un data warehouse o enterprise data warehouse (EDW). Questi, proprio come una federazione di dati, sono un repository centralizzato che estrae dati da fonti multiple per l'analisi. Tuttavia, a differenza di una federazione di dati, richiedono un'integrazione fisica.

Questo significa che i dati vengono raccolti da una serie di fonti e poi memorizzati nel data warehouse come copia fisica.

Anche se questo presenta degli svantaggi, un data warehouse e una federazione di dati non dovrebbero essere considerati un risultato "uno contro uno". Devono essere usati insieme per creare un sistema impeccabile e senza difetti, che catturi tutte le informazioni rilevanti. La federazione dei dati rende facile per gli utenti accedere ai dati corretti, mentre il data warehouse fornisce per essi una casa fisica.

Il futuro della federazione dei dati

In media, le grandi imprese hanno circa 40 database singoli. Questi sistemi funzionano tutti in parallelo e possono causare una vasta gamma di problemi, diminuendo la funzionalità e la precisione di un'azienda. Ma da quando la federazione dei dati si è diffusa a metà degli anni 2010, molti di questi problemi sono scomparsi.

Se da un lato le organizzazioni dovrebbero concentrarsi sulla creazione di un database olistico e facile da usare che eviti i silos di dati e gli enormi costi di hardware, i silos di dati sono difficili da risolvere. Il ritmo di sviluppo della tecnologia significa che una piattaforma costruita su misura sarà obsoleta nel giro di anni e nessun software potrà mai soddisfare tutti i requisiti aziendali. Mentre i sistemi legacy vengono ritirati, i dati devono ancora essere accessibili.

È qui che una federazione di dati emerge. Come parte di un sistema che incorpora data warehouse, cloud e on-premises, nonché integrazione dei dati, le federazioni di dati diventano un sistema perfetto che soddisfa tutti i requisiti. Le sfide e le debolezze di una federazione di dati sono compensate dai punti di forza di un data warehouse, rendendoli la soluzione ideale per la maggior parte dei problemi di database aziendali.