Cos'è il data fabric?

Il data fabric è una soluzione di gestione e integrazione dei dati end-to-end, composta da architettura, software di integrazione e gestione dei dati e dati condivisi, che aiuta le organizzazioni a gestire i loro dati. Un data fabric fornisce un'esperienza utente unificata e coerente e l'accesso ai dati per qualsiasi membro di un'organizzazione in tutto il mondo e in tempo reale.

Diagramma del data fabric

Un data fabric è progettato per aiutare le organizzazioni a risolvere complessi problemi di dati e casi d'uso gestendo i loro dati, indipendentemente dai vari tipi di applicazioni, piattaforme e luoghi in cui i dati sono memorizzati. Il data fabric consente un accesso senza intoppi e la condivisione dei dati in un ambiente di dati distribuiti.

Perché usare un data fabric?

Qualsiasi organizzazione centrata sui dati ha bisogno di un approccio olistico che superi gli ostacoli relativi a tempo, spazio, tipi diversi di software e posizioni dei dati. I dati devono essere accessibili agli utenti che ne hanno bisogno, non rinchiusi dietro i firewall o collocati in modo frammentario in una serie di luoghi. Le aziende devono disporre di un ambiente sicuro, efficiente, unificato e di una soluzione adeguata alle esigenze future per poter prosperare. Un data fabric fornisce tutto ciò.

L'integrazione tradizionale dei dati non soddisfa più le nuove esigenze aziendali di connettività in tempo reale, self-service, automazione e trasformazioni universali. Anche se il problema non è di solito la raccolta di dati da varie fonti, molte organizzazioni non sono in grado di integrare, elaborare, curare e trasformare i dati con altre fonti. Questa parte cruciale del processo di gestione dei dati deve avvenire per fornire una visione completa di clienti, partner e prodotti. Ciò offre alle organizzazioni un vantaggio competitivo, consentendo loro di soddisfare meglio le richieste dei clienti, modernizzare i loro sistemi e sfruttare la potenza del cloud computing.

Il data fabric può essere visualizzato come un tessuto, diffuso in tutto il mondo, ovunque siano gli utenti dell'organizzazione. L'utente può trovarsi in qualsiasi punto di questo tessuto e comunque accedere ai dati in qualsiasi altro luogo senza alcun vincolo, in tempo reale.

Risorsa del data fabric
Stai cercando una soluzione alle tue sfide sui dati? Costruisci un data fabric!
Scopri come unire tutti i tuoi dati, allineare l'ufficio IT con quello commerciale e valorizzare i lavoratori remoti e mobili nel nuovissimo eBook di O'Reilly!

Il data fabric è più di una semplice rete

Internet è stato creato per collegare gli esseri umani in tutto il mondo, dando alle persone la possibilità di ignorare gli ostacoli del tempo e della distanza. Tuttavia, inizialmente collegava solo le persone e il trasferimento di dati quantificati era minimo. Oggi, le attività sulle piattaforme digitali hanno superato le previsioni iniziali e i dati sono diventati un mondo a sé. Qualsiasi attività quantitativa, online o nella vita reale, può essere classificata come fornitrice di dati. Mentre questi dati crescono a passi da gigante, è necessario creare un'infrastruttura per gestirli.

All'inizio, l'obiettivo era gestire i dati e, come bonus, ricavarne informazioni utili. Con il passare del tempo, l'attenzione ha iniziato a spostarsi dalla semplice gestione dei dati alla capacità di estrarre conoscenze da quei dati. Con un data fabric, l'obiettivo si sta spostando dalla semplice gestione dei dati al miglioramento della qualità dei dati stessi, alla disponibilità delle informazioni e agli approfondimenti automatizzati che ne derivano.

Perché usare un data fabric?

In tutto il mondo, il numero di soggetti interessati che entrano nell'ambiente in rete è in aumento. Tutti sono connessi a Internet e ogni piattaforma è diventata una fonte di dati. Valorizzare al massimo i dati è diventato un problema complesso. Le sfide dei dati al giorno d'oggi includono:

  • Situato in più luoghi, in locale e nel cloud
  • Dati strutturati e non strutturati
  • Tipi di dati diversi
  • Paesaggi di piattaforme diversi
  • Mantenuto su diversi file system, database e applicazioni SaaS

I dati stanno crescendo esponenzialmente, quindi questi problemi si moltiplicano.

Insieme, tali problemi e variazioni rendono complesso accedere o utilizzare facilmente i dati. Inoltre, se le organizzazioni vogliono prodottizzare o operazionalizzare IA e ML, hanno bisogno dei loro dati raccolti, trasformati ed elaborati.

Oggi, la maggior parte delle organizzazioni tende ad affrontare il problema a compartimenti stagni, creando molti modi diversi di gestire i dati nell'ambito di una singola organizzazione. Anche se questa soluzione rende i dati disponibili a gruppi particolari, accedervi a livello aziendale diventa quasi impossibile, spesso relegando i dati a rimanere inattivi e inutilizzati.

La mancanza di un accesso e di un utilizzo completo dei dati si traduce in uno scarso ritorno sugli investimenti nell'infrastruttura, nella mancanza di disponibilità di dati per produrre previsioni utili e in una produttività inferiore. È in queste condizioni che il data fabric viene in soccorso.

Data fabric e status quo

Attualmente, molte organizzazioni usano data lake e data warehouse per gestire i dati. Tuttavia, ad un esame più attento, questi approcci sono ad alta intensità di tecnologia piuttosto che incentrati sui dati. Con i data lake e i data warehouse, la priorità è raccogliere o estrarre i dati grezzi, immagazzinarli e usarli quando si ricavano informazioni utili. Queste soluzioni non sono state progettate con in mente i problemi odierni e rendono difficile ottenere una visione unificata dei dati. Tuttavia, tali tecniche spesso portano a latenze e costi crescenti. Con la crescente quantità di dati e i vincoli di tempo con cui lavorano i decisori di un'organizzazione, i ritardi nell'accesso ai dati e nell'elaborazione non sono desiderabili. In questi scenari, il data fabric offre il vantaggio di immagazzinare, estrarre ed elaborare i dati nel punto di origine in tempo reale, consentendo ai decisori di disporre in qualunque momento di informazioni utili.

Data Fabric e virtualizzazione dei dati

Il data fabric viene spesso confuso con la virtualizzazione dei dati. La virtualizzazione dei dati crea un livello di astrazione dei dati ed è spesso utilizzata quando è necessario integrare rapidamente i dati. Collega, raccoglie e trasforma i dati provenienti da molte fonti diverse, sia in locale che nel cloud, per ottenere informazioni agili, self-service e in tempo reale. D'altra parte, il data fabric si riferisce a un'architettura di gestione dei dati complessiva, end-to-end, utilizzata per casi d'uso più ampi, come la customer intelligence e l'IoT analytics, includendo una serie più ampia di componenti dello stack. Gli analisti consigliano di utilizzare la virtualizzazione dei dati come strumento che contribuisce all'architettura di data fabric. Man mano che si utilizzano sempre più strumenti di integrazione dei dati, è possibile sviluppare la soluzione in un data fabric che è specifico per gli obiettivi della propria organizzazione.

Implementazione del data fabric

Il data fabric inizia con i concetti di elaborazione delle transazioni online (OLTP). Nell'elaborazione transazionale online, informazioni dettagliate su ogni transazione vengono inserite, aggiornate e caricate in un database. I dati sono strutturati, puliti e immagazzinati in silos in un centro per un ulteriore utilizzo. Qualsiasi utente dei dati, in qualsiasi punto del tessuto, può prendere i dati grezzi e usarli per ricavare molteplici risultati, aiutando le organizzazioni a sfruttare i propri dati per crescere, adattarsi e migliorare.

Il successo dell'implementazione del data fabric richiede:

  • Applicazione e servizi: dove viene costruita l'infrastruttura necessaria per acquisire i dati. Include lo sviluppo di applicazioni e interfacce grafiche (GUI) per consentire al cliente di interagire con l'organizzazione.
  • Sviluppo e integrazione dell'ecosistema: creazione dell'ecosistema necessario per raccogliere, gestire e conservare i dati. I dati del cliente devono essere trasferiti al gestore dei dati e ai sistemi di archiviazione in modo da evitare la perdita di dati.
  • Sicurezza: i dati raccolti da tutte le fonti devono essere gestiti con la dovuta sicurezza.
  • Gestione dell'archiviazione: i dati sono archiviati in modo accessibile ed efficiente, con la possibilità di scalare quando necessario.
  • Trasporto: costruire l'infrastruttura necessaria per accedere ai dati da qualsiasi punto delle posizioni geografiche dell'organizzazione.
  • Punti terminali: sviluppare l'infrastruttura definita dal software nei punti di stoccaggio e di accesso per permettere approfondimenti in tempo reale.
Dieci cose che devi sapere sulla data virtualization
Dieci cose che devi sapere sulla data virtualization
Scopri i punti chiave sulla virtualizzazione dei dati in modo da poter superare le criticità e ottenere risultati migliori

Come funziona l'intelligenza artificiale o il machine learning con il data fabric?

Nelle fasi iniziali dell'archiviazione dei dati, gli ingegneri dei dati e i data scientist hanno cercato di unire i puntini nei dati per trovare dei modelli. Hanno scoperto che con le tecniche tradizionali di integrazione dei dati, passavano la maggior parte del loro tempo nella logistica piuttosto che nell'apprendimento dei dati. Questo non è sostenibile se vogliamo arrivare più velocemente alle informazioni utili.

Un data fabric è essenzialmente un livello operativo di dati che non solo riunisce tutti i dati, ma li trasforma e li elabora utilizzando il machine learning per scoprire modelli e informazioni utili. Senza un data fabric, tutto questo deve avvenire in ogni singola applicazione, il che non è una soluzione molto sostenibile.

Un data fabric può preparare i dati per soddisfare le esigenze di IA e ML automaticamente e a livelli sostenibili. Il machine learning può fornire i dati e gli approfondimenti in modo proattivo, aiutando i decisori ad avere intuizioni migliori e informazioni più tempestive. I risultati desiderabili risiedono nella scoperta tramite i dati di fatti nascosti senza essere specificamente cercati o richiesti, mentre si trovano soluzioni per problemi o informazioni aziendali.

Rischi con il data fabric

Una preoccupazione crescente per le organizzazioni è la minaccia alla sicurezza dei dati quando vengono trasportati da un punto all'altro del data fabric. È obbligatorio che l'infrastruttura per il trasporto dei dati incorpori firewall e protocolli di sicurezza per garantire protezione da eventuali violazioni. Con un numero crescente di attacchi informatici che colpiscono le organizzazioni, la sicurezza dei dati in tutti i punti del loro ciclo è fondamentale.

Vantaggi del data fabric

Il data fabric è ideale per le organizzazioni che sono geograficamente diverse, hanno a disposizione più fonti di dati e affrontano problemi relativi ai dati o casi d'uso complessi. Ricorda, un data fabric non è una risposta rapida per integrare ed elaborare i tuoi dati. Per quello, puoi rivolgerti alla data virtualization.

Con i continui progressi nelle potenzialità hardware, la globalizzazione si sta espandendo in regioni precedentemente non connesse. Con le velocità di connessione che aumentano vertiginosamente, le organizzazioni possono essere subissate di dati provenienti da dispositivi e servizi. Mentre per un bel po' di tempo i dati sono stati utilizzati per gli approfondimenti, il data fabric fornisce una soluzione che comprende:

  • Un modello agile che permette modifiche ai sistemi, si adatta e si regola secondo le necessità e funziona su tutti i sistemi operativi e di archiviazione
  • Scalabile con interferenze minime, nessun investimento in hardware enormemente costoso o personale altamente qualificato e oneroso
  • Fornendo la massima integrità e rispettando le regolamentazioni, pur mantenendo l'accessibilità e il flusso di informazioni in tempo reale

Le enormi quantità di dati a cui le aziende possono accedere devono essere sfruttate per ricavare informazioni esclusive. Le aree che includono la previsione, le vendite e l'ottimizzazione della catena di approvvigionamento, il marketing e il comportamento dei consumatori offrono all'organizzazione un vantaggio competitivo e la leadership dei dati nel suo campo. La derivazione di informazioni utili in tempo reale può posizionare l'organizzazione un gradino sopra alle altre.