Che cos'è la Data Virtualization?

Il software di data virtualization funge da ponte tra fonti di dati multiple e diverse, combinando i dati decisionali critici in un luogo virtuale per potenziare gli analytics.

La data virtualization fornisce un data layer innovativo che permette agli utenti di accedere, combinare, trasformare e fornire set di dati con una velocità e un rapporto costi-efficacia rivoluzionari. La tecnologia di data virtualization offre agli utenti un accesso veloce ai dati presenti all'interno di tutta l'azienda - compresi i database tradizionali, le fonti di big data e i sistemi cloud e IoT - a una frazione dei tempi e dei costi dell'immagazzinamento fisico e dell'estrazione/trasformazione/caricamento (ETL).

La data virtualization fornisce un accesso immediato ai dati per analisi veloci

Con la data virtualization, gli utenti possono applicare una gamma di analisi, comprese le analisi visualizzate, predittive e la streaming analytics, su dati nuovi e aggiornati al minuto. Attraverso la governance e la sicurezza integrate, gli utenti della data virtualization sono sicuri che i loro dati siano coerenti, di alta qualità e protetti. Inoltre, la data virtualization consente di avere dati più orientati al business, trasformando le strutture e la sintassi native IT in servizi di dati di facile comprensione e curati dall'IT, facili da trovare e utilizzare tramite una directory aziendale self-service.

La data virtualization supporta più linee di business, centinaia di progetti e migliaia di utenti che possono aumentare da un singolo progetto a scala aziendale.

Dieci cose che devi sapere sulla data virtualization
Dieci cose che devi sapere sulla data virtualization
Scopri i punti chiave sulla data virtualization per poter superare le criticità e ottenere risultati migliori.

Fonti di dati comuni virtualizzate attraverso il software di Data Virtualization

  • App pacchettizzate
  • RDBMS
  • Excel & flat file
  • Data warehouse
  • Data lake
  • Big Data
  • Documenti XML
  • Dati Cloud
  • Servizi Web
  • Dati IoT

Sistemi comuni usati con la data virtualization

  • Oracle
  • SQL Server
  • Teradata
  • Netezza
  • DB2
  • Hive
  • Impala
  • Sharepoint
  • Excel
  • File piatti
  • Amazon Redshift
  • Google Big Query
  • Spark
  • Drill
  • REST
  • OData

Le 4 principali funzionalità che dovrebbe avere un sistema di data virtualization

Sono necessarie quattro componenti per soddisfare i bisogni urgenti del business con la data virtualization

Progettazione e sviluppo agili: è necessario essere in grado di introspezionare i dati disponibili, scoprire relazioni nascoste, modellare singole viste/servizi, convalidare viste/servizi e modificare come richiesto. Queste capacità automatizzano il lavoro difficile, migliorano il tempo per la soluzione e aumentano il riutilizzo degli oggetti.

Runtime ad alte prestazioni: l'applicazione richiama una richiesta, la query ottimizzata esegue un singolo statement, e il risultato viene rilasciato in modo appropriato. Questa funzionalità permette di avere dati aggiornati in tempo reale, prestazioni ottimizzate e meno repliche.

Uso del caching dove appropriato: con il caching di dati essenziali, l'applicazione richiama una richiesta, una query ottimizzata (sfruttando i dati della cache) viene eseguita e i dati vengono consegnati nella forma corretta. Questa funzionalità aumenta le prestazioni, evita i vincoli di rete e permette una disponibilità 24x7.

Directory/catalog aziendale per rendere i dati facili da trovare: questa funzionalità include funzioni per la ricerca e la categorizzazione dei dati, la navigazione in tutti i dati disponibili, la selezione da una directory di viste e la collaborazione con l'Ufficio informatico per migliorare la data quality e l'utilità degli stessi. Inoltre permette agli utenti aziendali di disporre di più dati, migliora l'efficacia dell'IT e degli utenti aziendali e consente una più ampia adozione della data virtualization.

Quali sono alcuni casi d'uso della data virtualization?

  • Casi d'uso delle analytics
    • Prototipazione della data integration fisica
    • Accesso ai dati/strato semantico per le analytics
    • Logical Data Warehouse
    • Preparazione dei dati
    • Vincoli normativi sullo spostamento dei dati
  • Casi d'uso operativi
    • Layer astratto di accesso ai dati/archivio dati operazionale (ODS) virtuale
    • Master Data Management in stile registro
    • Migrazione del sistema legacy
    • Accesso ai dati dell'applicazione
    • Vincoli normativi sullo spostamento dei dati
  • Casi d'uso emergenti
    • Condivisione dei dati nel cloud
    • Accesso agli edge data nell'integrazione IoT
    • Abilitazione dell'hub di dati
    • Integrazione di dati e contenuti
    • Vincoli normativi sullo spostamento dei dati

I vantaggi della Data Virtualization

Accelerazione del valore del business: le applicazioni di Analytics possono essere applicate prima e un valore maggiore può essere raggiunto più velocemente quando vengono apportate modifiche

Miglioramento business insight: dati più completi, aggiornati, di facile accesso e comprensione, che richiedono meno sforzo rispetto all'ETL

Evitamento dei costi di sviluppo: i servizi di dati riutilizzabili e lo sviluppo e la convalida interattiva migliorano la qualità ed evitano la rilavorazione per i nuovi progetti

Riduzione dei costi dell'infrastruttura di data management: i minori costi dell'infrastruttura e il minor numero di licenze da acquistare e ammortizzare si traducono in costi di assistenza e manutenzione ridotti

In che modo i vari settori industriali usano la Data Virtualization?

  • Comunicazioni & Tecnologia
    • Differenziare i servizi di ricerca di mercato
    • Aumentare le entrate per cliente
    • Costruire un data lake virtuale per il cliente
    • Consentire un'innovazione all'avanguardia
    • Creare un ODS in tempo reale per la fatturazione e il marketing
    • Ottimizzare l'assistenza clienti
    • Gestire i diritti dei clienti
    • Migliorare le insight dei clienti
  • Energy
    • Ottimizzare la produzione di energia a monte
    • Migliorare la manutenzione e la riparazione dei pozzi
    • Analizzare i dati della piattaforma offshore
    • Ottimizzare i processi di raffineria incrociati
    • Fornire la master data quality di SAP
  • Servizi finanziari
    • Gestire il reddito a rischio fisso
    • Migliorare la riconciliazione commerciale
    • Accelerare l'integrazione dei nuovi clienti
    • Affrontare la complessità dei dati ipotecari
    • Arricchire i clienti della gestione di cassa
    • Potenziare la democrazia dei dati
  • Pubblica amministrazione
    • Proteggere l'ambiente
  • Sanità
    • Guidare l'innovazione di nuovi prodotti
    • Accelerare le sinergie di M&A
    • Fornire un'analisi dei sinistri più efficiente
    • Migliorare la cura del paziente
  • Manufacturing
    • Ottimizzare una supply chain globale
    • Ottimizzare fabbriche e logistica
    • Differenziare attraverso la digitalizzazione
    • Migliora l'utilizzo delle risorse IT

Introduzione alla Data Virtualization

L'implementazione di maggior valore della Data Virtualization è un data layer virtualizzato ad alta velocità. Un tale layer permette una gestione e una governance solide, fornendo anche un accesso self-service ai dati critici, organizzandoli per scalabilità e mettendoli a disposizione in modo economico per le applicazioni e i sistemi di analisi.

Tuttavia, la maggior parte delle implementazioni di Data Virtualization inizia in piccolo e si espande. Una modalità comune di iniziare è con un team di piccole dimensioni e concentrato, incaricato di uno o più progetti. Un piccolo team può essere versatile pur accettando qualche incertezza. (I team devono essere agili per muoversi velocemente e completare diverse iterazioni di progetti di dati).

Il passo successivo è quello di consegnare i set di dati del progetto mentre viene costruito il livello dei dati. Questo passo affronta diverse sfide relative ai dati, tra cui requisiti in evoluzione, fonti multiple, tipi di dati misti, dati aggiornati in tempo reale, dati al di fuori del data warehouse, dati troppo grandi da integrare fisicamente e dati al di fuori del firewall.

I team devono anche dare priorità ai loro progetti di data virtualization in base al valore aziendale e alla facilità di implementazione della data virtualization. Maggiore è il valore aziendale e la facilità di implementazione, maggiore è la priorità del progetto. La data virtualization, e le persone che la implementano, devono anche evolversi per riutilizzare vari servizi di dati nel livello di applicazione, nel livello di business e nel livello di origine.