Che cos'è la Data Virtualization?
Il software di data virtualization funge da ponte tra fonti di dati multiple e diverse, combinando i dati decisionali critici in un luogo virtuale per potenziare gli analytics.
La data virtualization fornisce un data layer innovativo che permette agli utenti di accedere, combinare, trasformare e fornire set di dati con una velocità e un rapporto costi-efficacia rivoluzionari. La tecnologia di data virtualization offre agli utenti un accesso veloce ai dati presenti all'interno di tutta l'azienda - compresi i database tradizionali, le fonti di big data e i sistemi cloud e IoT - a una frazione dei tempi e dei costi dell'immagazzinamento fisico e dell'estrazione/trasformazione/caricamento (ETL).
Con la data virtualization, gli utenti possono applicare una gamma di analisi, comprese le analisi visualizzate, predittive e la streaming analytics, su dati nuovi e aggiornati al minuto. Attraverso la governance e la sicurezza integrate, gli utenti della data virtualization sono sicuri che i loro dati siano coerenti, di alta qualità e protetti. Inoltre, la data virtualization consente di avere dati più orientati al business, trasformando le strutture e la sintassi native IT in servizi di dati di facile comprensione e curati dall'IT, facili da trovare e utilizzare tramite una directory aziendale self-service.
La data virtualization supporta più linee di business, centinaia di progetti e migliaia di utenti che possono aumentare da un singolo progetto a scala aziendale.

Fonti di dati comuni virtualizzate attraverso il software di Data Virtualization
- App pacchettizzate
- RDBMS
- Excel & flat file
- Data warehouse
- Data lake
- Big Data
- Documenti XML
- Dati Cloud
- Servizi Web
- Dati IoT
Sistemi comuni usati con la data virtualization
- Oracle
- SQL Server
- Teradata
- Netezza
- DB2
- Hive
- Impala
- Sharepoint
- Excel
- File piatti
- Amazon Redshift
- Google Big Query
- Spark
- Drill
- REST
- OData
Le 4 principali funzionalità che dovrebbe avere un sistema di data virtualization
Sono necessarie quattro componenti per soddisfare i bisogni urgenti del business con la data virtualization
Progettazione e sviluppo agili: è necessario essere in grado di introspezionare i dati disponibili, scoprire relazioni nascoste, modellare singole viste/servizi, convalidare viste/servizi e modificare come richiesto. Queste capacità automatizzano il lavoro difficile, migliorano il tempo per la soluzione e aumentano il riutilizzo degli oggetti.
Runtime ad alte prestazioni: l'applicazione richiama una richiesta, la query ottimizzata esegue un singolo statement, e il risultato viene rilasciato in modo appropriato. Questa funzionalità permette di avere dati aggiornati in tempo reale, prestazioni ottimizzate e meno repliche.
Uso del caching dove appropriato: con il caching di dati essenziali, l'applicazione richiama una richiesta, una query ottimizzata (sfruttando i dati della cache) viene eseguita e i dati vengono consegnati nella forma corretta. Questa funzionalità aumenta le prestazioni, evita i vincoli di rete e permette una disponibilità 24x7.
Directory/catalog aziendale per rendere i dati facili da trovare: questa funzionalità include funzioni per la ricerca e la categorizzazione dei dati, la navigazione in tutti i dati disponibili, la selezione da una directory di viste e la collaborazione con l'Ufficio informatico per migliorare la data quality e l'utilità degli stessi. Inoltre permette agli utenti aziendali di disporre di più dati, migliora l'efficacia dell'IT e degli utenti aziendali e consente una più ampia adozione della data virtualization.
Quali sono alcuni casi d'uso della data virtualization?
- Casi d'uso delle analytics
- Prototipazione della data integration fisica
- Accesso ai dati/strato semantico per le analytics
- Logical Data Warehouse
- Preparazione dei dati
- Vincoli normativi sullo spostamento dei dati
- Casi d'uso operativi
- Layer astratto di accesso ai dati/archivio dati operazionale (ODS) virtuale
- Master Data Management in stile registro
- Migrazione del sistema legacy
- Accesso ai dati dell'applicazione
- Vincoli normativi sullo spostamento dei dati
- Casi d'uso emergenti
- Condivisione dei dati nel cloud
- Accesso agli edge data nell'integrazione IoT
- Abilitazione dell'hub di dati
- Integrazione di dati e contenuti
- Vincoli normativi sullo spostamento dei dati
I vantaggi della Data Virtualization
Accelerazione del valore del business: le applicazioni di Analytics possono essere applicate prima e un valore maggiore può essere raggiunto più velocemente quando vengono apportate modifiche
Miglioramento business insight: dati più completi, aggiornati, di facile accesso e comprensione, che richiedono meno sforzo rispetto all'ETL
Evitamento dei costi di sviluppo: i servizi di dati riutilizzabili e lo sviluppo e la convalida interattiva migliorano la qualità ed evitano la rilavorazione per i nuovi progetti
Riduzione dei costi dell'infrastruttura di data management: i minori costi dell'infrastruttura e il minor numero di licenze da acquistare e ammortizzare si traducono in costi di assistenza e manutenzione ridotti
In che modo i vari settori industriali usano la Data Virtualization?
- Comunicazioni & Tecnologia
- Differenziare i servizi di ricerca di mercato
- Aumentare le entrate per cliente
- Costruire un data lake virtuale per il cliente
- Consentire un'innovazione all'avanguardia
- Creare un ODS in tempo reale per la fatturazione e il marketing
- Ottimizzare l'assistenza clienti
- Gestire i diritti dei clienti
- Migliorare le insight dei clienti
- Energy
- Ottimizzare la produzione di energia a monte
- Migliorare la manutenzione e la riparazione dei pozzi
- Analizzare i dati della piattaforma offshore
- Ottimizzare i processi di raffineria incrociati
- Fornire la master data quality di SAP
- Servizi finanziari
- Gestire il reddito a rischio fisso
- Migliorare la riconciliazione commerciale
- Accelerare l'integrazione dei nuovi clienti
- Affrontare la complessità dei dati ipotecari
- Arricchire i clienti della gestione di cassa
- Potenziare la democrazia dei dati
- Pubblica amministrazione
- Proteggere l'ambiente
- Sanità
- Guidare l'innovazione di nuovi prodotti
- Accelerare le sinergie di M&A
- Fornire un'analisi dei sinistri più efficiente
- Migliorare la cura del paziente
- Manufacturing
- Ottimizzare una supply chain globale
- Ottimizzare fabbriche e logistica
- Differenziare attraverso la digitalizzazione
- Migliora l'utilizzo delle risorse IT
Introduzione alla Data Virtualization
L'implementazione di maggior valore della Data Virtualization è un data layer virtualizzato ad alta velocità. Un tale layer permette una gestione e una governance solide, fornendo anche un accesso self-service ai dati critici, organizzandoli per scalabilità e mettendoli a disposizione in modo economico per le applicazioni e i sistemi di analisi.
Tuttavia, la maggior parte delle implementazioni di Data Virtualization inizia in piccolo e si espande. Una modalità comune di iniziare è con un team di piccole dimensioni e concentrato, incaricato di uno o più progetti. Un piccolo team può essere versatile pur accettando qualche incertezza. (I team devono essere agili per muoversi velocemente e completare diverse iterazioni di progetti di dati).
Il passo successivo è quello di consegnare i set di dati del progetto mentre viene costruito il livello dei dati. Questo passo affronta diverse sfide relative ai dati, tra cui requisiti in evoluzione, fonti multiple, tipi di dati misti, dati aggiornati in tempo reale, dati al di fuori del data warehouse, dati troppo grandi da integrare fisicamente e dati al di fuori del firewall.
I team devono anche dare priorità ai loro progetti di data virtualization in base al valore aziendale e alla facilità di implementazione della data virtualization. Maggiore è il valore aziendale e la facilità di implementazione, maggiore è la priorità del progetto. La data virtualization, e le persone che la implementano, devono anche evolversi per riutilizzare vari servizi di dati nel livello di applicazione, nel livello di business e nel livello di origine.

How do various industry sectors use data virtualization?
- Communications & Technology
- Differentiating market research services
- Increasing revenue per customer
- Building a virtual customer data lake
- Enabling leading-edge innovation
- Creating a real-time ODS for billing and marketing
- Optimizing customer care
- Managing customer entitlements
- Improving customer insights
- Energy
- Optimizing upstream energy production
- Improving well maintenance and repair
- Analyzing offshore platform data
- Optimizing cross-refinery processes
- Providing SAP master data quality
- Financial Services
- Managing fixed-risk income
- Improving trade reconciliation
- Accelerating new client onboarding
- Addressing mortgage data complexity
- Enriching cash management clients
- Empowering data democracy
- Government
- Protecting the environment
- Healthcare
- Driving new product innovation
- Accelerating M&A synergies
- Providing more efficient claims analysis
- Improving patient care
- Manufacturing
- Optimizing a global supply chain
- Optimizing factories and logistics
- Differentiating via digitization
- Improving IT asset utilization
Getting Started with Data Virtualization
The highest value implementation of data virtualization is a high-speed, virtualized data layer. Such a layer allows for robust management and governance, while also delivering self-service access to critical data, organizing it for scale, and making it available in a cost-effective manner to applications and analytics systems.
However, most data virtualization implementations start small and expand. A common way of starting is with a small and focused team charged with one or more projects. A small team can be versatile while also accepting some uncertainty. (Teams must be agile to move fast and complete several iterations of data projects.)
The next step is to deliver project datasets as the data layer is being built. This step addresses several data challenges including evolving requirements, multiple sources, mixed data types, up-to-the-minute data, data outside of the data warehouse, data too large to physically integrate, and data outside the firewall.
Teams also need to prioritize their data virtualization projects based on business value and ease of data virtualization implementation. The greater the business value and implementation ease, the higher the project’s priority. Data virtualization, and the people who implement it, also need to evolve to reuse various data services in the application layer, business layer, and source layer.