Qu'est-ce que la Data Virtualization ?

Le logiciel de Data Virtualization agit comme un pont entre des sources de données multiples et diverses, rassemblant les données essentielles à la prise de décision en un seul endroit virtuel pour alimenter les analyses.

La Data Virtualization fournit une couche de données moderne qui permet aux utilisateurs d'accéder à des ensembles de données, de les combiner, de les transformer et de les livrer à une vitesse et une rentabilité révolutionnaires. La technologie de Data Virtualization permet aux utilisateurs d'accéder rapidement aux données hébergées dans l'ensemble de l'entreprise, y compris dans les bases de données traditionnelles, les sources de big data et les systèmes cloud et IoT, pour une fraction du temps et du coût de l'entreposage physique et de l'extraction/transformation/chargement (ETL).

La Data Virtualization permet d'accéder facilement aux données pour une analyse rapide.

Grâce à la Data Virtualization, les utilisateurs peuvent appliquer toute une gamme d'analyses, y compris des analyses visualisées, prédictives et en continu, sur des mises à jour de données fraîches et actualisées à la minute près. Grâce à une gouvernance et une sécurité intégrées, les utilisateurs de la Data Virtualization sont assurés de la cohérence, de l'extrême qualité et de la protection de leurs données. En outre, la Data Virtualization permet d'obtenir des données plus conviviales pour l'entreprise, en transformant les structures et la syntaxe informatiques natives en services de données faciles à comprendre, élaborés par l'informatique et faciles à trouver et à utiliser via un répertoire professionnel en libre-service.

La Data Virtualization prend en charge plusieurs secteurs d'activité, des centaines de projets et des milliers d'utilisateurs qui peuvent passer de l'échelle du projet à celle de l'entreprise.

Dix choses à savoir sur la Data Virtualization
Dix choses à savoir sur la Data Virtualization
Apprenez les vérités fondamentales sur la Data Virtualization afin de surmonter les goulets d'étranglement des données et obtenir de meilleurs résultats.

Sources de données communes virtualisées grâce à un logiciel de Data Virtualization

  • Progiciels
  • SGBDR
  • Excel et fichiers plats
  • Entrepôts de données
  • Lacs de données
  • des projets Big Data.
  • Documents XML
  • Données cloud
  • Services Web
  • Données IoT

Systèmes communs utilisés avec la Data Virtualization

  • Oracle
  • SQL Server
  • Teradata
  • Netezza
  • DB2
  • Hive
  • Impala
  • Sharepoint
  • Excel
  • Fichiers plats
  • Amazon Redshift
  • Google Big Query
  • Spark
  • Drill
  • REST
  • OData

Les 4 principales capacités que devrait posséder un système de Data Virtualization

Quatre éléments sont nécessaires pour répondre aux besoins urgents des entreprises avec la Data Virtualization

Conception et développement agiles : Vous devez pouvoir faire une introspection des données disponibles, découvrir les relations cachées, modéliser les vues/services individuels, valider les vues/services et les modifier si nécessaire. Ces capacités permettent d'automatiser les tâches difficiles, d'améliorer le délai de mise en œuvre de la solution et d'accroître la réutilisation des objets.

Runtime haute performance : L'application invoque une requête, la requête optimisée exécute une seule instruction et le résultat est livré sous la forme appropriée. Cette capacité permet d'obtenir des données à la minute près, des performances optimisées et moins de réplication.

Utilisation de la mise en cache lorsque cela est approprié : Mettant en cache les données essentielles, l'application invoque une demande, une requête optimisée (exploitant les données mises en cache) s'exécute et les données sont livrées sous la forme appropriée. Cette capacité accroît les performances, évite les contraintes de réseau et permet une disponibilité 24 heures sur 24, 7 jours sur 7.

Répertoire/catalogue d'entreprise pour faciliter la recherche de données : Cette fonctionnalité comprend des fonctions de recherche et de catégorisation des données, de navigation dans toutes les données disponibles, de sélection dans un répertoire de vues et de collaboration avec l'informatique pour améliorer la qualité et l'utilité des données. Cette fonctionnalité permet aux utilisateurs professionnels d'accéder à davantage de données, d'améliorer l'efficacité de l'informatique et des utilisateurs professionnels et d'adopter plus largement la Data Virtualization.

Quels sont les cas d'utilisation de la Data Virtualization ?

  • Cas d'utilisation de l'analyse
    • Prototypage de l'intégration physique des données
    • Accès aux données/couche sémantique pour l'analyse
    • Data warehouse logique
    • Préparation des données
    • Contraintes réglementaires sur le déplacement des données
  • Cas d'utilisation opérationnelle
    • Couche d'accès aux données abstraites/stockage virtuel de données opérationnelles (ODS)
    • Gestion des données de référence de type registre
    • Migration des systèmes existants
    • Accès aux données de l'application
    • Contraintes réglementaires sur le déplacement des données
  • Cas d'utilisation émergents
    • Partage de données en nuage
    • Accès aux données de bord dans l'intégration IoT
    • Activation du hub de données
    • Intégration des données et du contenu
    • Contraintes réglementaires sur le déplacement des données

Les avantages de la Data Virtualization

Accélération de la valeur commerciale : Les applications d'analyse peuvent être appliquées plus tôt et une plus grande valeur peut être atteinte plus rapidement au fur et à mesure que les changements se produisent.

Amélioration de la connaissance de l'entreprise : Des données plus complètes, à jour, faciles d'accès et compréhensibles, nécessitant moins d'efforts que l'ETL.

Évitement des coûts de développement : Les services de données réutilisables et le développement et la validation interactifs améliorent la qualité et évitent les reprises pour les nouveaux projets.

Réduction des coûts de l'infrastructure de gestion des données : La réduction des coûts d'infrastructure et la diminution du nombre de licences à acheter et à amortir entraînent une baisse des coûts de support et de maintenance.

Comment les différents secteurs industriels utilisent-ils la Data Virtualization ?

  • Communications et technologie
    • Différenciation des services d'études de marché
    • Augmenter le revenu par client
    • Construire un lac de données client virtuel
    • Favoriser l'innovation de pointe
    • Création d'un ODS en temps réel pour la facturation et le marketing
    • Optimiser le service à la clientèle
    • Gestion des droits des clients
    • Améliorer la connaissance du client
  • Énergie
    • Optimiser la production d'énergie en amont
    • Améliorer l'entretien et la réparation des puits
    • Analyse des données des plates-formes offshore
    • Optimisation des procédés inter-raffineries
    • Assurer la qualité des données de base SAP
  • Services financiers
    • Gestion des revenus à risque fixe
    • Améliorer la réconciliation des échanges
    • Accélérer l'intégration des nouveaux clients
    • S'attaquer à la complexité des données hypothécaires
    • Enrichir les clients de la gestion de trésorerie
    • Renforcer la démocratie par les données
  • Autorités
    • Protéger l'environnement
  • Santé
    • Favoriser l'innovation en matière de nouveaux produits
    • Accélérer les synergies M&A
    • Fournir une analyse plus efficace des demandes d'indemnisation
    • Améliorer les soins aux patients
  • Industrie manufacturière
    • Optimiser une chaîne d'approvisionnement mondiale
    • Optimiser les usines et la logistique
    • Différenciation par la numérisation
    • Améliorer l'utilisation des actifs informatiques

Démarrer avec la Data Virtualization

La mise en œuvre de la Data Virtualization qui présente la plus grande valeur est une couche de données virtualisée à haut débit. Une telle couche permet une gestion et une gouvernance solides, tout en offrant un accès en libre-service aux données critiques, en les organisant à l'échelle et en les mettant à la disposition des applications et des systèmes d'analyse de manière rentable.

Cependant, la plupart des mises en œuvre de la Data Virtualization commencent à petite échelle et se développent. Une façon courante de commencer est de constituer une petite équipe ciblée chargée d'un ou plusieurs projets. Une petite équipe peut être polyvalente tout en acceptant une certaine incertitude. (Les équipes doivent être agiles pour agir rapidement et mener à bien plusieurs itérations de projets de données).

L'étape suivante consiste à fournir les ensembles de données du projet au fur et à mesure de la construction de la couche de données. Cette étape permet de relever plusieurs défis en matière de données, notamment l'évolution des exigences, la multiplicité des sources, la mixité des types de données, la mise à jour des dernières données, la présence de données en dehors de l'entrepôt de données, la présence de données trop volumineuses pour être intégrées physiquement et la présence de données en dehors du pare-feu.

Les équipes doivent également hiérarchiser leurs projets de Data Virtualization en fonction de la valeur commerciale et de la facilité de mise en œuvre de la Data Virtualization. Plus la valeur commerciale et la facilité de mise en œuvre sont grandes, plus la priorité du projet est élevée. La Data Virtualization, et les personnes qui la mettent en œuvre, doivent également évoluer pour réutiliser divers services de données dans la couche application, la couche métier et la couche source.

Data Virtualization Use Cases
Modernize Your Data and Analytics Architecture
Check out these 13 use cases to learn how to support today’s complex data and analytics landscape.

How do various industry sectors use data virtualization?

  • Communications & Technology
    • Differentiating market research services
    • Increasing revenue per customer
    • Building a virtual customer data lake
    • Enabling leading-edge innovation
    • Creating a real-time ODS for billing and marketing
    • Optimizing customer care
    • Managing customer entitlements
    • Improving customer insights
  • Energy
    • Optimizing upstream energy production
    • Improving well maintenance and repair
    • Analyzing offshore platform data
    • Optimizing cross-refinery processes
    • Providing SAP master data quality
  • Financial Services
    • Managing fixed-risk income
    • Improving trade reconciliation
    • Accelerating new client onboarding
    • Addressing mortgage data complexity
    • Enriching cash management clients
    • Empowering data democracy
  • Government
    • Protecting the environment
  • Healthcare
    • Driving new product innovation
    • Accelerating M&A synergies
    • Providing more efficient claims analysis
    • Improving patient care
  • Manufacturing
    • Optimizing a global supply chain
    • Optimizing factories and logistics
    • Differentiating via digitization
    • Improving IT asset utilization

Getting Started with Data Virtualization

The highest value implementation of data virtualization is a high-speed, virtualized data layer. Such a layer allows for robust management and governance, while also delivering self-service access to critical data, organizing it for scale, and making it available in a cost-effective manner to applications and analytics systems.

However, most data virtualization implementations start small and expand. A common way of starting is with a small and focused team charged with one or more projects. A small team can be versatile while also accepting some uncertainty. (Teams must be agile to move fast and complete several iterations of data projects.)

The next step is to deliver project datasets as the data layer is being built. This step addresses several data challenges including evolving requirements, multiple sources, mixed data types, up-to-the-minute data, data outside of the data warehouse, data too large to physically integrate, and data outside the firewall.

Teams also need to prioritize their data virtualization projects based on business value and ease of data virtualization implementation. The greater the business value and implementation ease, the higher the project’s priority. Data virtualization, and the people who implement it, also need to evolve to reuse various data services in the application layer, business layer, and source layer.