Was genau ist Datenvirtualisierung?
Datenvirtualisierungssoftware dient als Brücke über mehrere verschiedene Datenquellen hinweg und bringt zur Förderung der Analyse kritische entscheidungsrelevante Daten an einem virtuellen Ort zusammen.
Die Daten-Virtualisierung bietet eine moderne Datenschicht, mit der Benutzer mit bahnbrechender Geschwindigkeit und Kostengünstigkeit auf Datensätze zugreifen, diese kombinieren, transformieren und bereitstellen können. Die Datenvirtualisierungstechnologie bietet Benutzern einen schnellen Zugriff auf Daten, die im gesamten Unternehmen— untergebracht sind - einschließlich traditioneller Datenbanken, Big Data-Quellen sowie Cloud- und IoT-Systeme— - zu einem Bruchteil der Zeit und Kosten für die physische Lagerhaltung und Extrakt/Transformation/Laden (ETL, extract/transform/load).
Mit der Daten-Virtualisierung können Benutzer eine Reihe von Analysen — einschließlich visualisierter, prädiktiver und Streaming-Analytik — auf neue, aktuelle Datenaktualisierungen anwenden. Durch integrierte Governance und Sicherheit können Benutzer der Daten-Virtualisierung sicher sein, dass ihre Daten konsistent, hochwertig und geschützt sind. Darüber hinaus ermöglicht die Daten-Virtualisierung unternehmensgerechtere Daten und wandelt native IT-Strukturen und Syntax in leicht verständliche, IT-kuratierte Datendienste um, die über ein Selfservice-Unternehmensverzeichnis leicht zu finden und zu verwenden sind.
Die Daten-Virtualisierung unterstützt mehrere Geschäftsbereiche, Hunderte von Projekten und Tausende von Benutzern, die vom Projekt- auf den unternehmensweiten Bereich steigen können.

Gemeinsame Datenquellen, die durch Datenvirtualisierungssoftware virtualisiert werden
- Standard-Apps
- RDBMS
- Excel- und Flatfile
- Data-Warehouses
- Angesehene Daten
- Umfangreiche Daten
- XML-Dokumente
- Cloud-Daten
- Webservices
- IoT-Daten
Gängige Systeme, bei denen die Daten-Virtualisierung verwendet wird
- Oracle
- SQL-Server
- Teradata
- Netezza
- DB2
- Hive
- Impala
- SharePoint
- Excel
- Flatfiles
- Amazon Redshift
- Google Big Query
- Spark
- Drill
- REST
- OData
Die vier wichtigsten Funktionen, die ein Datenvirtualisierungssystem haben sollte
Vier Komponenten werden benötigt, um dringende Geschäftsanforderungen mit Daten-Virtualisierung zu erfüllen
Agiles Design und Entwicklung: Sie müssen in der Lage sein, verfügbare Daten zu überprüfen, verborgene Beziehungen zu entdecken, individuelle Ansichten/Dienstleistungen zu modellieren, Ansichten/Dienstleistungen zu validieren und nach Bedarf zu ändern. Diese Funktionen automatisieren schwierige Aufgaben, verbessern die Lösungszeit und erhöhen die Wiederverwendung von Objekten.
Laufzeit der hochleistungsstarken Systeme: Die Anwendung ruft eine Anfrage auf, die optimierte Abfrage führt eine einzelne Anweisung aus und das Ergebnis wird in der richtigen Form geliefert. Diese Funktion ermöglicht aktuelle Daten, optimierte Performance und weniger Replikation.
Verwendung des Cachings bei Bedarf: Caching wichtiger Daten, die Anwendung ruft eine Anfrage auf, eine optimierte Abfrage (die zwischengespeicherte Daten nutzt) wird ausgeführt und die Daten werden in der richtigen Form bereitgestellt. Diese Funktion steigert die Leistung, vermeidet Netzwerkeinschränkungen und ermöglicht eine Verfügbarkeit rund um die Uhr.
Geschäftsverzeichnis/Katalog zur leichten Auffindung von Daten: Dieses Merkmal umfasst Funktionen zur Suche und Datenkategorisierung, zum Durchsuchen aller verfügbaren Daten, zur Auswahl aus einem Verzeichnis von Ansichten und die Zusammenarbeit mit der IT, um die Datenqualität und -nutzbarkeit zu verbessern. Diese Funktion versorgt Business-Anwender mit mehr Daten, verbessert die Effektivität von IT-/Business-Anwendern und Benutzern und ermöglicht eine breitere Nutzung der Daten-Virtualisierung.
Was sind Anwendungsszenarien bei der Daten-Virtualisierung?
- Anwendungsszenarien für Analytik
- Prototypenerstellung der physikalischen Datenintegration
- Datenzugriff/semantische Schicht für Analysen
- Logisches Data-Warehouse
- Datenaufbereitung
- Gesetzliche Einschränkungen bei der Verschiebung von Daten
- Operative Anwendungsszenarien
- Schicht für den Zugriff auf abstrakte Daten/virtuelle Operational Data Store (ODS)
- Stammdatenverwaltung im Registerstil
- Migration von Altsystemen
- Zugriff auf Anwendungsdaten
- Gesetzliche Einschränkungen bei der Verschiebung von Daten
- Aufkommende Anwendungsszenarien
- Austausch von Cloud-Daten
- Edge-Datenzugriff bei IoT-Integration
- Datendrehscheibe-Unterstützung
- Daten- und Content-Integration
- Gesetzliche Einschränkungen bei der Verschiebung von Daten
Die Vorteile der Daten-Virtualisierung
Beschleunigung des Geschäftswerts: Analyse-Anwendungen können früher angewendet werden und ein größerer Mehrwert kann schneller erreicht werden, wenn Änderungen auftreten
Verbesserung der Geschäftserkenntnisse: Vollständigere, aktuellere, leichter zugängliche und verständlichere Daten, die weniger Aufwand erfordern als ETL
Vermeidung von Entwicklungskosten: Wiederverwendbare Datendienste und interaktive Entwicklung und Validierung verbessern die Qualität und vermeiden die Überarbeitung für neue Projekte
Kostensenkung der Datenverwaltungsinfrastruktur: Niedrigere Infrastrukturkosten und weniger Lizenzen zum Kauf und zur Abwertung führen zu niedrigeren Support- und Wartungskosten
Wie nutzen verschiedene Branchen die Daten-Virtualisierung?
- Kommunikationen und Technologien
- Differenzierung von Marktforschungsdienstleistungen
- Steigender Umsatz pro Kunde
- Aufbau eines virtuellen Data Lakes von Kunden
- Ermöglichung von führenden Innovationen
- Erstellen eines Echtzeit-ODS zur Abrechnung und zum Marketing
- Optimierung der Kundenbetreuung
- Verwaltung von Kundenansprüchen
- Verbesserung der Kundeneinblicke
- Energie
- Optimierung der vorgelagerten Energieproduktion
- Verbesserung der Wartung und Reparatur von Datenspeichern
- Analyse von Offshore-Plattformdaten
- Optimierung von Raffinerie-übergreifenden Prozessen
- Bereitstellung von SAP-Stammdaten-Qualität
- Finanzdienstleister
- Verwaltung von festverzinslichem Einkommen
- Verbesserung der Handelsabstimmung
- Schnelleres Onboarding neuer Kunden
- Bewältigung der Komplexität von Hypothekendaten
- Bereicherung von Cash-Management-Kunden
- Stärkung der Datendemokratie
- Behörden
- Umweltschutz
- Gesundheitswesen
- Förderung neuer Produktinnovationen
- Beschleunigung von F&Ü-Synergien
- Bereitstellung einer effizienteren Schadensanalyse
- Verbesserung der Patientenversorgung
- Fertigung
- Optimierung einer globalen Lieferkette
- Optimierung von Fabriken und Logistik
- Differenzierung durch Digitalisierung
- Verbesserung der Nutzung von IT-Assets
Erste Schritte mit der Daten-Virtualisierung
Die Implementierung der Daten-Virtualisierung mit dem höchsten Wert ist eine virtualisierte Datenschicht mit hoher Geschwindigkeit. Eine solche Schicht ermöglicht ein robustes Management und Governance und bietet gleichzeitig einen Selfservice-Zugriff auf kritische Daten, organisiert sie für die Skalierung und stellt sie den Anwendungen und Analyse-Systemen kostengünstig zur Verfügung.
Die meisten Implementierungen der Daten-Virtualisierung beginnen jedoch klein und erweitern sich. Eine übliche Art, damit anzufangen, ist ein kleines und fokussiertes Team, das mit einem oder mehreren Projekten beauftragt wird. Ein kleines Team kann vielseitig sein und gleichzeitig eine gewisse Unsicherheit akzeptieren. (Die Teams müssen agil sein, um schnell voranzukommen und mehrere Iterationen von Datenprojekten abzuschließen.)
Der nächste Schritt besteht darin, Projekt-Datensätze zu liefern, während die Datenschicht erstellt wird. Dieser Schritt bewältigt mehrere Datenherausforderungen, darunter sich entwickelnde Anforderungen, mehrere Quellen, gemischte Datentypen, aktuelle Daten, Daten außerhalb des Data Warehouse, zu große Daten, die für eine physische Integration zu groß sind, und Daten außerhalb der Firewall.
Teams müssen auch ihre Datenvirtualisierungsprojekte auf der Grundlage des Geschäftswerts und der einfachen Implementierung der Daten-Virtualisierung priorisieren. Je leichter der Geschäftswert und die Implementierung werden, desto höher ist die Priorität des Projekts. Die Daten-Virtualisierung und die Mitarbeiter, die sie implementieren, müssen ebenfalls weiterentwickelt werden, um verschiedene Datendienste in der Anwendungsschicht, der Business-Schicht und der Quellenschicht wiederzuverwenden.

How do various industry sectors use data virtualization?
- Communications & Technology
- Differentiating market research services
- Increasing revenue per customer
- Building a virtual customer data lake
- Enabling leading-edge innovation
- Creating a real-time ODS for billing and marketing
- Optimizing customer care
- Managing customer entitlements
- Improving customer insights
- Energy
- Optimizing upstream energy production
- Improving well maintenance and repair
- Analyzing offshore platform data
- Optimizing cross-refinery processes
- Providing SAP master data quality
- Financial Services
- Managing fixed-risk income
- Improving trade reconciliation
- Accelerating new client onboarding
- Addressing mortgage data complexity
- Enriching cash management clients
- Empowering data democracy
- Government
- Protecting the environment
- Healthcare
- Driving new product innovation
- Accelerating M&A synergies
- Providing more efficient claims analysis
- Improving patient care
- Manufacturing
- Optimizing a global supply chain
- Optimizing factories and logistics
- Differentiating via digitization
- Improving IT asset utilization
Getting Started with Data Virtualization
The highest value implementation of data virtualization is a high-speed, virtualized data layer. Such a layer allows for robust management and governance, while also delivering self-service access to critical data, organizing it for scale, and making it available in a cost-effective manner to applications and analytics systems.
However, most data virtualization implementations start small and expand. A common way of starting is with a small and focused team charged with one or more projects. A small team can be versatile while also accepting some uncertainty. (Teams must be agile to move fast and complete several iterations of data projects.)
The next step is to deliver project datasets as the data layer is being built. This step addresses several data challenges including evolving requirements, multiple sources, mixed data types, up-to-the-minute data, data outside of the data warehouse, data too large to physically integrate, and data outside the firewall.
Teams also need to prioritize their data virtualization projects based on business value and ease of data virtualization implementation. The greater the business value and implementation ease, the higher the project’s priority. Data virtualization, and the people who implement it, also need to evolve to reuse various data services in the application layer, business layer, and source layer.