什麼是數據虛擬化?
數據虛擬化軟件充當跨多個不同數據源的橋樑,將關鍵的決策數據匯集到一個虛擬位置以推動分析。
數據虛擬化提供了一個現代數據層,使用戶能夠以突破性的速度和成本效益存取、組合、轉換和交付數據集。數據虛擬化技術使用戶能夠以實體倉儲和提取/轉換/加載 (ETL) 時間和成本的一小部分,快速存取整個企業中的數據,包括傳統數據庫、大數據源以及雲和物聯網系統中的數據。
通過數據虛擬化,用戶可以對最新的數據更新進行一系列分析——包括可視化、預測和流分析。通過整合的治理和安全性,數據虛擬化用戶可以確保他們的數據是一致的、高質量的並受到保護。此外,數據虛擬化會考慮到對業務更友好的數據,將原生 IT 結構和語法轉換為易於理解、IT 策劃的數據服務,這些服務易於通過自助服務業務目錄查找和使用。
數據虛擬化支持多條業務線、數百個項目和數以千計的用戶,這些用戶可以從項目擴展到企業级。

通過數據虛擬化軟體而被虛擬化的常用數據源
- 軟體包應用
- 關係型數據庫管理系統
- Excel 和平面文件
- 數據倉庫
- 數據湖
- 大數據
- XML 文檔
- 雲端數據
- 網頁服務
- 物聯網數據
與數據虛擬化一起使用的常用系統
- 甲骨文
- 數據庫服務器
- Teradata
- Netezza
- 數據庫2
- Hive
- Impala
- Sharepoint
- 電子表格
- 平面文件
- Amazon Redshift
- Google Big Query
- Spark
- Drill
- REST
- OData
數據虛擬化系統應具備的 4 大功能
需要四個組件才能通過數據虛擬化滿足緊迫的業務需求
敏捷設計和開發:您需要能夠如實觀察可用數據、發現隱藏的關係、對單個視圖/服務進行建模、驗證視圖/服務並根據需要進行修改。這些功能可自動執行困難的工作、縮短解決方案的時間並提高對象重用率。
高性能運行時:應用程序調用請求,優化查詢執行單個語句,結果以適當的形式交付。此功能允許提供最新數據、優化性能和減少複製。
適當時使用緩存:緩存基本數據,應用程序調用請求,執行優化查詢(利用緩存數據),並以適當的形式交付數據。此功能可提高性能、避免網絡限制並允許全天候可用性。
使數據易於查找的業務目錄/目錄:此功能包括用於搜索和數據分類、瀏覽所有可用數據、從視圖目錄中進行選擇以及與 IT 協作以提高數據質量和實用性的功能。此功能可為業務用戶提供更多數據,提高 IT/業務用戶效率,並使數據虛擬化得到更廣泛的採用。
有哪些數據虛擬化用例?
- 分析用例
- 物理數據集成原型
- 用於分析的數據訪問/語義層
- 邏輯數據倉儲
- 數據準備
- 移動數據的監管限制
- 操作用例
- 抽像數據訪問層/虛擬操作數據存儲(ODS)
- 註冊表式主數據管理
- 舊系統遷移
- 應用數據訪問
- 移動數據的監管限制
- 新興用例
- 雲端數據共享
- 物聯網集成中的邊緣數據訪問
- 數據中心啟用
- 數據和內容集成
- 移動數據的監管限制
數據虛擬化的好處
業務價值加速:隨著變化的發生,可以更快地應用分析應用程序並更快地獲得更大的價值
業務洞察力改進:更完整、最新、易於訪問和理解的數據,比 ETL 需要更少的努力
避免開發成本:可重用的數據服務和交互式開發和驗證可提高質量並避免新項目的返工
降低數據管理基礎設施成本:降低基礎設施成本,減少購買和折舊的許可證,從而降低支持和維護成本
各個行業如何使用數據虛擬化?
- 通訊與科技
- 差異化的市場研究服務
- 增加每位客戶的收入
- 構建虛擬客戶數據湖
- 實現前沿創新
- 為計費和營銷創建實時 ODS
- 優化客戶關懷
- 管理客戶權利
- 提高客戶洞察力
- 能源業
- 優化上游能源生產
- 改善油井維護和修理
- 分析海上平台數據
- 優化交叉煉油廠流程
- 提供 SAP 主數據質量
- 金融服務
- 管理固定風險收入
- 改善貿易對賬
- 加速新客戶入職
- 解決抵押貸款數據的複雜性
- 豐富現金管理客戶
- 賦能數據民主
- 政府
- 保護環境
- 衛生保健
- 推動新產品創新
- 加速併購協同效應
- 提供更高效的理賠分析
- 改善患者護理
- 製造業
- 優化全球供應鏈
- 優化工廠和物流
- 通過數字化實現差異化
- 提高 IT 資產利用率
數據虛擬化入門
數據虛擬化的最高價值實現是高速且虛擬化的數據層。這樣的數據層允許強大的管理和治理,同時還提供對關鍵數據的自助訪問,組織它以進行擴展,並以划算的方式將其提供給應用程序和分析系統。
但是,大多數數據虛擬化實施都是從小規模開始並不斷擴展。一種常見的方式是由負責一個或多個項目的小型且專注的團隊開始。這個小團隊可以是多能的,同時也接受一些不確定性。 (團隊必須敏捷以快速行動並完成數據項目的多次重複。)
下一步是在構建數據層時交付項目數據集。此步驟解決了若干數據挑戰,包括不斷變化的需求、多源、混合數據類型、最新數據、數據庫外的數據、太大而無法以實體整合的數據以及防火牆外的數據。
團隊還需要根據業務價值和數據虛擬化實施的難易程度確定其數據虛擬化項目的優先級。商業價值和實施難度越大,項目的優先級就越高。數據虛擬化,以及其實施者,也需要逐步發展在應用層、業務層和源始層重用各種數據服務。

How do various industry sectors use data virtualization?
- Communications & Technology
- Differentiating market research services
- Increasing revenue per customer
- Building a virtual customer data lake
- Enabling leading-edge innovation
- Creating a real-time ODS for billing and marketing
- Optimizing customer care
- Managing customer entitlements
- Improving customer insights
- Energy
- Optimizing upstream energy production
- Improving well maintenance and repair
- Analyzing offshore platform data
- Optimizing cross-refinery processes
- Providing SAP master data quality
- Financial Services
- Managing fixed-risk income
- Improving trade reconciliation
- Accelerating new client onboarding
- Addressing mortgage data complexity
- Enriching cash management clients
- Empowering data democracy
- Government
- Protecting the environment
- Healthcare
- Driving new product innovation
- Accelerating M&A synergies
- Providing more efficient claims analysis
- Improving patient care
- Manufacturing
- Optimizing a global supply chain
- Optimizing factories and logistics
- Differentiating via digitization
- Improving IT asset utilization
Getting Started with Data Virtualization
The highest value implementation of data virtualization is a high-speed, virtualized data layer. Such a layer allows for robust management and governance, while also delivering self-service access to critical data, organizing it for scale, and making it available in a cost-effective manner to applications and analytics systems.
However, most data virtualization implementations start small and expand. A common way of starting is with a small and focused team charged with one or more projects. A small team can be versatile while also accepting some uncertainty. (Teams must be agile to move fast and complete several iterations of data projects.)
The next step is to deliver project datasets as the data layer is being built. This step addresses several data challenges including evolving requirements, multiple sources, mixed data types, up-to-the-minute data, data outside of the data warehouse, data too large to physically integrate, and data outside the firewall.
Teams also need to prioritize their data virtualization projects based on business value and ease of data virtualization implementation. The greater the business value and implementation ease, the higher the project’s priority. Data virtualization, and the people who implement it, also need to evolve to reuse various data services in the application layer, business layer, and source layer.