데이터 가상화란 무엇입니까?

데이터 가상화 소프트웨어는 여러 다양한 데이터 소스를 연결하는 다리 역할을 하여 중요한 의사 결정 데이터를 하나의 가상 공간에 모아 분석을 촉진합니다.

데이터 가상화는 사용자가 획기적인 속도와 비용 효율성으로 데이터 세트에 액세스, 결합, 변환 및 제공할 수 있도록 하는 최신 데이터 계층을 제공합니다. 데이터 가상화 기술은 사용자가 물리적 웨어하우징 및 ETL(추출/변환/로드) 시간과 비용의 일부로 기존 데이터베이스, 빅 데이터 소스, 클라우드 및 IoT 시스템을 포함하여 기업 전체에 저장된 데이터에 빠르게 액세스할 수 있도록 합니다.

데이터 가상화는 데이터에 즉시 액세스하여 빠른 분석이 가능하도록 합니다.

데이터 가상화를 통해 사용자는 시각화, 예측 및 스트리밍 분석을 포함한 다양한 분석 기능을 최신의 새로운 데이터 업데이트에 적용할 수 있습니다. 통합된 거버넌스 및 보안을 통해 데이터 가상화 사용자는 자신의 데이터가 일관되고 고품질이며 보호된다는 것을 확신할 수 있습니다. 또한 데이터 가상화는 보다 기업 친화적인 데이터를 제공하여 기본 IT 구조 및 구문을 셀프 서비스 비즈니스 디렉토리를 통해 쉽게 찾고 사용할 수 있는 이해하기 쉬운 IT 선별 데이터 서비스로 변환합니다.

데이터 가상화는 프로젝트에서 엔터프라이즈 규모로 확장할 수 있는 여러 비즈니스 라인, 수백 개의 프로젝트 및 수천 명의 사용자를 지원합니다.

데이터 가상화에 대해 알아야 할 열 가지 사항
데이터 가상화에 대해 알아야 할 열 가지 사항
데이터 병목 현상을 극복하고 더 나은 결과를 도출할 수 있도록 데이터 가상화에 대한 핵심 진실을 알아보십시오.

데이터 가상화 소프트웨어를 통해 가상화된 공통 데이터 소스

  • 패키지형 앱
  • RDBMS
  • Excel 및 플랫 파일
  • 데이터 웨어하우스
  • 데이터 레이크
  • 빅 데이터
  • XML 문서
  • 클라우드 데이터
  • 웹 서비스
  • IoT 데이터

데이터 가상화와 함께 사용되는 공통 시스템

  • Oracle
  • SQL Server
  • Teradata
  • Netezza
  • DB2
  • Hive
  • Impala
  • Sharepoint
  • Excel
  • 플랫 파일
  • Amazon Redshift
  • Google Big Query
  • Spark
  • Drill
  • REST
  • OData

데이터 가상화 시스템이 포함해야 할 4 가지 주요 기능

데이터 가상화로 긴급한 비즈니스 요구 사항을 충족하려면 네 가지 구성 요소가 필요합니다

민첩한 설계 및 개발: 사용 가능한 데이터를 검토하고, 숨겨진 관계를 발견하며, 개별 뷰/서비스를 모델링하고, 뷰/서비스를 검증하고, 필요에 따라 수정할 수 있어야 합니다. 이러한 기능을 통해 어려운 작업을 자동화하고 해결 시간을 단축하며 객체 재사용을 증대시킵니다.

고성능 런타임: 애플리케이션이 요청을 호출하고 최적화된 쿼리가 단일 명령문을 실행하며 결과가 적절한 형식으로 전달됩니다. 이 기능을 통해 최신 데이터, 최적화된 성능 및 적은 복제가 가능합니다.

적절한 때 캐싱 사용: 필수 데이터 캐싱, 애플리케이션이 요청을 호출하고 최적화된 쿼리(캐시된 데이터 활용)가 실행되고 데이터가 적절한 형식으로 전달됩니다. 이 기능을 통해 성능을 향상시키고 네트워크 제약을 피하며 24x7 가용성을 제공합니다.

데이터를 쉽게 찾을 수 있도록 하는 비즈니스 디렉토리 / 카탈로그: 이 기능에는 검색 및 데이터 분류, 사용 가능한 모든 데이터 탐색,뷰 디렉토리에서 선택, IT와의 협업을 통한 데이터 품질 및 유용성 향상 기능이 포함됩니다. 이 기능을 통해 비즈니스 사용자에게 더 많은 데이터를 제공하고 IT / 비즈니스 사용자 효율성을 향상시키며 데이터 가상화를 보다 널리 채택할 수 있습니다.

데이터 가상화 사용 사례에는 어떤 것이 있습니까?

  • 분석 사용 사례
    • 물리적 데이터 통합 프로토타입
    • 분석을 위한 데이터 액세스/의미 계층
    • 논리 데이터 웨어하우스
    • 데이터 준비
    • 데이터 이동에 대한 규제 제약
  • 운영 사용 사례
    • 추상 데이터 액세스 계층/ 가상 운영 데이터 저장소(ODS)
    • 레지스트리 스타일 마스터 데이터 관리
    • 레거시 시스템 마이그레이션
    • 애플리케이션 데이터 액세스
    • 데이터 이동에 대한 규제 제약
  • 새로운 사용 사례
    • 클라우드 데이터 공유
    • IoT 통합의 에지 데이터 액세스
    • 데이터 허브 지원
    • 데이터 및 콘텐츠 통합
    • 데이터 이동에 대한 규제 제약

데이터 가상화의 이점

비즈니스 가치 가속화: 분석 애플리케이션을 더 빨리 적용하고 변화가 발생하면 더 큰 가치를 더 빨리 얻을 수 있습니다.

비즈니스 통찰력 향상: 더 완벽한 최신 기능이며, 데이터에 쉽게 액세스하고 이해할 수 있으므로 ETL보다 적은 노력이 듭니다.

개발 비용 회피: 재사용 가능한 데이터 서비스와 대화형 개발 및 검증을 통해 품질을 개선하고 새로운 프로젝트에 대한 재 작업을 방지합니다.

데이터 관리 인프라 비용 절감: 인프라 비용을 낮추고 구매 및 가치 절하 라이선스 수를 줄여 지원 및 유지 관리 비용을 줄입니다.

다양한 산업 분야에서 데이터 가상화를 어떻게 사용합니까?

  • 통신 및 기술
    • 시장 조사 서비스 차별화
    • 고객 당 수익 증대
    • 가상 고객 데이터 레이크 구축
    • 최첨단 혁신 구현
    • 청구서 발부 및 마케팅을 위한 실시간 ODS 생성
    • 고객 지원 최적화
    • 고객 자격 관리
    • 고객 통찰력 향상
  • 에너지
    • 업스트림 에너지 생산 최적화
    • 유정 유지 보수 및 수리 개선
    • 해양 플랫폼 데이터 분석
    • 교차 정제 공정 최적화
    • SAP 마스터 데이터 품질 제공
  • 금융 서비스
    • 고정 위험 소득 관리
    • 무역 화해 개선
    • 신규 고객 온보딩 가속화
    • 담보대출 데이터 복잡성 해결
    • 현금 관리 고객 확대
    • 데이터 민주화 강화
  • 정부
    • 환경 보호
  • 보건 의료
    • 신제품 혁신 추동
    • M&A 시너지 가속화
    • 보다 효율적인 클레임 분석 제공
    • 환자 치료 개선
  • 제조
    • 글로벌 공급망 최적화
    • 공장 및 물류 최적화
    • 디지털화를 통한 차별화
    • IT 자산 활용도 향상

데이터 가상화 시작하기

데이터 가상화의 최고 가치 구현이란 고속 가상화 데이터 계층입니다. 이러한 계층을 사용하면 강력한 관리 및 거버넌스를 제공하는 동시에 중요 데이터에 대한 셀프 서비스 액세스를 제공하고 이를 확장하여 구성하고 이를 애플리케이션 및 분석 시스템에서 비용 효율적인 방식으로 사용할 수 있습니다.

그러나 대부분의 데이터 가상화 구현은 작은것으로 시작하여 확장됩니다. 일반적인 시작 방법은 하나 이상의 프로젝트를 담당하는 소규모 집중팀과 함께 하는 것입니다. 소규모 팀은 다재다능하면서 불확실성을 수용할 수 있습니다. (신속하게 이동하고 데이터 프로젝트의 여러 반복을 완료하려면 팀이 민첩해야 합니다.)

다음 단계는 데이터 계층이 구축될 때 프로젝트 데이터 세트를 제공하는 것입니다. 이 단계에서는 진화하는 요구 사항, 여러 소스, 혼합 데이터 유형, 최신 데이터, 데이터 웨어하우스 외부의 데이터, 물리적으로 통합하기에는 너무 큰 데이터, 방화벽 외부의 데이터 등 여러 데이터 문제를 해결합니다.

또한 팀은 비즈니스 가치와 데이터 가상화 구현의 용이성을 기반으로 데이터 가상화 프로젝트의 우선 순위를 정해야 합니다. 비즈니스 가치와 구현 용이성이 클수록 프로젝트의 우선 순위가 높아집니다. 데이터 가상화와 이를 구현하는 사람들도 애플리케이션 계층, 비즈니스 계층 및 소스 계층의 다양한 데이터 서비스를 재사용하도록 진화해야 합니다.

Data Virtualization Use Cases
Modernize Your Data and Analytics Architecture
Check out these 13 use cases to learn how to support today’s complex data and analytics landscape.

How do various industry sectors use data virtualization?

  • Communications & Technology
    • Differentiating market research services
    • Increasing revenue per customer
    • Building a virtual customer data lake
    • Enabling leading-edge innovation
    • Creating a real-time ODS for billing and marketing
    • Optimizing customer care
    • Managing customer entitlements
    • Improving customer insights
  • Energy
    • Optimizing upstream energy production
    • Improving well maintenance and repair
    • Analyzing offshore platform data
    • Optimizing cross-refinery processes
    • Providing SAP master data quality
  • Financial Services
    • Managing fixed-risk income
    • Improving trade reconciliation
    • Accelerating new client onboarding
    • Addressing mortgage data complexity
    • Enriching cash management clients
    • Empowering data democracy
  • Government
    • Protecting the environment
  • Healthcare
    • Driving new product innovation
    • Accelerating M&A synergies
    • Providing more efficient claims analysis
    • Improving patient care
  • Manufacturing
    • Optimizing a global supply chain
    • Optimizing factories and logistics
    • Differentiating via digitization
    • Improving IT asset utilization

Getting Started with Data Virtualization

The highest value implementation of data virtualization is a high-speed, virtualized data layer. Such a layer allows for robust management and governance, while also delivering self-service access to critical data, organizing it for scale, and making it available in a cost-effective manner to applications and analytics systems.

However, most data virtualization implementations start small and expand. A common way of starting is with a small and focused team charged with one or more projects. A small team can be versatile while also accepting some uncertainty. (Teams must be agile to move fast and complete several iterations of data projects.)

The next step is to deliver project datasets as the data layer is being built. This step addresses several data challenges including evolving requirements, multiple sources, mixed data types, up-to-the-minute data, data outside of the data warehouse, data too large to physically integrate, and data outside the firewall.

Teams also need to prioritize their data virtualization projects based on business value and ease of data virtualization implementation. The greater the business value and implementation ease, the higher the project’s priority. Data virtualization, and the people who implement it, also need to evolve to reuse various data services in the application layer, business layer, and source layer.