¿Qué es la virtualización de datos?
El software de virtualización de datos actúa como un puente entre múltiples y diversas fuentes de datos, reuniendo los datos para la toma de decisiones críticas en un lugar virtual para así impulsar el análisis.
La virtualización de datos proporciona una capa de datos moderna que permite a los usuarios acceder, combinar, transformar y entregar conjuntos de datos con una velocidad y una rentabilidad innovadora. La tecnología de virtualización de datos brinda a los usuarios un acceso rápido a los datos almacenados en toda la empresa, incluso en bases de datos tradicionales, fuentes de Big Data y sistemas en la nube e IoT, a una fracción del tiempo y costo de almacenamiento físico y extracción/transformación/carga (ETL).
Con la virtualización de datos, los usuarios pueden aplicar una variedad de análisis, incluidos análisis visualizados, predictivos y Streaming Analytics en datos actualizados al minuto. A través de la gestión y la seguridad integradas, los usuarios de la virtualización de datos tienen la seguridad de que sus datos son consistentes, de alta calidad y están protegidos. Además, la virtualización de datos permite datos más amigables para las empresas, transformando las estructuras y la sintaxis de TI nativas en servicios de datos seleccionados por TI fáciles de entender, encontrar, y utilizar a través de un directorio empresarial de autoservicio.
La virtualización de datos admite múltiples líneas de negocio, cientos de proyectos y miles de usuarios que pueden ampliar desde un proyecto a otro a escala empresarial.

Fuentes de datos comunes virtualizadas mediante software de virtualización de datos
- Aplicaciones integradas
- RDBMS
- Excel y ficheros planos
- Almacenes de datos
- Lagos de datos
- Big Data
- Documentos XML
- Datos en la nube
- Servicios Web
- Datos de IoT
Sistemas comunes utilizados con virtualización de datos
- Oracle
- SQL Server
- Teradata
- Netezza
- DB2
- Hive
- Impala
- Sharepoint
- Excel
- Archivos planos
- Amazon Redshift
- Google Big Query
- Spark
- Drill
- REST
- OData
Las 4 principales capacidades que debería tener un sistema de virtualización de datos
Se necesitan cuatro componentes para satisfacer las necesidades empresariales urgentes con la virtualización de datos
Diseño y desarrollo ágiles: deberá realizar una introspección de los datos disponibles, descubrir relaciones ocultas, modelar vistas/servicios individuales, validar vistas/servicios y modificarlos según sea necesario. Estas capacidades automatizan el trabajo difícil, mejoran el tiempo de solución y aumentan la reutilización de objetos.
Tiempo de ejecución de alto rendimiento: la aplicación realiza una solicitud, la consulta optimizada ejecuta un solo informe y el resultado se entrega en la forma adecuada. Esta capacidad permite datos actualizados al minuto, rendimiento optimizado y menos replicación.
Uso del almacenamiento en caché en el momento indicado: Al almacenar en caché los datos esenciales, la aplicación realiza una solicitud, se ejecuta una consulta optimizada (aprovechando los datos almacenados en caché) y los datos se entregan en la forma adecuada. Esta capacidad aumenta el rendimiento, evita las limitaciones de la red y permite la disponibilidad 24 horas al día, 7 días a la semana.
Directorio/catálogo empresarial para facilitar la búsqueda de datos: esta capacidad incluye funciones para la búsqueda y categorización de datos, exploración de todos los datos disponibles, selección de un directorio de vistas y colaboración con TI para mejorar la calidad y utilidad de los datos. Esta capacidad permite a los usuarios empresariales disponer de más datos, mejora la eficacia de los usuarios empresariales o de TI y permite una mayor adopción de la virtualización de datos.
¿Cuáles son algunos casos de uso de la virtualización de datos?
- Casos de uso de la analítica
- Creación de prototipos de integración de datos físicos
- Acceso a datos/capa semántica para análisis
- Data warehouse lógico
- Preparación de datos
- Restricciones reglamentarias sobre el movimiento de datos
- Casos de uso operativo
- Capa de acceso a datos abstractos/almacén operacional de los datos (ODS) virtuales
- Gestión de datos maestros
- Migración de sistemas pre-existentes
- Acceso a los datos de la aplicación
- Restricciones reglamentarias sobre el movimiento de datos
- Casos de uso emergentes
- Intercambio de datos en la nube
- Acceso a datos perimetrales en la integración de IoT
- Capacitación del centro de datos
- Integración de datos y contenido
- Restricciones reglamentarias sobre el movimiento de datos
Los beneficios de la virtualización de datos
Aceleración del valor comercial: las aplicaciones de análisis se pueden aplicar previamente y se puede obtener un mayor valor más rápido a medida que ocurren los cambios
Mejora de la información empresarial: Datos más completos, actualizados, de fácil acceso y comprensión, que requieren menos esfuerzo que ETL
Ahorro en costos de desarrollo: los servicios de datos reutilizables, el desarrollo y la validación interactivos mejoran la calidad y evitan la duplicación de trabajo para nuevos proyectos
Reducción de costos de infraestructura en la gestión de datos: costos de infraestructura más bajos y menos licencias para comprar y depreciar, los cuales resultan en costos de soporte y mantenimiento más bajos
¿Cómo utilizan los distintos sectores de la industria la virtualización de datos?
- Tecnología de las comunicaciones
- Servicios diferenciados de investigación de mercado
- Incremento de los ingresos por cliente
- Creación de un lago de datos virtual de clientes
- Desarrollo de la innovación de vanguardia
- Creación de un ODS en tiempo real para facturación y marketing
- Optimización de la atención al cliente
- Administración de los derechos de los clientes
- Mejora de la percepción de los clientes
- Energía
- Optimización de la producción de energía upstream
- Mejora del mantenimiento y reparación de pozos
- Analizar los datos de la plataforma marina
- Optimización de los procesos entre refinerías
- Proporcionar calidad de datos maestros de SAP
- Servicios financieros
- Gestión de la renta de riesgo fijo
- Mejora de la conciliación comercial
- Acelerar la incorporación de nuevos clientes
- Abordar la complejidad de los datos hipotecarios
- Enriquecimiento de los clientes de gestión de efectivo
- Potenciar la democracia de datos
- Autoridades
- Protección del medio ambiente
- Sector sanitario
- Impulso de la innovación de nuevos productos
- Acelerar las sinergias en las fusiones y adquisiciones
- Proporcionar un análisis de reclamaciones más eficiente
- Mejorar la atención al paciente
- Sector industrial
- Optimización de una cadena de suministro global
- Optimización de fábricas y logística
- Diferenciar a través de la digitalización
- Mejora de la utilización de activos de TI
Introducción a la virtualización de datos
La implementación de mayor valor de la virtualización de datos es una capa de datos virtualizados de alta velocidad. Dicha capa permite una gestión y dirección sólidas, al tiempo que brinda acceso de autoservicio a datos críticos, organizándolos para ajustarlos y poniéndolos a disposición de manera rentable para las aplicaciones y los sistemas de análisis.
Sin embargo, la mayoría de las implementaciones de virtualización de datos comienzan con un tamaño pequeño y se expanden. Una forma común de comenzar es con un equipo pequeño y enfocado a cargo de uno o más proyectos. Un equipo pequeño puede ser versátil y al mismo tiempo aceptar cierta incertidumbre. (Los equipos deben ser ágiles para moverse rápido y completar varias iteraciones de proyectos de datos).
El siguiente paso es entregar conjuntos de datos del proyecto a medida que se construye la capa de datos. Este paso aborda varios desafíos de datos, incluidos los requisitos en evolución, múltiples fuentes, tipos de datos mixtos, datos actualizados al minuto, datos fuera del almacén de datos, datos demasiado grandes para integrarlos físicamente y datos fuera del firewall.
Los equipos también deben priorizar sus proyectos de virtualización de datos en función del valor comercial y la facilidad de implementación de la virtualización de datos. Cuanto mayor sea el valor comercial y la facilidad de implementación, mayor será la prioridad del proyecto. La virtualización de datos y las personas que la implementan también deberán evolucionar para reutilizar varios servicios de datos en la capa de aplicación, la capa empresarial y la capa de origen.

How do various industry sectors use data virtualization?
- Communications & Technology
- Differentiating market research services
- Increasing revenue per customer
- Building a virtual customer data lake
- Enabling leading-edge innovation
- Creating a real-time ODS for billing and marketing
- Optimizing customer care
- Managing customer entitlements
- Improving customer insights
- Energy
- Optimizing upstream energy production
- Improving well maintenance and repair
- Analyzing offshore platform data
- Optimizing cross-refinery processes
- Providing SAP master data quality
- Financial Services
- Managing fixed-risk income
- Improving trade reconciliation
- Accelerating new client onboarding
- Addressing mortgage data complexity
- Enriching cash management clients
- Empowering data democracy
- Government
- Protecting the environment
- Healthcare
- Driving new product innovation
- Accelerating M&A synergies
- Providing more efficient claims analysis
- Improving patient care
- Manufacturing
- Optimizing a global supply chain
- Optimizing factories and logistics
- Differentiating via digitization
- Improving IT asset utilization
Getting Started with Data Virtualization
The highest value implementation of data virtualization is a high-speed, virtualized data layer. Such a layer allows for robust management and governance, while also delivering self-service access to critical data, organizing it for scale, and making it available in a cost-effective manner to applications and analytics systems.
However, most data virtualization implementations start small and expand. A common way of starting is with a small and focused team charged with one or more projects. A small team can be versatile while also accepting some uncertainty. (Teams must be agile to move fast and complete several iterations of data projects.)
The next step is to deliver project datasets as the data layer is being built. This step addresses several data challenges including evolving requirements, multiple sources, mixed data types, up-to-the-minute data, data outside of the data warehouse, data too large to physically integrate, and data outside the firewall.
Teams also need to prioritize their data virtualization projects based on business value and ease of data virtualization implementation. The greater the business value and implementation ease, the higher the project’s priority. Data virtualization, and the people who implement it, also need to evolve to reuse various data services in the application layer, business layer, and source layer.