¿Qué es la virtualización de datos?

El software de virtualización de datos actúa como un puente entre múltiples y diversas fuentes de datos, reuniendo los datos para la toma de decisiones críticas en un lugar virtual para así impulsar el análisis.

La virtualización de datos proporciona una capa de datos moderna que permite a los usuarios acceder, combinar, transformar y entregar conjuntos de datos con una velocidad y una rentabilidad innovadora. La tecnología de virtualización de datos brinda a los usuarios un acceso rápido a los datos almacenados en toda la empresa, incluso en bases de datos tradicionales, fuentes de Big Data y sistemas en la nube e IoT, a una fracción del tiempo y costo de almacenamiento físico y extracción/transformación/carga (ETL).

la virtualización de datos proporciona un acceso rápido a los datos para un análisis igualmente rápido

Con la virtualización de datos, los usuarios pueden aplicar una variedad de análisis, incluidos análisis visualizados, predictivos y Streaming Analytics en datos actualizados al minuto. A través de la gestión y la seguridad integradas, los usuarios de la virtualización de datos tienen la seguridad de que sus datos son consistentes, de alta calidad y están protegidos. Además, la virtualización de datos permite datos más amigables para las empresas, transformando las estructuras y la sintaxis de TI nativas en servicios de datos seleccionados por TI fáciles de entender, encontrar, y utilizar a través de un directorio empresarial de autoservicio.

La virtualización de datos admite múltiples líneas de negocio, cientos de proyectos y miles de usuarios que pueden ampliar desde un proyecto a otro a escala empresarial.

Diez cosas que necesita saber sobre la virtualización de datos
Diez cosas que necesita saber sobre la virtualización de datos
Conozca las verdades fundamentales sobre la virtualización de datos para que pueda superar los obstáculos para los datos y así obtener mejores resultados.

Fuentes de datos comunes virtualizadas mediante software de virtualización de datos

  • Aplicaciones integradas
  • RDBMS
  • Excel y ficheros planos
  • Almacenes de datos
  • Lagos de datos
  • Big Data
  • Documentos XML
  • Datos en la nube
  • Servicios Web
  • Datos de IoT

Sistemas comunes utilizados con virtualización de datos

  • Oracle
  • SQL Server
  • Teradata
  • Netezza
  • DB2
  • Hive
  • Impala
  • Sharepoint
  • Excel
  • Archivos planos
  • Amazon Redshift
  • Google Big Query
  • Spark
  • Drill
  • REST
  • OData

Las 4 principales capacidades que debería tener un sistema de virtualización de datos

Se necesitan cuatro componentes para satisfacer las necesidades empresariales urgentes con la virtualización de datos

Diseño y desarrollo ágiles: deberá realizar una introspección de los datos disponibles, descubrir relaciones ocultas, modelar vistas/servicios individuales, validar vistas/servicios y modificarlos según sea necesario. Estas capacidades automatizan el trabajo difícil, mejoran el tiempo de solución y aumentan la reutilización de objetos.

Tiempo de ejecución de alto rendimiento: la aplicación realiza una solicitud, la consulta optimizada ejecuta un solo informe y el resultado se entrega en la forma adecuada. Esta capacidad permite datos actualizados al minuto, rendimiento optimizado y menos replicación.

Uso del almacenamiento en caché en el momento indicado: Al almacenar en caché los datos esenciales, la aplicación realiza una solicitud, se ejecuta una consulta optimizada (aprovechando los datos almacenados en caché) y los datos se entregan en la forma adecuada. Esta capacidad aumenta el rendimiento, evita las limitaciones de la red y permite la disponibilidad 24 horas al día, 7 días a la semana.

Directorio/catálogo empresarial para facilitar la búsqueda de datos: esta capacidad incluye funciones para la búsqueda y categorización de datos, exploración de todos los datos disponibles, selección de un directorio de vistas y colaboración con TI para mejorar la calidad y utilidad de los datos. Esta capacidad permite a los usuarios empresariales disponer de más datos, mejora la eficacia de los usuarios empresariales o de TI y permite una mayor adopción de la virtualización de datos.

¿Cuáles son algunos casos de uso de la virtualización de datos?

  • Casos de uso de la analítica
    • Creación de prototipos de integración de datos físicos
    • Acceso a datos/capa semántica para análisis
    • Data warehouse lógico
    • Preparación de datos
    • Restricciones reglamentarias sobre el movimiento de datos
  • Casos de uso operativo
    • Capa de acceso a datos abstractos/almacén operacional de los datos (ODS) virtuales
    • Gestión de datos maestros
    • Migración de sistemas pre-existentes
    • Acceso a los datos de la aplicación
    • Restricciones reglamentarias sobre el movimiento de datos
  • Casos de uso emergentes
    • Intercambio de datos en la nube
    • Acceso a datos perimetrales en la integración de IoT
    • Capacitación del centro de datos
    • Integración de datos y contenido
    • Restricciones reglamentarias sobre el movimiento de datos

Los beneficios de la virtualización de datos

Aceleración del valor comercial: las aplicaciones de análisis se pueden aplicar previamente y se puede obtener un mayor valor más rápido a medida que ocurren los cambios

Mejora de la información empresarial: Datos más completos, actualizados, de fácil acceso y comprensión, que requieren menos esfuerzo que ETL

Ahorro en costos de desarrollo: los servicios de datos reutilizables, el desarrollo y la validación interactivos mejoran la calidad y evitan la duplicación de trabajo para nuevos proyectos

Reducción de costos de infraestructura en la gestión de datos: costos de infraestructura más bajos y menos licencias para comprar y depreciar, los cuales resultan en costos de soporte y mantenimiento más bajos

¿Cómo utilizan los distintos sectores de la industria la virtualización de datos?

  • Tecnología de las comunicaciones
    • Servicios diferenciados de investigación de mercado
    • Incremento de los ingresos por cliente
    • Creación de un lago de datos virtual de clientes
    • Desarrollo de la innovación de vanguardia
    • Creación de un ODS en tiempo real para facturación y marketing
    • Optimización de la atención al cliente
    • Administración de los derechos de los clientes
    • Mejora de la percepción de los clientes
  • Energía
    • Optimización de la producción de energía upstream
    • Mejora del mantenimiento y reparación de pozos
    • Analizar los datos de la plataforma marina
    • Optimización de los procesos entre refinerías
    • Proporcionar calidad de datos maestros de SAP
  • Servicios financieros
    • Gestión de la renta de riesgo fijo
    • Mejora de la conciliación comercial
    • Acelerar la incorporación de nuevos clientes
    • Abordar la complejidad de los datos hipotecarios
    • Enriquecimiento de los clientes de gestión de efectivo
    • Potenciar la democracia de datos
  • Autoridades
    • Protección del medio ambiente
  • Sector sanitario
    • Impulso de la innovación de nuevos productos
    • Acelerar las sinergias en las fusiones y adquisiciones
    • Proporcionar un análisis de reclamaciones más eficiente
    • Mejorar la atención al paciente
  • Sector industrial
    • Optimización de una cadena de suministro global
    • Optimización de fábricas y logística
    • Diferenciar a través de la digitalización
    • Mejora de la utilización de activos de TI

Introducción a la virtualización de datos

La implementación de mayor valor de la virtualización de datos es una capa de datos virtualizados de alta velocidad. Dicha capa permite una gestión y dirección sólidas, al tiempo que brinda acceso de autoservicio a datos críticos, organizándolos para ajustarlos y poniéndolos a disposición de manera rentable para las aplicaciones y los sistemas de análisis.

Sin embargo, la mayoría de las implementaciones de virtualización de datos comienzan con un tamaño pequeño y se expanden. Una forma común de comenzar es con un equipo pequeño y enfocado a cargo de uno o más proyectos. Un equipo pequeño puede ser versátil y al mismo tiempo aceptar cierta incertidumbre. (Los equipos deben ser ágiles para moverse rápido y completar varias iteraciones de proyectos de datos).

El siguiente paso es entregar conjuntos de datos del proyecto a medida que se construye la capa de datos. Este paso aborda varios desafíos de datos, incluidos los requisitos en evolución, múltiples fuentes, tipos de datos mixtos, datos actualizados al minuto, datos fuera del almacén de datos, datos demasiado grandes para integrarlos físicamente y datos fuera del firewall.

Los equipos también deben priorizar sus proyectos de virtualización de datos en función del valor comercial y la facilidad de implementación de la virtualización de datos. Cuanto mayor sea el valor comercial y la facilidad de implementación, mayor será la prioridad del proyecto. La virtualización de datos y las personas que la implementan también deberán evolucionar para reutilizar varios servicios de datos en la capa de aplicación, la capa empresarial y la capa de origen.