¿Qué es Data Fabric?

Data Fabric es una solución integral de gestión e integración de datos que consta de arquitectura, software de integración y gestión de datos, y datos compartidos que ayudan a las organizaciones a gestionar sus datos. Un Data Fabric proporciona una experiencia de usuario unificada y coherente, y acceso a los datos para cualquier miembro de una organización en todo el mundo y en tiempo real.

Diagrama de Data Fabric

El Data Fabric está diseñado para ayudar a las organizaciones a resolver problemas de datos complejos y casos de uso mediante la administración de sus datos, independientemente de los diversos tipos de aplicaciones, plataformas y ubicaciones donde se almacenan estos datos. El Data Fabric permite el acceso sin fricciones y el intercambio de datos en un entorno de datos distribuidos.

¿Por qué usar un Data Fabric?

Cualquier organización centrada en datos necesita un enfoque holístico que supere los obstáculos de tiempo, espacio, diferentes tipos de software y ubicaciones de datos. Los datos deben ser accesibles para los usuarios que los necesitan, no encerrados detrás de firewalls o ubicados poco a poco en una variedad de ubicaciones. Las empresas necesitan tener un entorno seguro, eficiente y unificado, y una solución de datos preparada para el futuro para poder prosperar. Un Data Fabric ofrece esto.

La integración de datos tradicional ya no satisface las nuevas demandas comerciales de conectividad en tiempo real, autoservicio, automatización y transformaciones universales. Aunque la recopilación de datos de varias fuentes no suele ser el problema, muchas organizaciones no pueden integrar, procesar, seleccionar y transformar datos con otras fuentes. Esta parte crucial del proceso de administración de datos deberá darse para brindar una visión integral de los clientes, socios y productos, lo cual ofrecerá a las organizaciones una ventaja competitiva. De esta manera, podrán satisfacer mejor las demandas de los clientes, modernizar sus sistemas y aprovechar el poder de la informática en la nube.

El Data Fabric se puede visualizar como una tela, distribuida por todo el mundo, dondequiera que estén los usuarios de la organización. El usuario puede estar en cualquier lugar de este entramado de datos y seguir accediendo a los datos en cualquier otro lugar sin restricciones, en tiempo real.

Recursos de Data Fabric
¿Busca una solución a sus desafíos de datos? ¡Construya un Data Fabric!
¡Aprenda cómo unificar todos sus datos, alinear la TI con la empresa y capacitar a los trabajadores remotos y móviles en el último libro electrónico de O'Reilly!

Data Fabric es más que una simple red

Internet se creó para conectar a las personas de todo el mundo, brindándoles la capacidad de ignorar los obstáculos del tiempo y la distancia. Sin embargo, inicialmente solo conectaba personas y la transferencia de datos cuantificados era mínima. Hoy, la actividad en las plataformas digitales ha superado las previsiones iniciales y los datos se han convertido en un mundo en sí mismos. Cualquier actividad que sea cuantitativa, ya sea en línea o en la vida real, puede clasificarse como suministro de datos. Si bien estos datos crecen a pasos agigantados, es necesario establecer una infraestructura para administrarlos.

Anteriormente, el objetivo era administrar datos y, como beneficio adicional, extraer información de ellos. Con el paso del tiempo, el enfoque comenzó a pasar de solo administrar datos a poder extraer información de esos datos. Con un Data Fabric, el enfoque está cambiando de la simple administración de datos a la mejora de la calidad de los datos en sí, la disponibilidad de la información y los conocimientos automatizados derivados de ella.

¿Por qué usar un Data Fabric?

En todo el mundo, el número de partes interesadas que ingresan al entorno en red está aumentando. Todo el mundo está conectado a internet y cada plataforma se ha convertido en una fuente de datos. Maximizar el valor de los datos se ha convertido en un problema complejo. Los desafíos de los datos actuales incluyen:

  • Ubicación en múltiples ubicaciones locales y en la nube.
  • Datos estructurados y no estructurados.
  • Diferentes tipos de datos.
  • Diferentes entornos de plataformas.
  • Mantenido en diferentes sistemas de archivos, bases de datos y aplicaciones SaaS.

Los datos están creciendo exponencialmente, por lo que estos problemas se están multiplicando..

Estos problemas y variaciones hacen que sea complejo acceder o usar fácilmente los datos. Y, si las organizaciones desean producir u operar AI y ML, necesitan que sus datos se recopilen, transformen y procesen.

En la actualidad, la mayoría de las organizaciones tienden a lidiar con el problema en silos, creando muchas formas diferentes de administrar los datos en una organización. Aunque esta solución hace que los datos estén disponibles para grupos particulares, el acceso a ellos en toda la empresa se vuelve casi imposible, frecuentemente relegando los datos a permanecer inactivos y sin usar.

La falta de acceso y uso de datos completos da como resultado un bajo retorno de la inversión en la infraestructura, la falta de disponibilidad de datos para producir predicciones útiles y una menor productividad. Bajo tales condiciones que el Data Fabric viene al rescate.

Data Fabric vs Status quo

Actualmente, muchas organizaciones utilizan lagos de datos y almacenes de datos para administrar datos. Sin embargo, en una inspección más cercana, estos enfoques son intensivos en tecnología en lugar de centrados en datos. Con los lagos de datos y los almacenes de datos, el énfasis está en recopilar o extraer los datos sin procesar, almacenarlos y usarlos cuando se obtienen conocimientos. Estas soluciones no se diseñaron teniendo en cuenta los problemas actuales y hacen que sea difícil obtener una vista unificada de los datos. Sin embargo, estas técnicas frecuentemente conducen a retrasos y costos crecientes. Con la creciente cantidad de datos y las limitaciones de tiempo con las que trabajan los responsables de la toma de decisiones de una organización, no son deseables los retrasos en el acceso y el procesamiento de los datos. En tales escenarios, el Data Fabric ofrece la ventaja de almacenar, extraer y procesar datos en el punto de origen en tiempo real, lo que permite a los responsables de la toma de decisiones obtener información sobre la marcha.

Data Fabric vs. Virtualización de datos

El Data Fabric frecuentemente se confunde con la virtualización de datos. La virtualización de datos crea una capa de abstracción de datos y, a menudo, se confía en ella cuando necesita integrar datos rápidamente. Conecta, recopila y transforma datos de muchas fuentes diferentes, ya sea en las instalaciones o en la nube, para obtener información ágil, de autoservicio y en tiempo real. Por otro lado, el Data Fabric se refiere a una arquitectura de administración de datos integral y global que se utiliza para casos de uso más amplios, como el análisis de preferencias de clientes y análisis de IoT, incluido un conjunto más grande de componentes de pila. Los analistas recomiendan usar la virtualización de datos como una herramienta que contribuye a su arquitectura de Data Fabric. A medida que utiliza más y más herramientas de integración de datos, puede hacer crecer su solución en un Data Fabric que sea específica para los objetivos de su organización.

Implementación de Data Fabric

El Data Fabric comienza con conceptos de procesamiento de transacciones en línea (OLTP), el cual se inserta, actualiza y carga en una base de datos información detallada sobre cada transacción. Los datos se estructuran, limpian y almacenan en silos en un centro para su uso posterior. Cualquier usuario de los datos, en cualquier punto de la estructura, puede tomar los datos sin procesar y usarlos para derivar múltiples hallazgos, lo que ayudará a las organizaciones a aprovechar sus datos para crecer, adaptarse y mejorar.

Una implementación exitosa del Data Fabric requiere:

  • Aplicación y servicios: donde se construye la infraestructura necesaria para la adquisición de datos. Esto incluye el desarrollo de aplicaciones e interfaces gráficas de usuario (GUIs) para que el cliente interactúe con la organización.
  • Desarrollo e integración de ecosistemas: creación del ecosistema necesario para recopilar, gestionar y almacenar los datos. Los datos del cliente deben transferirse al administrador de datos y a los sistemas de almacenamiento de manera que se evite la pérdida de datos.
  • Seguridad: los datos recopilados de todas las fuentes deben administrarse con la seguridad adecuada.
  • Gestión de almacenamiento: los datos se almacenan de manera accesible y eficiente, con posibilidad de escalar cuando sea necesario.
  • Transporte: construcción de la infraestructura necesaria para acceder a los datos desde cualquier punto de las ubicaciones geográficas de la organización.
  • Terminales: desarrollo de la infraestructura definida por software en los puntos de almacenamiento y acceso para permitir información en tiempo real.
Diez cosas que necesita saber sobre la virtualización de datos
Diez cosas que necesita saber sobre la virtualización de datos
Conozca las verdades fundamentales sobre la virtualización de datos para que pueda superar los cuellos de botella y obtener mejores resultados.

¿Cómo funciona la inteligencia artificial o el Machine Learning con Data Fabric?

En las fases iniciales del almacenamiento de datos, los ingenieros de datos y los científicos de datos intentaron conectar los puntos en los datos para encontrar patrones. Descubrieron que con las técnicas tradicionales de integración de datos, pasaban la mayor parte del tiempo en la logística de datos en lugar de aprender sobre los datos. No es un enfoque sostenible si deseamos obtener información más rápidamente.

Un Data Fabric es esencialmente una capa operativa de datos que no solo reúne todos los datos, sino que los transforma y procesa mediante Machine Learning para descubrir patrones y conocimientos. Sin un Data Fabric, todo esto tiene que suceder en cada aplicación individual, lo cual no es una solución sostenible.

Un Data Fabric puede preparar datos para satisfacer las necesidades de AI y ML automáticamente y en niveles sostenibles. El Machine Learning puede proporcionar los datos y los conocimientos de forma proactiva, lo cual ayuda a los responsables de la toma de decisiones a tener mejores conocimientos e información más oportuna. Los resultados deseables radican en descubrir hechos ocultos de los datos sin que se busquen o soliciten específicamente, mientras se encuentran soluciones para problemas o conocimientos comerciales.

Riesgos con Data Fabric

Una preocupación creciente para las organizaciones es la amenaza a la seguridad de los datos cuando se transportan de un punto a otro en el Data Fabric. Es obligatorio que la infraestructura para el transporte de datos incorpore firewalls y protocolos de seguridad para garantizar la seguridad frente a violaciones de seguridad. Con un número cada vez mayor de ataques cibernéticos que afectan a las organizaciones, la seguridad de los datos en todos los puntos del ciclo de datos es primordial.

Beneficios de Data Fabric

El Data Fabric es ideal para organizaciones con base en diferentes partes del mundo, tienen múltiples fuentes de datos y enfrentan problemas de datos complejos o casos de uso. Recuerde: un Data Fabric no es una respuesta rápida para integrar y procesar sus datos. Para eso, puede recurrir a la virtualización de datos.

Con los continuos avances en las capacidades del hardware, la globalización se está expandiendo a regiones que antes no estaban conectadas. Con las velocidades de conectividad aceleradas, las organizaciones pueden verse abrumadas por los datos de los dispositivos y servicios. Si bien los datos se han utilizado durante bastante tiempo para obtener información, el Data Fabric proporciona una solución que ofrece las siguientes ventajas:

  • Cuenta con un modelo ágil que permite cambios en los sistemas, se adapta y ajusta según sea necesario y funciona en todos los sistemas operativos y de almacenamiento.
  • Es escalable con mínima interferencia, sin inversión en hardware enormemente costoso o personal altamente capacitado y costoso.
  • Proporciona la máxima integridad y cumple con las regulaciones, manteniendo la accesibilidad y el flujo de información en tiempo real.

Las cantidades masivas de datos a las que las empresas pueden acceder deben explotarse para obtener información única. Las áreas que incluyen pronósticos, ventas y optimización de la cadena de suministro, marketing y comportamiento del consumidor brindan a la organización una ventaja competitiva y liderazgo en datos en su campo. La derivación de información en tiempo real puede hacer que la organización se destaque del resto.