¿Qué son los datos de referencia?
Los datos de referencia son un subconjunto especial de datos maestros que se utilizan para la clasificación en toda su organización. Se puede utilizar en la gestión de datos para definir las características de un identificador. Ya sea que los datos sean de autores externos o internos, son inequívocos y no negociables. Los datos de referencia incluyen jerarquías complejas, asignaciones y mucho más. Los datos de referencia pueden originarse internamente (dentro de una organización) o externamente (recopilados de otras fuentes de datos). También se puede describir en relaciones uno a uno, relaciones uno a varios, o también jerarquías.
Las organizaciones, como el MDM Institute, describen dos variedades principales de datos de referencia: datos de referencia multidominio frente a datos de referencia en tiempo real. Los datos de referencia multidominio no son específicos de la industria y pueden abarcar múltiples áreas funcionales (finanzas, riesgo y cumplimiento, recursos humanos, etc) y tipos de contenido (códigos ISO de un país y otros datos de referencia no volátiles) que se deberán dominar y compartir. Los datos de referencia en tiempo real se utilizan normalmente en la industria de los mercados de capital (corredores, administradores de activos y empresas de servicios de valores), así como en los mercados militares y de inteligencia sobre mando y control. También se utiliza cada vez más en aplicaciones de Internet de las cosas (IoT) que requieren el etiquetado de metadatos de fuentes de datos de transmisión en grandes lagos de datos.
Según el MDM Institute, los datos de referencia pueden ser públicos o privados y conectan diferentes dominios y aplicaciones a través de valores consistentes y semánticas, para crear vistas y jerarquías de múltiples dominios. Por ejemplo, los datos que conectan a los clientes y los productos, como la información de contabilidad de costos/ingresos, el personal de ventas, las unidades de negocios, las geografías o los datos de la industria, se incluirían todos ellos en los datos de referencia.

¿Cuál es la diferencia entre datos de referencia y datos maestros?
Es importante comprender la diferencia entre los datos de referencia y los datos maestros. Cuando los datos maestros representan partes clave del negocio, incluidos los datos del cliente y los datos relacionados con las actividades y transacciones comerciales, los datos de referencia representan un conjunto de datos permitidos que se utilizarán a partir de los datos maestros para la clasificación. Además, los cambios en los datos de referencia frecuentemente ocurren lentamente con el tiempo como un reflejo directo de cualquier cambio en los procesos comerciales, mientras que los cambios en los datos maestros ocurrirán dentro de los procesos comerciales estándar. Aunque los datos de referencia rara vez se modifican, esos pequeños cambios con el tiempo deberán gestionarse y sincronizarse en toda la organización. Este es un desafío al que se enfrentan muchas empresas y que deberán luchar con principios de gobernanza y una gestión de datos de referencia coherente.
Ejemplos de datos de referencia
A continuación, se muestran algunos ejemplos de datos de referencia:
- Códigos postales
- Códigos de transacción
- Centros de costo
- Jerarquías financieras
- Códigos de estado o país
- Monedas
- Tipos de unidades organizativas
- Códigos de idioma
- Segmentos de clientes
- Tareas y procesos comerciales
¿Por qué son importantes los datos de referencia?
Debido a las complejas conexiones entre dominios y aplicaciones compuestas por datos de referencia, la gestión de esos datos puede presentar algunos desafíos. Es por eso que la gestión de datos de referencia (RDM) es tan importante para manejar posibles problemas como la gobernanza, el control de versiones y las jerarquías personalizadas. Los datos de referencia deberán definirse según los términos comerciales y contrastarse con las reglas creadas por la empresa, administrarse en jerarquías, compartirse para la colaboración y monitorearse para detectar cambios realizados por diferentes usuarios, calidad de datos e informes.
Los datos de referencia están en todas partes y deberán administrarse para que los sistemas de una organización funcionen en sincronía con datos precisos e interoperables. Sin esta gestión, los datos de referencia se almacenarán en silos dentro de una organización y, por lo general, se definirán y gestionarán de forma diferente de una aplicación a otra, perdiendo precisión y volviéndose ineficaces en cuanto a costes.

Beneficios de gestionar y distribuir datos de referencia
Las variaciones en los datos de referencia de una organización pueden causar serios problemas en la calidad de los datos, provocando tiempo de inactividad, inexactitud y mala toma de decisiones. Pero con una forma centralizada de administrar sus datos de referencia, una organización podrá capitalizar los beneficios que se enumeran a continuación:
- Costos de TI reducidos: con un lugar central para almacenar y administrar los datos de referencia, las organizaciones reducirán los costos de almacenamiento asociados de múltiples sistemas. Esto también acelerará el tiempo y el dinero invertidos en modificar los datos de referencia en toda la empresa.
- Actualizaciones ágiles: esto también ayudará a reducir los esfuerzos involucrados en cambiar y actualizar los datos de referencia. A su vez, reducirán el tiempo necesario para proyectos de integración de datos.
- Riesgos reducidos: como se mencionó, los datos de referencia deficientes significan una calidad de datos deficiente, lo que puede ser arriesgado en términos de tomar decisiones comerciales sobre datos inexactos y en términos de cumplir con las regulaciones de datos. Al poner controles alrededor de los datos de referencia y auditar los cambios en ellos, las organizaciones reducirán en gran medida el riesgo de datos incorrectos o inconsistentes.
- Informes de BI mejorados: los datos de referencia también notifican los informes de inteligencia de negocio (BI). Una mejor gestión de los datos de referencia garantiza que los informes de una organización sean precisos y fiables para que los usuarios empresariales los utilicen en los procesos de toma de decisiones.
¿Quién posee datos de referencia?
Todas las empresas de todos los sectores poseen datos de referencia. A continuación se muestran algunas industrias en las que los datos de referencia son extensos y, por lo tanto, su gestión exitosa es crucial:
- Servicios bancarios y financieros: los identificadores seguros se utilizan frecuentemente en la industria financiera para realizar transacciones o completar transacciones. Estos marcadores son una forma de datos de referencia y son esenciales para la industria.
- Gobierno/sector público: los gobiernos y otros organismos reguladores suelen utilizar datos de referencia para realizar un seguimiento de los registros públicos y mantener la coherencia en varias organizaciones.
- Cuidado de la salud: dentro de la industria de la salud, los datos de referencia son fundamentales, por ejemplo, para garantizar asociaciones precisas entre los resultados de laboratorio y la información del paciente.
- Viajes y hostelería: las aerolíneas, los hoteles, los coches de alquiler y otras empresas relacionadas con los viajes dependen de los datos de referencia para organizar grandes operaciones y mantener una experiencia excepcional para el cliente.
- Comercio electrónico: a medida que más y más empresas se mueven en línea y se alejan de los modelos comerciales tradicionales, las operaciones de comercio electrónico y, por lo tanto, los datos de referencia seguirán adquiriendo importancia. Los códigos de transacción, la información del cliente y otros datos deberán vincularse de manera coherente para garantizar la seguridad y la eficiencia.