¿Qué es la calidad de datos?

La calidad de datos se da cuando los datos se ajustan al propósito para el que fueron destinados. Los datos también se consideran de alta calidad cuando representan con precisión los conceptos del mundo real.

Para comprender esto, debe entender que los datos son la piedra angular de una jerarquía que se construye sobre ellos. Sobre la base de los datos, viene la información, que son datos colocados en contexto. De la información procesable surge el conocimiento, que se convierte en sabiduría cuando se aplica. Los datos de mala calidad darán como resultado una mala calidad de la información, y esto sube en la jerarquía, lo que da como resultado malas decisiones comerciales.

Diagrama de calidad de datos

Cuando los datos se ajustan a un propósito previsto y representan los conceptos del mundo real, se considera que son de alta calidad. Sin embargo, esto también puede ser de naturaleza contradictoria.

Tomemos, por ejemplo, el registro de datos maestros para un cliente que utiliza un producto de la empresa. Los datos en el registro maestro pueden ser suficientes para emitir una factura a dicho cliente, pero la falta de detalles precisos sobre la dirección y el número de teléfono puede no ser lo ideal para el departamento de atención al cliente, y esto puede generar un problema comercial.

Idealmente, el registro de datos maestros debería servir para múltiples propósitos. Para esto, es necesaria una alineación del mundo real donde los datos se ajusten a su propósito previsto y también se puedan usar para otros objetivos comerciales. Esto debe hacerse sin una necesidad desproporcionada de recursos para recopilar datos. En otras palabras, se requiere un equilibrio de los dos aspectos de la definición de la calidad de datos.

El error humano encabeza la lista como motivo de inexactitud que conduce a datos de mala calidad. Trabajar en la corrección de datos de baja calidad lleva mucho tiempo, requiere un tarea hercúlea y necesita una combinación ideal de personas, mejores procesos y tecnologías. Otras razones para la calidad inferior de los datos incluyen la falta de comunicación entre departamentos y estrategias de datos inadecuadas. Abordar estos problemas depende de una gestión proactiva.

Modernice su arquitectura de datos y análisis
Modernice su arquitectura de datos y análisis
Consulte estos 13 casos de uso para aprender cómo respaldar el complejo panorama actual de datos y análisis.

Importancia de la calidad de datos

En toda la jerarquía de una empresa, no hay duda de que los datos de buena calidad funcionan a favor de los resultados finales. Sin embargo, quedan dudas sobre quién es responsable de garantizar que la calidad de datos sea consistentemente buena y cómo se financiarán estos esfuerzos en una organización. La calidad de datos debe probarse minuciosamente para comprender su impacto, positivo o negativo, en una empresa, y esto puede ser bastante difícil. La importancia de implementar protocolos para garantizar la calidad de datos se puede ver en los siguientes ejemplos:

  • Para el departamento de marketing de su empresa, el problema de la duplicación de datos puede llevar a un gasto excesivo del presupuesto de marketing. Por ejemplo, la misma base de datos puede recibir materiales de marketing con ligeras variaciones en el nombre de un cliente potencial. Esto no solo puede frustrar al cliente, sino también crear duplicaciones completas de perfiles de clientes.
  • El departamento de ventas en línea puede estar impulsando una agenda para la creación de una decisión de compra de autoservicio. Pero con la falta de datos de productos completos dentro de las bases de datos existentes y con la forma en que los datos de productos se sindican entre los socios de productos, la calidad de datos puede ser una tarea difícil de implementar.
  • Para la parte de la cadena de suministro de su negocio, donde usted podría estar buscando automatizar procesos, es difícil lograr datos de ubicación confiables porque los mismos estándares y precisión con los datos de ubicación no se pueden aplicar a todas las ubicaciones a las que se presta servicio.
  • Para los departamentos que dependen de los informes financieros, el problema de recibir una amplia gama de respuestas a una sola pregunta ocurre debido a datos inconsistentes, falta de datos actualizados o falta de parámetros de datos claros.

Todo esto se une para crear un impacto drásticamente negativo en los aspectos corporativos de una empresa y dificulta el cumplimiento de los objetivos comerciales. La mayoría de estos objetivos son comunes a una amplia gama de empresas.

Sin una buena calidad de datos, las empresas:

  • No podrá aprovechar las nuevas oportunidades de mercado. Esto puede dañar sus márgenes de beneficio y obstaculizar su trayectoria de crecimiento.
  • No podrá introducir medidas de reducción de costes. La falta de datos de buena calidad requiere que se realicen muchas inspecciones y correcciones manuales antes de poder utilizarlos. Entonces, la automatización de procesos se vuelve difícil sin datos completos y consistentes.
  • No podrá cumplir con los requisitos de cumplimiento, ya que será cada vez más difícil sin datos de buena calidad. Los requisitos cubren aspectos como las normas de privacidad y protección de datos, así como los requisitos de salud y seguridad. También cubre aspectos de restricciones financieras y lineamientos. Tener datos de buena calidad es esencial para alcanzar los objetivos de cumplimiento.
  • Tendrá dificultades para hacer uso de herramientas de análisis predictivo sobre activos de datos corporativos. Esto puede afectar tanto las decisiones a corto como a largo plazo, haciendo que las cosas sean extremadamente difíciles para una empresa en términos de progreso. Los desafíos que enfrentan surgen de problemas como la duplicación de datos, datos incompletos, inconsistencia e inexactitud de las predicciones.
Informe O'Reilly: Creación de una infraestructura unificada de datos
Informe O'Reilly: Creación de una infraestructura unificada de datos
Solo un tercio de las empresas se convirtieron en organizaciones basadas en datos. ¿Cual es la solución? ¡Descúbralo en este libro electrónico!

Los beneficios de los datos de calidad

Las organizaciones que invierten en la creación de datos de calidad pueden aprovechar los datos para tomar mejores decisiones comerciales.

Los datos de alta calidad facilitan una mejor toma de decisiones

El mercado actual está naturalmente centrado en el consumidor. Con datos de alta calidad, las empresas podrán facilitar mejores decisiones. Por ejemplo, si un análisis de datos muestra que las personas han comenzado a pasar cada vez más tiempo al aire libre (comprando y cenando) los jueves que los viernes habituales, entonces las empresas pueden optar por permanecer abiertas más tiempo o poner a disposición ofertas únicas para impulsar el negocio.

Mejores colaboraciones en equipo

Cuando los muchos departamentos de una organización tienen acceso constante a los mismos datos de alta calidad, el resultado es una comunicación mucho mejor y más eficaz. Esto facilita que todos los miembros del equipo permanezcan alineados en términos de prioridades, los mensajes que se transmiten y la marca. Esto se une para garantizar mejores resultados.

Comprender mejor al cliente

Con datos de buena calidad, las empresas pueden evaluar mejor los intereses y requisitos de los clientes. Esto ayuda a una organización a crecer mediante la creación de mejores productos que se basan en las necesidades del cliente. Las campañas creadas pueden impulsarse en función de los deseos del consumidor y la retroalimentación directa de los datos, no solo conjeturas informadas.

¿Cómo evaluar la calidad de datos?

Dado el hecho de que las organizaciones pueden perder considerablemente si los procesos comerciales se basan en datos de mala calidad, se vuelve imperativo que los propietarios y gerentes entiendan cómo se puede evaluar la calidad de datos. Esta tarea incluye la configuración de métricas y procesos que evalúan la calidad de datos. Las empresas deberán trabajar para hacer que sus datos tengan una alta clasificación tanto para las evaluaciones objetivas como para las subjetivas. Para que las empresas mejoren la calidad de datos, deberán:

  • Evaluar profundamente las métricas de calidad de datos tanto objetivas como subjetivas
  • Analizar los resultados y determinar las causas de cualquier discrepancia
  • Trabajar en formas de mejorar

Evaluaciones de datos subjetivos

Con evaluaciones subjetivas, las organizaciones miden cómo las partes interesadas, los analistas, los recopiladores y otras partes perciben la calidad de datos. Si cualquiera de las partes interesadas toma una decisión basada en los datos que recibe, pero descubre que es inexacto o incompleto, entonces su decisión se verá afectada, lo cual deberá tenerse en cuenta al buscar lagunas en la calidad de datos.

Evaluaciones de datos de objeciones

Las evaluaciones objetivas de la calidad de datos analizan indicaciones medibles, que se registran dentro de un conjunto de datos y luego se evalúan desde dos perspectivas:

  • Su desempeño dentro de una tarea específica
  • Desde el punto de vista de que es un conjunto de datos basado en métricas que se puede usar de forma independiente

Para establecer estas métricas para la evaluación de datos objetivos, las organizaciones pueden trabajar en principios para desarrollar indicadores clave de rendimiento (KPI) que coincidan con sus necesidades específicas. Estas se conocen como formas funcionales. Existen tres formas en las que se mide la calidad de las formas funcionales:

  • Relación simple: aquí el número total de resultados deseados se mide con el total de resultados posibles. El rango generalmente se encuentra entre 0 y 1, siendo 1 el resultado más preferido. Tanto la integridad como la consistencia se pueden medir con esta relación. El problema aquí es que ambas dimensiones se pueden medir de varias maneras diferentes y las organizaciones deberán tener criterios establecidos para que surjan las mejores medidas.
  • Mínimo o máximo: creado para manejar múltiples variables de calidad de datos, esta forma funcional tiene el mínimo como un número conservador y el máximo como un número más liberal. Las variables, como el nivel de precisión de los datos, están marcadas por mínimos. Aspectos como la puntualidad y/o la accesibilidad están representados por máximo.
  • Promedio ponderado: Usado como una alternativa al mínimo, estos pueden usarse cuando una organización está tratando de investigar y comprender el valor que cada variable aporta a la ecuación.

Una vez que una organización ha evaluado todas las métricas de calidad de datos objetivas y subjetivas, puede pasar a tomar medidas que ayudarán a optimizar sus procesos. Tomarse el tiempo para observar los procesos y tomar decisiones objetivas es una pérdida de tiempo a menos que las acciones tomadas sean efectivas y consistentes.

Cómo mejorar la calidad de datos

Para cualquier organización, mejorar la calidad de datos se trata de la combinación correcta de personas calificadas, procesos inteligentes y tecnologías precisas. Todo esto, combinado con una gestión proactiva de alto nivel puede ayudar a mejorar sustancialmente la calidad de datos.

Dimensiones de la calidad de datos

Cuando se trabaja para mejorar la calidad de datos, la tarea principal es mejorar la gama de dimensiones de la calidad de datos. La dimensión más abordada es la de la unicidad de los datos maestros del cliente. Esta base de datos a menudo sufre de duplicación donde dos o más filas de entrada pueden tener los mismos datos de una entidad (que es el cliente). Existen numerosas formas de garantizar que los datos no se dupliquen, tanto en el punto de entrada como con técnicas de deduplicación de datos ya almacenados en las bases de datos.

En el caso de los datos maestros del producto, la dimensión de unicidad no es un gran problema con el que lidiar. Más bien, es el de la plenitud. La razón principal de la falta de exhaustividad es que las diferentes categorías de productos tendrán requisitos diferentes y no todos se completarán. En muchos casos, la conformidad de los datos del producto tiene una relación directa con las ubicaciones, por ejemplo, las medidas unitarias. Mientras que los Estados Unidos mide la longitud en pulgadas, el resto del mundo mide en centímetros.

Trabajar con datos maestros para la ubicación conlleva el problema de la falta de una plantilla de entrada coherente. Con tantos formatos diferentes que se utilizan en todo el mundo, la estandarización de las entradas puede ser extremadamente difícil.

Aspectos a considerar en las intersecciones

En algún momento, la ubicación y los dominios de los clientes se cruzarán y la dimensión de precisión será difícil de mantener. Esto se debe a que los diferentes casos de uso utilizan diferentes dimensiones de precisión para la ubicación.

Para permitir que esta intersección suceda con éxito, es importante comprender los deseos de los clientes, en función de qué detalles relevantes de un producto se pueden compartir con ellos. Esto ayudará con la intersección de los dominios de datos maestros de clientes y productos.

Seis dimensiones principales para basar los estándares de calidad de datos

Estos estándares pueden variar de un proyecto a otro, pero la base generalmente debe ser la misma. Los datos de alta calidad siempre tendrán estos seis estándares básicos.

  1. Amplitud: analice qué campos esenciales deben completarse para que un conjunto de datos se considere completo. En el caso de una base de datos de clientes, el nombre y la dirección serán imprescindibles, pero dependiendo del producto o servicio, el género puede no serlo. Cada vez más, se plantea la eliminación de Sr./Sra./Sra., no solo para ser más inclusivo con aquellos que no encajan en ninguna categoría, sino porque simplemente no es necesario saberlo.
  2. Coherencia: asegúrese de que todas las iteraciones de cualquier dato sean las mismas en todos los informes, resultados de análisis u hojas de cálculo que se estén creando y utilizando. Busque inconsistencias, ya que pueden generar datos de mala calidad en el futuro. Un buen software debería ayudar a eliminar o identificar inconsistencias.
  3. Exactitud: la coherencia es necesaria para garantizar un valor único en todos los canales. La precisión, por otro lado, se ocupa de que esos valores sean correctos y reflejen la realidad que representan los datos. Si esto es un problema, el uso de la robótica para ingresar datos puede eliminar el error humano.
  4. Formato: Garantizar que los formatos de ingreso de datos sean consistentes debe ser la piedra angular del ingreso de datos. Produzca un formato singular y apéguese a él, incluso para los detalles más pequeños, como el año de fabricación. ¿Formato de fecha americano o inglés? ¿Es todo en mayúsculas?
  5. Período de tiempo: la efectividad de cualquier dato es qué tan actual y relevante es en el momento en que el usuario final lo utiliza. Cuando los datos están actualizados, disponibles para los responsables de la toma de decisiones en el momento adecuado y son la versión más actualizada de sí mismos, se puede garantizar la puntualidad.
  6. Integridad: este es un criterio que determina si un conjunto de datos cumple con las reglas y estándares establecidos por la organización. Los valores faltantes pueden alterar la eficacia de los datos.

Asegurarse de que estas dimensiones se cumplan claramente proporcionará a las organizaciones conjuntos de datos precisos, de alta calidad e indispensables para la toma de decisiones de calidad.