¿Qué son los datos jerárquicos?

Los datos jerárquicos son una estructura de datos cuando los elementos están vinculados entre sí en relaciones padre-hijo en una estructura de árbol general. Piense en los datos como un árbol genealógico, con abuelos, padres, hijos y nietos formando una jerarquía de datos conectados. Por lo general, esto se usa para mostrar un organigrama, un proyecto con tareas o una taxonomía de términos lingüísticos.

Ejemplo de datos jerárquicos

En los datos jerárquicos, cada uno de estos nodos "hijos" tiene solo un "padre", pero cada padre puede tener varios hijos. El primer nodo, en la parte superior de la jerarquía, se denomina nodo raíz. Cuando es necesario recuperar información, se escanea todo el árbol desde el nodo raíz hacia abajo. Dado que es necesario escanear todo el árbol cada vez que un usuario realiza una consulta, el sistema es lento e inflexible. Las bases de datos modernas han evolucionado para incluir el uso de múltiples jerarquías sobre los mismos datos para una búsqueda más rápida y sencilla.

Sin embargo, los datos jerárquicos todavía se usan mucho en la actualidad. Un uso común de una estructura de datos jerárquica es la información de personal. Bajo una estructura de organigrama, tiene el nodo raíz de CEO en la parte superior con una estructura de personal debajo.

Desarrollado por IBM en la década de 1960, el modelo de datos jerárquicos es uno de los primeros tipos de modelos. Sin embargo, se reemplazó rápidamente con un modelo de datos relacionales para superar algunos de los problemas estructurales significativos inherentes a este modelo.

¿Por qué es importante la estructura de datos?

La estructura de los datos de una organización es de vital importancia. Para que una empresa pueda ingresar información, procesarla, recuperarla y mantenerla, elegir el tipo de estructura de datos es absolutamente vital. Imagínese en su ordenador, si no hubiera una estructura de carpetas o convenciones de nombres. La capacidad de encontrar o usar cualquier cosa se vería gravemente comprometida.

En cambio, en una empresa, encontrará carpetas organizadas con nombres de departamentos lógicos. En esos departamentos, las carpetas se pueden organizar por trimestres financieros u otra forma lógica que se aplique a ese negocio. Luego, dentro de eso, los archivos individuales se nombran de forma descriptiva, a menudo con fechas o versiones grabadas en un formato específico. Todos estos se almacenan en orden alfabético. Esto significa que cuando un empleado necesita acceder a un determinado archivo, profundizar y encontrar lo que necesita es una tarea increíblemente sencilla. De manera similar, una buena estructura de datos permite prácticas comerciales buenas, rápidas y eficientes.

Una gran limitación de la ciencia de datos en general es que, aunque el mundo es fluido y 3D, los ordenadores lo perciben como plano e inmutable. Mientras que la gente sabe que hay 200 razas de perros y 200 variedades de serpientes, un ordenador solo sabe que hay 400 artículos. Una estructura de datos es vital para agrupar, acceder, procesar y ver datos de una manera que los ordenadores puedan interpretar.

Descubra una solución única para gobernar, administrar y consumir todos los activos de datos compartidos
Descubra una solución única para gobernar, administrar y consumir todos los activos de datos compartidos
Evite los silos con un enfoque todo en uno para administrar los activos de datos en toda la empresa.

¿Cuándo debe una organización usar datos jerárquicos?

Actualmente, organizaciones como bancos y telecomunicaciones utilizan datos jerárquicos en sus aplicaciones. Esto se debe a que requieren un rendimiento rápido y de alta precisión. El registro de Windows en la mayoría de los ordenadores también es un ejemplo de una estructura de datos jerárquica. Los proyectos de fabricación complejos también suelen utilizar modelos de datos jerárquicos debido a los grandes volúmenes de datos.

Los datos jerárquicos se utilizan mejor cuando:

  • Los datos se pueden almacenar en forma de "árbol" con una estructura clara de padres e hijos.
  • Es necesario capturar la estructura de la jerarquía.
  • Hay requisitos de alto volumen de datos.
  • Los sistemas existentes son demasiado complejos para migrar a un modelo relacional o de red.

Alternativas a los datos jerárquicos.

Datos relacionales

El modelo de datos más común, esto es cuando los datos se agrupan en relaciones. Una colección de variables se agrupan en categorías verdaderas, falsas o nulas. Luego, los elementos de datos se juntan con otros elementos que comparten variables y atributos. Los grupos están unidos entre sí por relaciones. Este grupo de artículos es similar a ese grupo. A diferencia de los datos jerárquicos que están confinados por su naturaleza de uno a muchos, puede haber muchas relaciones en los datos relacionales. Las bases de datos relacionales utilizan el lenguaje de consulta estructurado (SQL), el lenguaje de consulta estándar.

El modelo relacional es excelente para mantener la coherencia de los datos entre instancias. Por ejemplo, si un cliente retira dinero de un cajero automático, ese cambio se reflejará en el saldo de la aplicación del teléfono. Esto lo hace excelente para garantizar que múltiples instancias de datos sean correctas en una variedad de sistemas.

En comparación con una estructura jerárquica, en lugar de almacenar datos en una estructura de árbol, se almacena en tablas.

Modelo de red

El modelo de red, al igual que el modelo de datos relacionales, se creó para resolver las deficiencias inherentes a los modelos de bases de datos jerárquicos. En un modelo de datos de red, un hijo puede vincularse a varios padres, aunque se les llame propietarios y miembros.

Este modelo admite una variedad de relaciones y es mucho más fluido que los modelos jerárquicos. Sin embargo, son mucho más complicados, lo que los hace difíciles de administrar y mantener. Todavía no es tan flexible como los modelos de datos relacionales, y no todas las relaciones se pueden modelar y vincular con precisión a propietarios y miembros.

Ventajas de las estructuras de datos jerárquicas

Los datos se recuperan fácilmente

Debido a que los enlaces entre los nodos de datos están tan bien definidos, encontrar y recuperar datos es fácil. Debido a que el padre y el hijo se almacenan muy juntos, la navegación y la recuperación de datos también son rápidas.

Integridad referencial

La integridad de los datos siempre se mantiene porque todos los cambios realizados en la tabla principal se modifican automáticamente en la tabla secundaria.

Estructura simple

La estructura invertida de la relación entre padres e hijos se comprende de inmediato y con facilidad. Es conceptualmente simple, tiene una cadena de mando clara dentro de la base de datos y, como resultado, ofrece un alto rendimiento. Debido a la estructura simple, también promueve el intercambio de datos.

Buena seguridad

El sistema de gestión de la base de datos proporciona y aplica la seguridad de la base de datos. Es tan seguro que algunos desarrolladores de lenguaje de consulta estructurado dicen que tendrías que ser un mago para obtener los datos.

Libro electrónico de infraestructura de datos unificados
Informe O'Reilly: Creación de una infraestructura unificada de datos
Solo un tercio de las empresas se convirtieron en organizaciones basadas en datos. ¿Cual es la solución? ¡Descúbralo en este libro electrónico!

Desafíos de las estructuras de datos jerárquicas

Inflexibilidad

El modelo es inflexible y rígido, y agregar un nodo o una relación puede alterar toda la estructura. Si una tabla principal y una secundaria no están relacionadas, es difícil agregar una nueva entrada en la tabla secundaria porque primero se deben ingresar datos adicionales en la tabla principal. Del mismo modo, es un desafío mover a un niño de un nivel a otro.

Solo apto para relaciones de uno a muchos

Cuando un padre tiene muchos hijos, esas relaciones son fáciles de mostrar. Sin embargo, cuando hay relaciones de muchos a muchos, estas son más difíciles de expresar. Cualquier cosa más compleja que las relaciones de padre a hijo no se admite en los datos jerárquicos. Los niños no pueden vincularse con otros padres, y no existe la posibilidad de vincular niños de diferentes padres.

Eliminaciones

Si se elimina un padre, todos los hijos (y más allá) también se eliminan automáticamente. Imagínese en su ordenador de escritorio, si elimina una carpeta, elimina todos los archivos dentro de ella. Esto es similar a cómo funciona una base de datos jerárquica para las eliminaciones.

Falta de estándares

No existe una definición de datos específica o un lenguaje de manipulación de datos. En general, el sistema se basa en la rigidez para hacer cumplir las normas, y esto no siempre funciona.

Complejo de implementar

La implementación de sistemas de datos jerárquicos requiere la comprensión de las características de almacenamiento de datos y el conocimiento de la estructura organizativa. Esto hace que sea complicado y difícil de implementar en comparación con otros sistemas.

El futuro de los modelos de datos jerárquicos

Si bien todavía existen algunos modelos que son de naturaleza jerárquica, están cayendo en desgracia. Sería inusual implementar un modelo de datos jerárquico en un sistema nuevo. Su rigidez, dificultad de implementación y enormes restricciones los hacen costosos y difíciles de implementar.

Si bien pueden ser eficientes en términos de acceso a los datos, su naturaleza restrictiva los hace menos capaces de hacer frente a los desafíos de la abrumadora variedad de tipos y volúmenes de datos.

Como uno de los primeros modelos de datos, no se podía haber previsto que la naturaleza veloz de la tecnología la dejaría obsoleta; pero esta pasando El futuro está en la flexibilidad, y en la misma característica que los datos jerárquicos no pueden dar. Las redes y los ecosistemas están reemplazando rápidamente las jerarquías con una forma más orgánica de almacenar y acceder a los datos.