什么是元数据管理?

元数据管理是管理有关数据的元数据的业务规范。它为组织中的信息资产赋予了意义并对其进行了描述。元数据通过提高数据的可用性和可查找性使其发挥自己的价值。元数据提供了理解和管理系统、数据和业务所需的情境。通过使用元数据管理,可以更轻松地查找和使用数据,并提供业务和 IT 团队所需的关键数据情境。

元数据管理图

元数据提供了有关数据的基本信息,包括文件类型、创建时间、文件大小、作者等。元数据有几种不同的类型,包括描述性元数据、结构化元数据、管理元数据、参考元数据和统计元数据,它们都提供有关数据的唯一信息。您可以手动或自动创建元数据。手动创建元数据可以提供更多细节,而自动创建通常只包含非常基本的信息。通常,信息资产越重要,管理其周围的元数据就越重要。这是因为您需要有关如何使用这一宝贵信息资产的更多信息。如果信息资产不那么重要,则不需要太多的元数据。

强大的元数据管理策略可确保组织的数据在各种系统中保持高质量、一致性和准确性。与没有元数据管理解决方案的组织相比,使用全面元数据管理策略的组织更有可能根据正确的数据做出业务决策。它是任何数据治理计划的重要组成部分。

了解用于治理、管理和使用所有共享数据资产的单一解决方案
了解用于治理、管理和使用所有共享数据资产的单一解决方案
通过一体化方法来管理整个企业的数据资产,避免孤岛。

为什么组织要记录和管理其元数据?

大多数组织的信息体系结构类似于拥挤不堪、杂乱无章的书店。数据到处都是。大多数组织的数据都没有组织或编目,因此很难找到所需的数据。

这就是核心问题—缺乏数据可寻性,因此缺乏数据可用性。而且这个问题只会越来越严重。在 10 年的时间里,组织数据量可以从千兆字节变为兆兆字节再到千万亿字节。在 “数据是新石油” 的时代,成功的组织必须能够找到并使用所有数据才能获得竞争优势。元数据管理的描述和搜索功能对于成功查找和使用该数据至关重要。

元数据管理也很重要,因为定义可能会根据信息上下文而变化。看看不同的小组会如何思考和定义 “客户” 一词,例如,如果您与 IT、销售或合规部的人员交谈,他们可能对客户所代表的内容以及数据的存储方式有不同的看法或观点。对于 IT 而言,有关客户的数据可能侧重于为公司执行分析报告和仪表板,以及存储这些数据的技术性方面。如果您要求 IT 界定 “客户” 数据的位置,他们可能会回答 “这是我们用于报告的企业数据仓库中,其历史可以追溯到 2015 年。我们在数据湖中还有来自新收购的客户数据。这些数据存在于数据湖中,需要在我们进行报告之前进行转换。”因此,对于他们来说,“客户” 数据可能非常注重分析,或者包含历史回溯。

您的销售团队可能更专注于运营,例如他们现在在销售中如何使用客户数据。对他们来说,客户数据可能只意味着活跃的客户或帐户级别的客户数据(例如公司名称),而不是公司曾经拥有的所有客户。销售团队可能会将客户数据称为公司名称,而不是人员级别的数据。而且,合规部门可能会从人员层面考虑客户数据,因为他们对数据的主要用途是遵守 GDPR 等法规。

正如你所看到的,挑战不仅在于定义,还在于这些不同团队和流程之间的定义不一致。此外,数据也在不断增长。您需要能够找到您的数据,才能进行最佳分析。在运营中,您需要了解所有不同的应用程序以及它们从何处获取数据。在合规性方面,您需要确保组织遵守规则;对于 IT 部门,他们主要关心的是生成分析和保存历史记录。

通过元数据管理,您可以为组织的每个部门提供所需的元数据,以了解和管理您的系统、数据、整个组织以及整个组织的统一数据视图。这是组织能够正确履行职能并确保他们最终做对事情的唯一途径。

元数据管理使用案例

元数据管理可帮助组织中的不同角色回答其特定问题,同时确保他们遵守一致的数据视图。

  • 分析:为了获得更具洞察力的分析,用户可以使用自助式数据目录和受管控的工作流为其分析计划搜索、了解和配置数据。它可以帮助您回答诸如 “对我的分析工作来说,什么是最适合的销售数据集?” 之类的问题。
  • 运营:为了优化运营,团队可以发现、收集和管理所有企业元数据资产和数据脉络,以提高运营质量。它可以帮助回答诸如 “配送买家订单涉及哪些系统?”
  • 合规性:为了满足监管要求(GDPR、CCPA、BCBS 239 等),您可以通过数据治理功能(包括数据隐私)来支持合规计划。数据治理团队可以识别关键数据元素、文档定义并报告合规性。它可以帮助回答 “我们在哪里存储和处理个人信息?”

元数据管理解决方案的功能

全面的元数据管理软件是一个单一的解决方案,可以在一个位置捕获和管理所有元数据。要在解决方案中寻找的功能应包括:

  • 元数据管理服务:在一个位置发现、收集和管理业务定义、词汇表、规则等元素的所有元数据。
  • 数据治理解决方案:记录和支持您的治理政策和法规遵从性工作。
  • 数据目录:对包含关键数据资产的底层系统的所有物理数据进行编目,以便进行搜索、协作和提供对这些资产的访问权限。
  • 可作为服务提供:100% 软件即服务,易于配置

全面的解决方案将实现端到端元数据管理。这包括:

  • 发现和提取:自动从本地或云系统收集元数据
  • 元数据存储:用于存储所有业务和技术元数据的单一元数据存储
  • 分类和脉络:机器学习驱动的元数据资产分类到数据元素和可视脉络。
  • 治理和安全:业务词汇表、数据治理政策和监管合规性全部集中在一个平台中。
  • 搜索和协作:搜索整个数据目录。使用评论、评分和标签进行协作。
  • 数据质量 KPI:跟踪所有元数据中的关键数据质量指标。
  • 集成和配置:将元数据作为服务公开。通过目录置备数据访问权限。
O'Reilly 报告:构建统一的数据基础架构
O'Reilly 报告:构建统一的数据基础架构
只有三分之一的企业发展成为数据驱动型组织。解决方案是什么?在这本电子书中找到答案!

元数据管理如何促进协作

如果组织想要达到一定程度的数据素养,则组织中不同类型的角色需要进行协作。数据素养需要团队的努力。这不是个别团队可以单独完成或达成的目标。您需要一种解决方案来管理所有数据并允许数据管理员与数据用户进行交互。

让我们来看看不同的团队是如何使用元数据管理的。例如,治理团队可能更关心定义和法规遵从性,但他们需要与 IT 团队携手合作。IT 团队可能正在对存储信息的物理系统进行编目,记录他们不同控制措施和为系统添加的安全性,与管理系统的不同团队合作,确保他们都接受过隐私和合规性方面的培训,但他们需要与合规团队互动。然后,您的分析用户正在使用大量数据,他们希望确保他们遵守治理策略并遵循安全和 IT 团队制定的协议。所有这些团队之间需要在不同的时间进行互动。

底线:寻找具有协作治理流程的元数据管理解决方案,这些流程包括:工作流、管理、版本控制和审计跟踪。

如今,您的许多元数据都分散在多个应用程序和系统之间。这导致元数据孤岛之间缺乏联系。例如,一些公司将使用某些应用程序进行 ETL,并相应地存储其元数据。他们还有其他专注于数据治理的应用程序,并相应地存储这些数据。他们还有其他应用程序存储数据目录信息并单独存储这些信息。所有这些信息都是相互连接的,应该集中在一个地方,以便通过全面的元数据管理解决方案实现更出色的集成、一致性和控制。

元数据管理和人工智能

由于边缘设备、物联网和人工智能,元数据管理正在发生转变。更需要使用该元数据从数据中挖掘更多价值。

元数据对生产环境(和生产力)的影响将越来越多地取决于对各种类型的编目、映射、数据建模、机器学习和边缘计算。在这些领域成功实施元数据的组织将从元数据管理中受益。

内置的人工智能 (AI) 和机器学习 (ML) 算法有助于元数据分类和数据脉络(水平、垂直、监管)。提供所需的数据情境、一致性和控制力,以便在所有团队和部门中实现最高效率、最佳性能和最明智的决策。