首页
/ WhereHows 元数据管理平台中的标签(Tags)使用教程

WhereHows 元数据管理平台中的标签(Tags)使用教程

2025-07-06 06:02:12作者:瞿蔚英Wynne

标签的概念与价值

在数据治理领域,标签(Tags)是一种轻量级的分类机制。与正式的业务术语表(Business Glossary)不同,标签具有以下特点:

  1. 非正式性:不需要严格的审批流程
  2. 灵活性:可以快速创建和应用
  3. 可扩展性:随着业务发展可以随时添加新标签

在WhereHows平台中,标签可以应用于数据集、数据集模式或容器,帮助用户快速分类和发现数据资产。

标签操作全流程指南

准备工作

在开始标签操作前,请确保:

  1. WhereHows实例已部署并运行
  2. 示例数据已成功注入系统
  3. 目标数据集存在于系统中

创建标签

创建标签是标签管理的第一步。以下是创建"Deprecated"标签的示例:

mutation createTag {
    createTag(input:
    {
      name: "Deprecated",
      id: "deprecated",
      description: "标记此标签表示该列或表已弃用"
    })
}

成功创建后,系统会返回标签的唯一标识符URN。

验证方法

  1. 在UI界面查看新创建的标签
  2. 使用命令行工具查询标签属性

查询标签

了解如何读取数据集上的标签信息对于数据发现至关重要:

query {
  dataset(urn: "urn:li:dataset:(urn:li:dataPlatform:hive,SampleHiveDataset,PROD)") {
    tags {
      tags {
        tag {
          name
          urn
          properties {
            description
          }
        }
      }
    }
  }
}

此查询会返回数据集上所有标签的详细信息,包括标签名称、URN和描述。

添加标签

数据集级标签添加

为整个数据集添加标签:

mutation addTags {
    addTags(
      input: {
        tagUrns: ["urn:li:tag:deprecated"],
        resourceUrn: "urn:li:dataset:(urn:li:dataPlatform:hive,fct_users_created,PROD)",
      }
    )
}

列级标签添加

为特定数据列添加标签:

mutation addTags {
    addTags(
      input: {
        tagUrns: ["urn:li:tag:deprecated"],
        resourceUrn: "urn:li:dataset:(urn:li:dataPlatform:hive,fct_users_created,PROD)",
        subResourceType:DATASET_FIELD,
        subResource:"user_name"})
}

操作验证

  1. 在UI界面检查标签是否已正确添加
  2. 使用命令行工具查询globalTags属性

移除标签

当标签不再适用时,可以将其移除:

mutation removeTag {
    removeTag(
      input: {
        tagUrn: "urn:li:tag:deprecated",
        resourceUrn: "urn:li:dataset:(urn:li:dataPlatform:hive,fct_users_created,PROD)",
        subResourceType:DATASET_FIELD,
        subResource:"user_name"})
}

最佳实践建议

  1. 标签命名规范:建议使用简洁明了的名称,避免特殊字符
  2. 标签描述:为每个标签提供清晰的描述,说明其用途
  3. 标签生命周期管理:定期审查不再使用的标签
  4. 权限控制:虽然标签是非正式的,但仍应考虑适当的权限管理

常见问题解答

Q: 标签和业务术语表有什么区别? A: 标签是非正式的、灵活的分类方式,而业务术语表是正式的、严格管理的业务词汇。

Q: 一个实体可以有多少个标签? A: 理论上没有限制,但建议保持合理数量以确保可管理性。

Q: 标签是否支持层级结构? A: 标准标签是扁平的,但可以通过命名约定实现伪层级。

通过本教程,您应该已经掌握了WhereHows平台中标签的完整操作流程。标签作为轻量级的数据分类工具,可以显著提升数据发现和管理效率。