WhereHows 元数据管理平台中的标签(Tags)使用教程
2025-07-06 06:02:12作者:瞿蔚英Wynne
标签的概念与价值
在数据治理领域,标签(Tags)是一种轻量级的分类机制。与正式的业务术语表(Business Glossary)不同,标签具有以下特点:
- 非正式性:不需要严格的审批流程
- 灵活性:可以快速创建和应用
- 可扩展性:随着业务发展可以随时添加新标签
在WhereHows平台中,标签可以应用于数据集、数据集模式或容器,帮助用户快速分类和发现数据资产。
标签操作全流程指南
准备工作
在开始标签操作前,请确保:
- WhereHows实例已部署并运行
- 示例数据已成功注入系统
- 目标数据集存在于系统中
创建标签
创建标签是标签管理的第一步。以下是创建"Deprecated"标签的示例:
mutation createTag {
createTag(input:
{
name: "Deprecated",
id: "deprecated",
description: "标记此标签表示该列或表已弃用"
})
}
成功创建后,系统会返回标签的唯一标识符URN。
验证方法:
- 在UI界面查看新创建的标签
- 使用命令行工具查询标签属性
查询标签
了解如何读取数据集上的标签信息对于数据发现至关重要:
query {
dataset(urn: "urn:li:dataset:(urn:li:dataPlatform:hive,SampleHiveDataset,PROD)") {
tags {
tags {
tag {
name
urn
properties {
description
}
}
}
}
}
}
此查询会返回数据集上所有标签的详细信息,包括标签名称、URN和描述。
添加标签
数据集级标签添加
为整个数据集添加标签:
mutation addTags {
addTags(
input: {
tagUrns: ["urn:li:tag:deprecated"],
resourceUrn: "urn:li:dataset:(urn:li:dataPlatform:hive,fct_users_created,PROD)",
}
)
}
列级标签添加
为特定数据列添加标签:
mutation addTags {
addTags(
input: {
tagUrns: ["urn:li:tag:deprecated"],
resourceUrn: "urn:li:dataset:(urn:li:dataPlatform:hive,fct_users_created,PROD)",
subResourceType:DATASET_FIELD,
subResource:"user_name"})
}
操作验证:
- 在UI界面检查标签是否已正确添加
- 使用命令行工具查询globalTags属性
移除标签
当标签不再适用时,可以将其移除:
mutation removeTag {
removeTag(
input: {
tagUrn: "urn:li:tag:deprecated",
resourceUrn: "urn:li:dataset:(urn:li:dataPlatform:hive,fct_users_created,PROD)",
subResourceType:DATASET_FIELD,
subResource:"user_name"})
}
最佳实践建议
- 标签命名规范:建议使用简洁明了的名称,避免特殊字符
- 标签描述:为每个标签提供清晰的描述,说明其用途
- 标签生命周期管理:定期审查不再使用的标签
- 权限控制:虽然标签是非正式的,但仍应考虑适当的权限管理
常见问题解答
Q: 标签和业务术语表有什么区别? A: 标签是非正式的、灵活的分类方式,而业务术语表是正式的、严格管理的业务词汇。
Q: 一个实体可以有多少个标签? A: 理论上没有限制,但建议保持合理数量以确保可管理性。
Q: 标签是否支持层级结构? A: 标准标签是扁平的,但可以通过命名约定实现伪层级。
通过本教程,您应该已经掌握了WhereHows平台中标签的完整操作流程。标签作为轻量级的数据分类工具,可以显著提升数据发现和管理效率。