Ebay--Why do we do data governance
- To ensure security and privacy of the data and access control.
确保数据和访问控制的安全性和私密性。
To capture the metadata of datasets for security and end-user data consumption purposes.
出于安全性和最终用户数据消耗的目的,捕获数据集的元数据。
To help to ensure the quality of the data.
帮助确保数据质量。
To identify the owner of the data set.
标识数据集的所有者。
此外,当前大数据平台正在面对各种挑战:
从上述挑战中可以总结出数据治理需要做的事,后续篇章会详细介绍。
数据不会无缘无故的产生,也不会自己表述其具有的含义,更不会自己管理自己,所以我们才会有数据治理。如果用数据库的表设计来说明的话,我们大概分为三个部分,分别如下:
按照元数据的功能来划分:[1]是业务元数据;[2]和[3]属于技术元数据;还有一个是操作元数据,主要就是描述数据是怎么产生,如DB的日志,数据使用的时候安全,审计,血缘等信息。
数据治理实际就是在管理业务元数据,技术元数据,操作元数据这三方面的内容。广义的来看,除了业务逻辑直接读写处理的那些业务数据,所有其它用来维持整个系统运转所需的信息/数据都可以叫作元数据。比如数据表格的Schema信息,任务的血缘关系,用户和脚本/任务的权限映射关系信息等等
常见的元数据信息
- 数据的表结构Schema信息
- 数据的空间存储,读写记录,权限归属和其它各类统计信息
- 数据的血缘关系信息,不同数据任务之间的依赖关系
- 数据的业务属性信息,数据的业务属性信息,通常与底层系统自身的运行逻辑无关,需要从外部获取
比如一张数据表的统计口径信息,这张表干什么用的,各个字段的具体统计方式,业务描述,业务标签,脚本逻辑的历史变迁记录,变迁原因等等,采集和展示也就需要尽可能的和业务环境相融合
包括元数据采集、血缘分析、影响分析等功能
包括标准定义、标准查询、标准发布等功能
包括质量规则定义、质量检查、质量报告等功能
包括数据处理、数据加工、数据汇集等功能
包括数据资产编目、数据资产服务、数据资产审批等功能
包括数据权限管理、数据脱敏、数据加密等功能
包括数据归档、数据销毁等功能
包括主数据申请、主数据发布、主数据分发等功能
原文:https://www.cnblogs.com/CodingJacob/p/13266890.html