分享交流 共同进步 供需对接 精准服务

Sharing and communication, common progress, supply and demand docking, precise service

返回列表

内容详情

细化企业级数据标准,助力标准化质量检核

来源:数据治理周周谈 发布时间:2021-02-04

合理的规则用于数据分类管理,如何制定一套高效全面的数据标准成为众多企业管理数据资产时面临的共同问题。标准的分类不够细化会产生诸多数据管理问题,因而,企业级数据标准的细化工作也要尤为加强,从而推动数据标准从制定到应用的合理化、标准化,助力数据质量管理的标准化。

目前企业对于数据标准体系的划分大多以数据内容为出发点,从数据应用视角将企业数据定义为数据域、数据子域和信息实体三级,粒度由粗到细,数据域包括客户、产品、交易、账户等,便于用户对数据的使用。今天我们主要从数据管理角度出发,谈谈如何细化企业级数据分类标准,助力标准化的质量检核工作。

一般来说,根据数据来源及数据特性不同,企业数据可分为内部数据和外部数据,结构化数据和非结构化数据。

image.png

一、内部数据和外部数据

1.1内部数据

指由企业内部的业务流程和经营产生的数据,这些数据可以是客户信息、交易记录、订单信息、财务数据等,会受到企业经营的影响。内部数据是企业的重要资产,可以增加企业价值,在管理这些数据时需要从源头上把握数据质量,健全数据管理体系,将数据进行统一管理。

1.2外部数据

除了内部数据之外,企业数据还会存在很多经营范围以外的外部数据,一般包括两部分:一是从公共领域获取的数据,包括诸如汇率、行业价格和经济指数之类的信息数据;二是指企业从外部厂商购买接入的数据,如银行业金融机构一般需要引入大量的外部数据。这些外部数据都有一个共同特点,即不受企业经营的影响,企业在接入外部数据时需遵循统一的技术标准,实现数据的有效调用和质量保证,统一数据标准的建立。

二、结构化数据和非结构化数据

结构化数据:从名称中看出是指高度组织和整齐格式化的数据,可以存储在关系数据库里,使用结构化查询语言SQL等查找这些数据,通俗来说,结构化数据可以理解成能够放入电子表格中的数据,如客户姓名、证件号码、银行账号、交易金额、流水号等。

非结构化数据:可以理解为结构化数据之外的数据,形式相对不固定,不能放入电子表格中,一般存储在非关系数据库中,采用NoSQL语言进行查询。典型的非结构化数据包括图片数据、音频数据、电子邮件、位置信息等。

结构化数据可分为基础类数据和指标类数据,基础类数据和指标类数据下有进一步的细分标准,同时对应不同的质量检核要求,基于数据标准体系的细化支撑数据质量管理工作。

image.png

2.1基础类数据

基础类数据可以理解为业务流程中直接产生的,未经过加工和处理的基础业务信息。根据数据特性及管理方式的不同,基础类数据可进一步划分为主数据、枚举数据、业务数据和日志数据。

2.2指标类数据

指标类数据指能够反映企业业务经营管理状态的、可量化的概念或数值,是具备明确业务含义和统计意义的数据,来源包括但不限于各业务部门的业务经营分析报告、各类管理报表、用户画像标签体系等。

根据指标计算逻辑不同,指标数据分为原子指标,派生指标和组合指标三种类型。

image.png

根据指标应用场景不同,指标类数据可进一步分为报表数据和数值标签。

image.png

指标类数据在质量检核管理上注重指标含义的准确性和加工口径的明确性,原子指标不可拆分,派生指标维度明确,组合指标计算逻辑明确。管理上要重点加强指标数据体系的建设,注重指标监控,严格管理涉及指标变更和新增的需求。

在做好数据标准体系细化管理的同时,可信数据源的把控也是不容忽视的核心管理工作,尤其是主数据和事务数据等关键数据必须进行可信数据源的认证管理,达到“数据同源”,提升数据质量,可信数据源在管理上应当满足:第一,是业务上首次正式发布某项数据的存储系统;第二,是作为唯一数据源头被其他系统调用;第三,是数据维护最及时和正确的存储系统。

数据是企业经营过程中积累的宝贵资产,通过细化企业数据标准,加强企业数据分类管理框架建设,对不同特性的数据采用标准化的质量检核管理,同时做好关键数据的权威系统把控,从而让数据为企业创造更大的价值。


修改密码

联系客服

回到顶部