数据治理3:MDM和RDM
发布时间:2025-12-30 | 作者:苏卡尼亚·科纳塔姆
什么是数据治理?
数据治理是一个框架,它是通过具有不同角色和职责的个人之间的协作而开发的。该框架的目的是建立帮助组织实现其目标的过程、策略、标准和度量。这些目标可能包括为业务操作提供可靠的数据、开发准确的分析以评估性能、遵守法规要求、保护数据、确保数据隐私以及支持数据管理生命周期。
数据治理的重要领域如下图所示。
什么是主数据管理(MDM)?
主数据管理(Master Data Management,MDM)是帮助组织确保其共享数据资产的一致性、准确性和可问责性的基本原则。主数据管理需要IT团队与业务团队的协作配合,以确保企业官方主数据的语义一致性、规范管理及统一标准。主数据由一套统一且一致的属性及标识符构成,用以描述组织的关键实体,例如客户、供应商、公民、潜在客户、层级结构、地点、产品以及会计科目表。
为此,主数据管理利用技术为每个实体创建唯一的主记录,通过数据丰富、协调与去重处理,最终形成可靠的数据来源。通过实施主数据管理,企业能够确保数据的准确性、一致性与可靠性,这对明智决策与业务成功运营至关重要。
MDM实现风格类型
主数据管理存在多种实施类型,可根据成本、性能、可靠性和可用性等多项参数选择合适的模型。
业界目前主要采用以下四种主数据管理架构模型:
- 注册表模式
- 合并模式
- 共存模式
- 集中式模式
注册表式主数据管理实施模式
注册表模式非常适用于从多源系统快速采集数据的场景。若企业需要以较低成本快速构建黄金记录,注册表系统可通过算法清洗数据后存储至主数据管理平台来实现。主数据管理平台中的数据仅供读取,或可向下游数据使用方及应用系统推送。由于源系统数据不会通过主数据管理注册表进行更新,源数据系统将保持不变,从而保留所有未清洗数据的原始历史记录。
该模式为核心主数据属性建立索引,形成单一、只读的权威记录,但不会对分布在多个联邦式主数据管理系统中创建的扩展数据属性进行统一主数据管理。
合并式主数据管理实施模式
合并式主数据管理实施模式是在注册表模式基础上的升级版本,增加了数据治理环节。该模式适用于多数据源场景,其数据处理流程与注册表模式保持一致。多源数据被整合至主数据管理枢纽后,先通过算法进行清洗,再经由人工数据管理员对存疑数据进行审查与修正。这种机制使数据准确度融入了计算机无法提供的人工智慧判断,从而获得更高的数据精确性。提升的数据准确性有助于支持合并式模式中高质量的分析功能与报表生成能力。
共存式主数据管理实施模式
在合并式模式基础上,共存式主数据管理实施模式构建了数据回写功能,可将主数据记录同步更新至各源系统。由此形成主数据枢纽与上游数据源两端同时存在主数据记录的架构。该模式有助于数据创建方持续获取源系统中的最新信息,但要求各源系统具备数据清洗功能以确保数据完整性。
集中式主数据管理实施模式
集中式主数据管理实施模式通过主数据管理枢纽,对主数据的安全管控、可视性策略及所有权实行最大化集中管理,不允许其他任何系统修改主数据记录。数据创建行为统一在枢纽端发起,数据管理员直接在管理枢纽端审查存疑记录。该模式下不存在分散的源系统,只有订阅主数据管理服务的下游数据接收方。集中式系统能在所有数据域始终保持最高精度,但其建设与维护成本也与之相应。
主数据管理工具
市场上常见的主数据管理工具包括:
- Ataccama
- Collibra
- Informatica
- Precise
- Oracle
参考数据管理(RDM)
参考数据管理(Reference Data Management,RDM )系统负责跨系统、跨业务线对参考数据进行组织、更新与整合,并管理分类体系与层级结构。该系统涵盖内部与外部数据,着力实现系统内及跨系统间数据值与定义的标准化。
该体系对于保障业务流程的诚信度与可靠性至关重要,同时有助于减少错误并提升效率。
总结
本文的核心要点如下:
- 整合多源系统数据时,必须建立完善的数据治理框架。
- 主数据管理是确保组织共享数据资产保持一致性、准确性与可追溯性的关键领域。
- 主数据管理需要业务团队与信息技术团队协同合作,以维护企业官方主数据的语义一致性、规范管理与统一标准。
- 主数据管理存在四种实施模式,应根据不同参数选择合适的模型。
- 参考数据管理对于保障业务流程的诚信度与可靠性至关重要,同时有助于减少错误并提升效率。