数据治理1:数据隐私和安全
发布时间:2025-12-28 | 作者:苏卡尼亚·科纳塔姆
在每个企业组织中,可能有多个源系统来满足不同的需求。根据组织的规模,源系统可能从一个到1000多个不等。组织通常将数据集中在一个地方,进行集成,并从数据中获取价值,例如360度的客户、产品视图,等等。要实现这一点,需要有一个好的数据治理框架。
数据治理框架可以帮助企业组织以适当的方式对数据进行分组,管理数据,确保数据质量,验证数据的一致性和完整性,从而提高决策能力,并以适当的方式保护数据。
数据治理的关键支柱如下所述。数据隐私和安全是任何产品可持续发展和成功的两个关键支柱。
数据隐私和安全
数据隐私和安全可以在每个单独系统的级别上实现。但是,在集成来自不同系统的数据时,必须实现适当的安全框架。否则,可能会导致数据隐私和安全漏洞,对企业组织造成不利影响。下面是数据隐私和安全的图示。
在上图中,各个系统,如财务、人力资源、营销和运营,都是单独保护的。当系统集成到一个集中的数据仓库位置时,就会出现安全方面的挑战。
解决方法
要克服单个系统中的这些安全挑战,主要有两种方法:身份验证(Auth)和授权(AuthZ)。
1.身份验证(Authentication)
身份验证是验证进入应用程序或数据库或任何系统的用户或进程的身份的过程。
在数据库认证模式中,有多种方式可以实现,但比较突出的有:
- 密码认证(例如:SQL Server认证、Snowflake数据库认证)
- Windows 集成身份验证
- 活动目录((LDAP)
- SSO(单点登录认证)
- 密钥对认证
- 基于证书的认证
- MFA(多因素认证)
2.授权(Authorization)
授权是指允许通过身份验证的用户访问不同的对象及其数据,以及用户可以执行的不同操作的过程;例如,只允许用户读取某些记录集或某些属性集,用户只能对某些数据集执行更新或删除操作。
有几种类型的数据授权方法。主要有基于角色的授权和基于用户的授权。根据应用程序的安全复杂性,还可以实现其他方法,如基于属性的授权、基于属性的访问控制、基于上下文的授权和基于规则的授权。
下面,我将简要介绍基于角色的授权和基于用户的授权。
基于角色的授权在这种类型的授权中,将对象和数据安全性分配给角色,然后将用户分配给角色。
在这种类型的授权中,对象和数据安全性将分配给单个用户,并向用户授予对数据库对象和数据的授权。
小结
本文的核心要点如下:
- 当我们集成来自不同源系统的数据时,需要一个健壮的数据治理框架。
- 在数据治理中,数据隐私和安全性是需要考虑的重要组成部分。
- 数据隐私和安全可以在单个系统级别实现;然而,当我们将所有源系统数据放到一个集中的位置时,安全性和数据泄露问题就出现了。
- 身份验证和授权是加强数据治理框架的两种主要方法。