杨志新:政务大数据平台安全防护基本框架研究
关注:11441  发布时间:2019-03-07  作者:杨志新  来源:《2018数字中国优秀CIO百家文集》系列文章
      总体框架分为5个层次。传统信息安全防护借助政务云平台和政务外网的安全防护体系,从机房物理环境、网络层防护、存储安全、云安全、虚拟化安全等各个方面予以保障;大数据平台的安全防护主要针对Hadoop生态环境进行加固处理;数据安全根据数据的生命周期进行数据安全保障,数据分级、分类、数据风险评估、数据脱敏处理是大数据应用数据安全处理的主要措施;大数据平台安全审计根据大数据应用的事前、事中、事后的安全需求进行安全监控预警和事后的安全评估;大数据平台安全接入网关Gateway是大数据平台与数据服务需求者之间的数据服务中介和安全管控模块,数据服务需求者通过Gateway,提交服务申请,连接大数据平台,获取数据服务。
       2.2数据脱敏与数据处理
       2.2.1数据分级分类处理
       根据政府数据分级分类的有关要求,通过智能分类技术,使用先进分类分级引擎工具,准确了解敏感数据在政务大数据中心的分布,对数据进行分级分类,掌控敏感数据的位置,知晓数据分布和风险,进而保护数据资产。分类主要是根据大数据中心现有资源情况,进行分类,如基础类、业务类、主题类等等;分级主要对数据敏感程度进行分级,如极敏感级、敏感级、较敏感级、低敏感级等。
       2.2.2数据风险评估
       对政务大数据平台的数据,根据分级情况进行风险评估,确保只有残留风险在可接受的范围内,数据方可上线大数据平台和系统,以及收集、存储、使用和分发。由于大数据风险评估的参考依据和评估方法存在不足,一般从大数据恶意使用给国家安全、社会公益和个人信息保护带来的损害程度,数据不准确给使用部门和机构带来的利益损失程度,以及数据汇聚带来遭受外来攻击的风险,数据共享带来的安全风险等等进行综合评估。
      2.2.3数据动态脱敏
      通过数据分级分类,建立敏感数据词典,建立敏感数据字段、敏感标签和数据脱敏判定规则,通过内置规则引擎识别敏感数据,解析Hive、Hbase sql语句,对敏感字段数据进行区域划分,基于规则建立脱敏策略,对指定字段的敏感区域进行脱敏,防止敏感数据外流。一般内置识别引擎提供的脱敏算法主要包括替换、随机、模糊、隐匿、泛化、数据格式化、用户自定义算法等。
       2.2.4数据加密存储
       建立敏感数据的加密存储机制。大数据应用时只需对指定的敏感数据进行加密,加解密过程自动完成,业务完全不必感知。加密方式包括基于HDFS对文件敏感内容的加密存储,基于Hive实现列级加密,基于HBase实现列族级加密。由于Hadoop开源生态的加密功能比较薄弱,需要借助商业化的密钥管理产品。一般采用以国产密码算法为主的敏感数据加密服务,密钥与数据分离,实现对敏感数据的加密存储。
热门推荐

友情链接