[发明专利]网络数据安全策略的生成方法、装置及存储介质有效
申请号: | 201811275572.5 | 申请日: | 2018-10-30 |
公开(公告)号: | CN109409127B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 宋鹏举 | 申请(专利权)人: | 北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/332 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 齐洁茹 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 数据 安全策略 生成 方法 装置 存储 介质 | ||
本发明公开了一种网络数据安全策略的生成方法、装置及存储介质,其中,所述方法包括:对所有文档的文档内容进行分析,获得若干分词,并去除所述分词中的停用词获得总体分词;利用最大似然估计算法计算各分词占所述总体分词的概率,获得各分词概率;根据获得的各分词概率,采用信息熵算法分别对各篇文档进行计算,获得各篇文档的熵值;依据所述各篇文档的熵值确定各篇文档的重要度度量值;依据各篇文档的重要度度量值生成安全策略。本发明通过计算各篇文档的重要度度量值,来对数据库中的文档的重要度进行度量,给管理人员以清晰地数据展示,为文档的重要性的判断提供了依据,促进了文档安全策略的更新。
技术领域
本发明涉及数据防泄露技术领域,尤其涉及一种网络数据安全策略的生成方法、装置及存储介质。
背景技术
数据的安全越来越受到企业的关注,企业会有很多重要的数据需要保护,而数据的价值只有在使用中才会体现出来,如何在有效保护数据的前提下,又能充分使用数据,成为了企业的迫切需要。数据防泄露系统就是一款数据安全产品,在数据使用者无感知的情况下能够充分使用数据。数据防泄露系统一般需要配套相应的安全策略,如何制定有效的安全策略是目前领域内的一个重要问题。
现有的数据防泄露的安全策略方案,使用预定义的安全策略,比如设定重要数据的关键字,敏感信息的正则表达式,甚至数据指纹,基于分类的机器学习方法等,而这些规则需要在部署实施数据防泄露系统时预制到系统内。
然而由于安全策略需要预先制定,在大多数情况下,企业并不能清楚的知道所有重要和敏感的数据,因此,大多数预制策略是不完整的;即使是采用了比较充分的预制安全策略,随着企业的业务发展,每天都会有新的数据产生,安全策略并不能完全覆盖新产生的数据,因此会导致安全策略更新不及时。
发明内容
本发明实施例提供一种网络数据安全策略的生成方法、装置及存储介质,用以解决现有技术中存在的安全策略不能及时更新的问题。
第一方面,本发明实施例提供一种网络数据安全策略的生成方法,所述方法包括:
对所有文档的文档内容进行分析,获得若干分词,并去除所述分词中的停用词获得总体分词;
利用最大似然估计算法计算各分词占所述总体分词的概率,获得各分词概率;
根据获得的各分词概率,采用信息熵算法分别对各篇文档进行计算,获得各篇文档的熵值;
依据所述各篇文档的熵值确定各篇文档的重要度度量值;
依据各篇文档的重要度度量值生成安全策略。
可选的,在对所有文档的文档内容进行分析前,所述方法还包括:对数据库中所有文档进行内容提取,获得所有文档的文档内容。
可选的,所述对所有文档的文档内容进行分析,获得若干分词,具体包括:
通过对所有文档的文档内容进行词法分析和句法分析,获得若干分词。
可选的,所述依据所述各篇文档的熵值确定各篇文档的重要度度量值,具体包括:
对各篇文档的熵值进行归一化处理;
将经过归一化处理后的熵值作为各篇文档的重要度度量值。
可选的,所述依据各篇文档的重要度度量值生成安全策略,具体包括:将重要度度量值与预设值进行比较,若重要度度量值大于预设值,则确定文档为敏感文档;对所述敏感文档构建指纹安全策略,或者,从所述敏感文档中抽取重要的关键词以作为安全策略。
第二方面,本发明实施例提供一种网络数据安全策略的生成装置,包括:
分析模块,用于对所有文档的文档内容进行分析,获得若干分词,并去除所述分词中的停用词获得总体分词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司,未经北京天融信网络安全技术有限公司;北京天融信科技有限公司;北京天融信软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811275572.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置