[发明专利]一种结合机器学习的数据防泄漏策略动态更新方法及装置有效
申请号: | 201810212329.2 | 申请日: | 2018-03-15 |
公开(公告)号: | CN108664801B | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 龚剑;喻波;王志海;魏效征;安鹏;韩振国 | 申请(专利权)人: | 北京明朝万达科技股份有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F16/35 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100097 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结合 机器 学习 数据 泄漏 策略 动态 更新 方法 装置 | ||
1.一种结合机器学习的数据防泄漏策略动态更新方法,其特征在于,该方法包括以下步骤:
1)根据用户输入的敏感文档,训练生成机器学习策略,并在策略系统中配置一个高精度匹配阈值和一个低精度匹配阈值,并将机器学习策略下发至DLP系统;
2)当有用户文档向外发送时,对该用户文档进行敏感信息识别;
3)如果该用户文档和机器学习策略的匹配度等于或高于高精度匹配阈值,则阻止用户文档发送;
4)如果该用户文档和机器学习策略的匹配度低于高精度匹配阈值,但高于或等于低精度匹配阈值,则允许该用户文档发送,并形成文档记录,且通知策略管理员对该用户文档进行筛选;
5)根据策略管理员对用户文档的筛选结果确定是否更新机器学习策略;
所述步骤5)具体包括:
5.1)如果策略管理员认为该用户文档包含敏感信息,且符合当前机器学习的智能聚类,则将该用户文档发送至策略系统;
5.2)如果策略管理员认为该用户文档包含敏感信息,且不符合当前机器学习的智能聚类,则建立一个新类或将文档重新归类,并将新类名或归类后的类名、以及用户文档发送至策略系统。
2.如权利要求1所述的方法,其特征在于,所述步骤5)具体包括:
5.3)如果步骤5.1)中发送至策略系统的用户文档,达到预定数量阈值,则策略系统汇总这些用户文档,并结合步骤1)输入的敏感文档,形成新的训练集,更新原有机器学习策略,或者
5.4)对于步骤5.2)发送的新类名或归类后的类名、以及用户文档,策略系统训练这些新类的用户文档,形成新类的机器学习策略,并根据预设值,设置该机器学习策略的高/低精度匹配阈值。
3.如权利要求2所述的方法,其特征在于,所述步骤5.4)中,对发送重新归类后的类名、以及用户文档,如果对于该类的用户文档,达到一定数量,则策略系统汇总这些用户文档,结合之前的训练文档,形成新的训练集,并更新原有机器学习策略。
4.如权利要求1-3之一所述的方法,其特征在于,对于一类敏感文档,训练生成一条机器学习策略。
5.一种结合机器学习的数据防泄漏策略动态更新装置,其特征在于,该装置包括:机器学习策略生成模块,根据用户输入的敏感文档,训练生成机器学习策略,并在策略系统中配置一个高精度匹配阈值和一个低精度匹配阈值,并将机器学习策略下发至DLP系统;
敏感信息识别模块,对外发的用户文档进行敏感信息识别;
文档阻止模块,阻止和机器学习策略的匹配度等于或高于高精度匹配阈值的用户文档发送;文档筛选模块,允许和机器学习策略的匹配度低于高精度匹配阈值,但高于或等于低精度匹配阈值的用户文档发送,并形成文档记录,且通知策略管理员对该用户文档进行筛选;
机器学习策略更新模块,根据策略管理员对用户文档的筛选结果确定是否更新机器学习策略;
所述机器学习策略更新模块具体包括:
文档发送子模块,如果策略管理员认为该用户文档包含敏感信息,且符合当前机器学习的智能聚类,则将该用户文档发送至策略系统;
文档归类子模块,如果策略管理员认为该用户文档包含敏感信息,且不符合当前机器学习的智能聚类,则建立一个新类或将文档重新归类,并将新类名或归类后的类名、以及用户文档发送至策略系统。
6.如权利要求5所述的装置,其特征在于,所述机器学习策略更新模块具体包括:
第一训练集生成子模块,如果文档发送子模块发送至策略系统的用户文档达到预定数量阈值,则策略系统汇总这些用户文档,并结合用户输入的敏感文档,形成新的训练集,更新原有机器学习策略;
第二训练集生成子模块,对于文档归类子模块发送的新类名或归类后的类名、以及用户文档,策略系统训练这些新类的用户文档,形成新类的机器学习策略,并设置该机器学习策略的高/低精度匹配阈值。
7.如权利要求6所述的装置,其特征在于,第二训练集生成子模块,对发送的重新归类后的类名、以及用户文档,如果对于该类的用户文档,达到预定数量阈值,则策略系统汇总这些用户文档,结合之前的训练文档,形成新的训练集,并更新原有机器学习策略。
8.一种计算机可读存储介质,存储有计算机程序指令,当执行所述计算机程序指令时,实现如权利要求1-4之一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明朝万达科技股份有限公司,未经北京明朝万达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810212329.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置