[发明专利]用于执行机器学习的用户界面和工作流有效
申请号: | 201280021230.5 | 申请日: | 2012-02-29 |
公开(公告)号: | CN103620581B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | P.迪科波;S.S.萨万特;S.考夫曼;A.D.加林德斯;S.贾伊斯瓦尔;A.阿加瓦尔 | 申请(专利权)人: | 赛门铁克公司 |
主分类号: | G06F15/177 | 分类号: | G06F15/177 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 王岳,王忠忠 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 执行 机器 学习 用户界面 工作流 | ||
技术领域
本发明的实施例涉及数据丢失防护的领域,且更特别地涉及提供使用户能够生成和配置基于机器学习的检测(MLD)概况的界面的数据丢失防护(DLP)系统。
背景技术
许多组织实施数据丢失防护(DLP)系统来识别和控制对敏感数据的访问。典型的DLP系统通过包括描述技术和指纹识别技术的深度内容检查和分析来保护敏感数据。描述技术通过识别对关键词、表达式或图案和文件类型的匹配并且通过执行其它基于签名的检测技术来保护敏感数据。指纹识别技术通过识别对整体或部分文件的确切匹配来保护敏感数据。虽然有效保护了组织的敏感数据中的许多,但是当解决大量的非结构化数据和知识产权(诸如产品配方、源代码以及销售与市场报告时,指纹识别技术和描述技术具有局限性。
为了更精确地保护敏感的非结构化数据,一些DLP系统正在探索向量机器学习(VML,vector machine learning)技术的使用。然而,实施VML是非常复杂的。因此,使用VML的当前DLP系统需要VML专家来设计针对顾客的基于机器学习的检测(MLD)概况。装载到顾客的DLP系统则具有顾客不能够修改的预先定义的MLD概况。这种DLP系统不提供使用户能够生成他们自身MLD概况的任何用户界面或工作流。
发明内容
在一个实施例中,计算装置经由针对机器学习(ML)的用户界面接收训练数据集,所述训练数据集包括敏感数据的正例和敏感数据的反例。计算装置通过使用机器学习来分析所述训练数据集以便训练MLD概况,所述MLD概况可以用于将新数据分类为敏感数据或非敏感数据。计算装置在所述用户界面中显示针对所述MLD概况的质量度量。在一个实施例中,所述MLD概况包括统计数据分类模型和特征集,所述特征集包括正例的统计上显著特征和反例的统计上显著特征,并且所述质量度量包括假正面率、假反面率和存储器利用率中的至少一种。在一个实施例中,所述计算装置在所述用户界面中从所述训练数据集识别引起假正面的数据和引起假反面的数据中的至少一种。
在一个实施例中,所述计算装置在分析所述训练文档集之前,经由所述用户界面接收存储器分配的用户选择,其中针对类别数据的所述存储器利用率符合所述存储器分配。在一个实施例中,如果所述假正面率在假正面阈值内并且所述假反面率在假反面阈值内,计算装置就能够实现配置操作。响应于接收配置操作的用户请求,计算装置将所述MLD概况添加到DLP系统的数据丢失防护(DLP)策略中。
在一个实施例中,所述计算装置接收针对敏感数据的正例和针对敏感数据的反例的类别信息。所述计算装置然后可以在用户界面中识别添加到训练数据集的数据类别来改进所述质量度量。在一个实施例中,如果所述质量度量不能满足质量阈值,则所述计算装置就响应于用户输入来修改所述训练数据集。所述计算装置然后分析修改的训练数据集以重新训练所述MLD概况并且在所述用户界面中显示针对所述MLD概况的新质量度量。
在一个实施例中,通过DLP系统的数据丢失防护(DLP)策略收集所述训练数据集,所述多个敏感数据的反例包括由所述DLP策略错误分类为敏感文档的文档。在该实施例中,所述计算装置然后可以将所述MLD概况配置到所述DLP策略中。
在一个实施例中,计算机可读存储介质包括指令,所述指令将使执行指令的处理器:经由针对机器学习的用户界面来接收包括多个敏感数据的正例和多个敏感数据的反例的训练数据集。所述处理器然后通过使用机器学习来分析所述训练数据集以便训练基于机器学习的检测(MLD)概况,所述基于机器学习的检测(MLD)概况可以用于将新数据分类为敏感数据或非敏感数据并且在所述用户界面中显示针对所述MLD概况的质量度量。
在一个实施例中,一种用于生成MLD概况的方法包括:经由针对机器学习的用户界面来接收包括多个敏感数据的正例和多个敏感数据的反例的训练数据集;通过使用机器学习来分析所述训练数据集以便训练基于机器学习的检测(MLD)概况,所述基于机器学习的检测(MLD)概况可以用于将新数据分类为敏感数据或非敏感数据;以及在所述用户界面中显示针对所述MLD概况的质量度量。
附图说明
根据以下给出的详细说明并且根据本发明各种实施例的附图,将更充分地理解本发明。
图1图示了根据本发明一个实施例的示例性系统架构。
图2是根据本发明一个实施例的数据丢失防护代理的框图。
图3是根据本发明一个实施例的机器学习管理器的框图。
图4是图示用于生成和配置MLD概况的方法的一个实施例的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛门铁克公司,未经赛门铁克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280021230.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:列车总风管路加装结构
- 下一篇:一种钢丝绳电动葫芦