[发明专利]用于匿名化日志条目的系统和方法有效
申请号: | 201680062430.3 | 申请日: | 2016-09-27 |
公开(公告)号: | CN108351946B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | M·斯珀特斯;W·E·索贝尔 | 申请(专利权)人: | CA公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 章蕾 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 匿名 日志 目的 系统 方法 | ||
1.一种用于匿名化日志文件中的日志条目的计算机实现的方法,所述方法的至少一部分由包括至少一个处理器的计算设备来执行,所述方法包括:
检测多个日志条目中的数据模式,所述多个日志条目记录由至少一个设备上执行的至少一个过程执行的事件;
在所述数据模式中识别所述多个日志条目中包含可变数据的至少一个数据字段;
评估包含所述可变数据的所述数据字段以确定所述数据字段是否包含敏感数据;
响应于确定所述数据字段是否包含所述敏感数据,将经选择的数据匿名化策略应用于所述数据字段以匿名化所述多个日志条目;
其特征在于所述方法进一步包括:
评估数据匿名化过程以验证所述过程满足或超过数据匿名化的期望测量值,确定何时应当重新处理现有日志条目以保持数据匿名化的所述期望测量值,使用统计试探法来确定数据匿名化策略是否已实现期望的匿名化级别,以及应用数据匿名化过程以超过针对数据字段的匿名化度量。
2.根据权利要求1所述的计算机实现的方法,其中检测所述多个日志条目中的所述数据模式包括对所述多个日志条目执行消息模板学习分析。
3.根据权利要求1所述的计算机实现的方法,其中检测所述多个日志条目中的所述数据模式包括对所述多个日志条目执行最长共同子序列分析。
4.根据权利要求1所述的计算机实现的方法,还包括:
接收来自附加设备上执行的附加过程的日志条目;
将所述日志条目与所述多个日志条目中先前识别的一组数据模式中的数据模式匹配;
识别对应于所述数据模式的数据匿名化策略;
通过应用所述对应的数据匿名化策略来匿名化所述日志条目。
5.根据权利要求1所述的计算机实现的方法,还包括:
确定其中必须为被认为是匿名化的所述数据模式找到所述数据模式的隐私上下文的阈值数量;
在多个隐私上下文中检测所述数据模式;
确定包含所述数据模式的隐私上下文的数量超过所述隐私上下文阈值;
响应于确定包含所述数据模式的隐私上下文的数量超过所述隐私上下文阈值,确定所述数据模式是匿名化的。
6.根据权利要求1所述的计算机实现的方法,其中:
所述数据字段评估确定所述数据字段包含敏感数据;
所述数据匿名化策略通过以下中的至少一者来匿名化所述数据字段:
使用单向散列来加密所述数据字段;
使用可逆加密来加密所述数据字段;
利用随机数据替换所述数据字段;
利用静态数据替换所述数据字段;
移除所述数据字段;
一般化所述数据字段。
7.根据权利要求1所述的计算机实现的方法,其中:
所述数据字段评估确定所述数据字段包含所枚举的数据并且因此不包含敏感数据;
所述数据匿名化策略不修改所述数据字段。
8.根据权利要求1所述的计算机实现的方法,其中:
所述数据字段评估确定所述数据字段包含已知不包括敏感数据的数据类型的数据;
所述数据匿名化策略不修改所述数据字段。
9.根据权利要求1所述的计算机实现的方法,其中:
即使所述数据字段先前被确定为不包含敏感数据,所述数据字段评估也会确定所述数据字段现在包含敏感数据;
所述数据匿名化策略匿名化多个现有日志条目中的所述数据字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于CA公司,未经CA公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680062430.3/1.html,转载请声明来源钻瓜专利网。