[发明专利]用于从文档中去除敏感内容的设备和方法有效
申请号: | 201880047969.0 | 申请日: | 2018-05-29 |
公开(公告)号: | CN110914824B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | C·D·安德森;R·L·劳恩斯韦特;M·D·斯托克斯;M·J·B·奥尔森;M·E·凯斯林;E·T·奥维森;T·L·雷利加 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文档 去除 敏感 内容 设备 方法 | ||
1.用于从文档中去除敏感内容的一个或多个计算设备,包括:
数据存储单元,其用于存储一个或多个原始文档;
处理发起组件,其被配置为响应于对一个或多个触发事件的接收而发起文档处理功能以提供发起指令;
文档获取组件,其被配置为响应于所述发起指令来从所述数据存储单元获取要处理的一个或多个原始文档;
策略选择组件,其被配置为响应于一个或多个选择因素来识别用于在从所述一个或多个原始文档中去除敏感内容时使用的策略,以提供选择的修改策略;
去除组件,其被配置为根据所述选择的修改策略以及根据相关联的修改规则集合来从所述一个或多个原始文档中去除敏感内容,以提供一个或多个经修改的文档,
所述去除组件被配置从所述一个或多个原始文档中去除所述敏感内容,同时保存与所述一个或多个原始文档相关联的格式和结构;以及
转发组件,其被配置为将所述一个或多个经修改的文档通过通信管道转发至接收方实体,
所述选择因素中的至少一个选择因素描述要由所述接收方实体执行的处理的特性。
2.根据权利要求1所述的一个或多个计算设备,
其中,触发事件对应于由用户对特定应用的激活,
其中,所述一个或多个原始文档与所述特定应用相关联,并且
其中,所述接收方实体对应于计算机制,所述计算机制以所述一个或多个经修改的文档为基础来执行机器实现的分析,从而提供用于结合所述特定应用使用的模型。
3.根据权利要求1所述的一个或多个计算设备,
其中,所述接收方实体是计算机制,所述计算机制以所述一个或多个经修改的文档为基础来执行机器实现的分析,并且
其中,所述选择因素中的所述至少一个选择因素描述由所述机器实现的分析执行的处理的特性。
4.根据权利要求1所述的一个或多个计算设备,其中,所述修改规则集合提供用于进行以下操作的指令:
识别原始文档中的字符串中的原始字符;以及
利用预先定义的通用占位符字符来替代所述原始字符,同时保存与所述原始字符和/或所述原始字符出现在其中的所述的字符串的属性相关的信息。
5.根据权利要求4所述的一个或多个计算设备,其中,所述通用占位符字符是从两个或更多个可能的通用占位符字符的集合中选择的,并且其中,所述保存是通过从所述集合中对所述通用占位符字符的选择而被执行的。
6.根据权利要求4所述的一个或多个计算设备,其中,所述保存是通过将补充元数据与所述通用占位符字符进行关联而被执行的,所述补充元数据传达所述属性。
7.根据权利要求4所述的一个或多个计算设备,其中,所述去除组件包括内容分析器组件,所述内容分析器组件被配置为对所述一个或多个原始文档中的文本执行分析以识别所述属性。
8.根据权利要求4所述的一个或多个计算设备,
其中,所述去除组件被配置为识别应用于所述原始字符和/或所述原始字符出现在其中的所述字符串的属性集合中的每个属性,其中,所述属性集合包括:
指示所述原始字符是否是大写字母字符的第一属性;
指示所述原始字符是否是小写字母字符的第二属性;以及
指示所述原始字符是否为数字字符的第三属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880047969.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:水分配器及其校正方法
- 下一篇:具有紧固元件的安装轨道