[发明专利]文档发送方法、装置、设备及存储介质有效
申请号: | 202011613785.1 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112733523B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 王诚安;李可;郜振锋 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/279;G06F21/10 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 周艳;张颖玲 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 发送 方法 装置 设备 存储 介质 | ||
1.一种文档发送方法,其特征在于,包括:
响应于终端发送的文档发送请求,获取待发送文档的文档字符串;其中,所述文档字符串是对应于所述待发送文档的全部内容的字符串;
以预设划分方式对所述文档字符串进行划分,对应形成至少一个子字符串;
对每一所述子字符串进行指纹转换处理,得到每一子字符串的第一指纹;
根据所述子字符串的所述第一指纹,确定所述待发送文档的文档指纹;
根据所述文档指纹与预设参考文档的参考指纹,确定所述待发送文档的文档类型;
当所述文档类型为限制发送类型时,禁止发送所述待发送文档;
其中,所述以预设划分方式对所述文档字符串进行划分,对应形成至少一个子字符串,包括:
以N个字符为划分单元,按照预设滑动步长对所述文档字符串进行滑动划分,形成第一数量的固定字符串;
对每连续的K个所述固定字符串进行合并,形成至少一个所述子字符串;
其中,K大于或等于N,且K小于或等于第一数量;N大于0。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在对所述待发送文档进行字符提取之后,确定对所述文档字符串进行字符过滤的过滤规则;
按照所述过滤规则对所述文档字符串进行字符过滤,形成过滤后的文档字符串;
对应地,对所述过滤后的文档字符串进行所述指纹转换处理。
3.根据权利要求2所述的方法,其特征在于,所述过滤规则包括至少一种相关字符串和至少一种过滤字符;
所述按照所述过滤规则对所述文档字符串进行字符过滤,包括:
遍历所述文档字符串,当检测到所述文档字符串中包括所述相关字符串时,跳过所述相关字符串,并继续遍历所述文档字符串中未进行遍历的下一字符或下一字符串;
当检测到所述文档字符串中包括所述过滤字符时,删除所述文档字符串中的所述过滤字符。
4.根据权利要求1所述的方法,其特征在于,所述对每一所述子字符串进行所述指纹转换处理,得到每一子字符串的第一指纹,包括:
根据预设算法,确定每一所述固定字符串的哈希值;
将每一所述子字符串中具有最小哈希值的固定字符串,确定为对应子字符串的目标固定字符串;
将所述目标固定字符串的哈希值,确定为所述对应子字符串的所述第一指纹。
5.根据权利要求1所述的方法,其特征在于,所述以预设划分方式对所述文档字符串进行划分,对应形成至少一个子字符串,还包括:
获取至少一种截停字符;
通过所述截停字符对所述文档字符串进行划分,对应形成至少一个所述子字符串。
6.根据权利要求1所述的方法,其特征在于,所述根据所述子字符串的所述第一指纹,确定所述待发送文档的文档指纹,包括:
按照所述第一指纹对应的哈希值从小到大的顺序,对所述子字符串中的第一指纹进行排序,形成第一指纹序列;
确定所述第一指纹序列对应的第一哈希值序列;
将所述第一哈希值序列中的相同哈希值进行合并,得到第一合并哈希值序列;
根据所述第一合并哈希值序列,确定所述待发送文档的文档指纹。
7.根据权利要求1所述的方法,其特征在于,所述根据所述文档指纹与预设参考文档的参考指纹,确定所述待发送文档的文档类型,包括:
依次对所述文档指纹中的第一指纹与所述参考指纹中的第二指纹进行匹配,得到匹配结果;
根据所述匹配结果,确定所述文档指纹与所述参考指纹的相同指纹数量;
根据所述相同指纹数量、所述第一指纹的数量和所述第二指纹的数量,确定所述文档指纹与所述参考指纹之间的相似度;
根据所述相似度,确定所述待发送文档的文档类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011613785.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防雷器
- 下一篇:触控显示面板及触控显示面板的制备方法