[发明专利]文档发送方法、装置、设备及存储介质有效
申请号: | 202011613785.1 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112733523B | 公开(公告)日: | 2023-07-14 |
发明(设计)人: | 王诚安;李可;郜振锋 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/279;G06F21/10 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 周艳;张颖玲 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 发送 方法 装置 设备 存储 介质 | ||
本申请实施例提供一种文档发送方法、装置、设备及计算机可读存储介质,其中,方法包括:响应于终端发送的文档发送请求,获取待发送文档的文档字符串;其中,所述文档字符串是对应于所述待发送文档的全部内容的字符串;对所述文档字符串进行指纹转换处理,得到所述待发送文档的文档指纹;根据所述文档指纹与预设参考文档的参考指纹,确定所述待发送文档的文档类型;当所述文档类型为限制发送类型时,禁止发送所述待发送文档。通过本申请,能够提高字数差距大的文档文本之间相似度匹配的精确度,同时由于文档指纹保留的文档特征足够多,对于文档检测时误判的情况也得到了明显的改善。
技术领域
本申请实施例涉及通信领域,涉及但不限于一种文档发送方法、装置、设备及存储介质。
背景技术
文档检测是保证文档数据安全的核心技术。在传统业务场景中,文档检测方法主要部署于终端数据泄露防护系统(DLP,Data leakage prevention)和网路DLP,用于负责识别出待测文档中包含的机密信息,并交由后续模块采取阻断、报警等相应处理措施。
相关技术中,通常是将文档里面出现的高频词语生成文档指纹,并与参考文档的指纹进行相似度匹配,进而确定文档是否为限制发送文档。
但是,这种方法具有很大的局限性,首先,文档文本内容字数之间的差距太大,会影响两个文档相似度匹配的精确性;其次,两个内容不同的文档如果用词相似的话,则会导致误判,使得用户无法准确得知两个文档是否为相似文档。
发明内容
本申请实施例提供一种文档发送方法、装置、设备及存储介质。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种文档发送方法,包括:
响应于终端发送的文档发送请求,获取待发送文档的文档字符串;其中,所述文档字符串是对应于所述待发送文档的全部内容的字符串;
对所述文档字符串进行指纹转换处理,得到所述待发送文档的文档指纹;
根据所述文档指纹与预设参考文档的参考指纹,确定所述待发送文档的文档类型;
当所述文档类型为限制发送类型时,禁止发送所述待发送文档。
在一些实施例中,对每一所述子字符串进行所述指纹转换处理,得到每一子字符串的第一指纹,包括:
根据预设算法,确定每一所述子字符串的哈希值;
将每一所述子字符串的哈希值,确定为对应子字符串的所述第一指纹。
在一些实施例中,所述方法还包括:
对所述参考文档进行所述字符提取,对应得到第二字符串;
对所述第二字符串进行所述指纹转换处理,得到所述参考文档的参考指纹。
本申请实施例提供一种文档发送装置,所述装置包括获取模块、指纹转换模块、确定模块和发送模块,包括:
获取模块,用于响应于终端发送的文档发送请求,获取待发送文档的文档字符串;其中,所述文档字符串是对应于所述待发送文档的全部内容的字符串;
指纹转换模块,用于对所述文档字符串进行指纹转换处理,得到所述待发送文档的文档指纹;
确定模块,用于根据所述文档指纹与预设参考文档的参考指纹,确定所述待发送文档的文档类型;
发送模块,用于当所述文档类型为限制发送类型时,禁止发送所述待发送文档。
本申请实施例提供一种文档发送设备,包括:
存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现上述的文档发送方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011613785.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防雷器
- 下一篇:触控显示面板及触控显示面板的制备方法