[发明专利]文本文件指纹获取方法及其装置、数据管理方法有效
申请号: | 201410226077.0 | 申请日: | 2014-05-26 |
公开(公告)号: | CN103971061B | 公开(公告)日: | 2017-06-30 |
发明(设计)人: | 彭建芬 | 申请(专利权)人: | 中电长城网际系统应用有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F17/30 |
代理公司: | 北京天昊联合知识产权代理有限公司11112 | 代理人: | 彭瑞欣,张天舒 |
地址: | 102200 北京市昌平区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于计算机技术领域,特别涉及数据防泄漏领域中的文本文件指纹获取方法及其装置、数据管理方法。一种文本文件指纹获取方法,包括将文本文件划分为多个文件块,多个所述文件块互不重叠;抽取所述文件块的杂凑值;对所述杂凑值进行抽样和组合,获得所述文本文件的杂凑代表值,所述杂凑代表值即所述文本文件指纹。本发明所提供的文本文件指纹获取方法以及相应的文本文件指纹获取装置,通过将文本文件划分、抽取文本文件中的文件块的杂凑值、并对杂凑值进行抽样和组合,从而获得文本文件的指纹,能对计算机创建/处理、网络传输的业务电子信息中的隐私信息或敏感信息进行有效保护和及时侦查。 | ||
搜索关键词: | 文本文件 指纹 获取 方法 及其 装置 数据管理 | ||
【主权项】:
一种文本文件指纹获取方法,其特征在于,包括:将文本文件划分为多个文件块,多个所述文件块互不重叠,包括:对所述文本文件中的数据进行处理,将所述文本文件划分为具有k字节大小的所述文件块,k为大于1的自然数、且与杂凑函数的数据处理长度相适配;抽取所述文件块的杂凑值,包括:对所述文件块按预设数量字节t和预设固定步长字节ω进行滑动分片形成文件片,k、t和ω满足公式:ω|(k‑t),滑动次数n满足公式:n=(k‑t)/ω,其中:n为大于等于1的自然数,t为大于等于0的整数、ω为大于1的自然数;以及,利用杂凑函数对所述文件片进行hash取值,将h1、h2、…、hn、hn+1作为所述文件片的片杂凑值,并将所述片杂凑值中的最大值或最小值或其它取值作为所述文件块的杂凑值;对所述杂凑值进行抽样和组合,获得所述文本文件的杂凑代表值,所述杂凑代表值即所述文本文件指纹。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电长城网际系统应用有限公司,未经中电长城网际系统应用有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410226077.0/,转载请声明来源钻瓜专利网。