[发明专利]用于图像对比的数据压缩方法、图像对比方法及装置有效

专利信息
申请号: 201811385075.0 申请日: 2018-11-20
公开(公告)号: CN109544651B 公开(公告)日: 2020-03-24
发明(设计)人: 董淳光 申请(专利权)人: 深圳市墨者安全科技有限公司
主分类号: G06T9/00 分类号: G06T9/00
代理公司: 深圳余梅专利代理事务所(特殊普通合伙) 44519 代理人: 井杰;高真辉
地址: 518000 广东省深圳市南山区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 图像 对比 数据压缩 方法 装置
【说明书】:

发明涉及一种用于图像对比的数据压缩方法、图像对比方法及装置。数据压缩方法,其包括以下步骤:划分步骤,采用设定的阈值划分所有的特征值,保留不小于阈值的特征值;排序步骤,将上一步保留的特征值从大至小排序,保留前N个特征值;存储步骤,将上一步得到的N个特征值中的每X个特征值及其初始位置通过Y个整型变量存储。通过将特征值划分、筛选后,将特征值和初始位置压缩存储在整型变量中,整个数据量得到极大减少,处理速度得到提高,对存储要求降低,同时也不会影响对比精度,能够适应整个互联网海量的图片对比处理。

技术领域

本发明涉及图像对比技术及数据处理技术,尤其涉及一种用于图像对比的数据压缩方法、图像对比方法及装置。

背景技术

图像对比技术先已经有非常广泛的应用。目前图片比对的需求通常是:比对两张图是否相同、或部分相同,并且需要在互联网上做海量图片比对。如此大规模图像比对,在比对算法上有比较高的要求。既要确保比对准确性,也要保证机器能扛住。机器能否扛住,其中一个指标是内存、速度这一矛盾问题。对海量图片,如果将特征存储在磁盘中,读取一个特征假设0.01秒,那么100万个图就需要1万秒。互联网上图片远不止100万这个数量级。因此需要考虑减少数据存储量和处理量。

一般比对算法都会用到使用视觉词袋技术,最早出现在神经语言程序学(NLP)和信息检索(IR)领域。该技术忽略掉文本的语法和语序,用一组无序的单词(words)来表达一段文字或一个文档。近年来,视觉词袋模型被广泛应用于计算机视觉中。与应用于文本的视觉词袋模型类比,图像的特征(feature)被当作单词(Word),把图像“文字化”之后,有助于大规模的图像检索。视觉词袋技术中,每一张图需要128个浮点类型(float/double)作为特征值,特征值表示的是每个样本图片到字典库的“距离”,取值范围是[0,1]。特征值大部分都是很小的小数,趋近于0,只有几个数据是零点几,或零点零几,所以要用浮点数表示,因此128个浮点数最少需要512字节(实际上加上辅助数据会远超这个数)。100万图片需要488.28MB内存,1000万张图需要4882.8MB内存,1亿张图需要48.828GB内存。这样庞大的数据量对处理速度和存储容量都提出了非常高的要求,有待改进。

发明内容

本发明的目的在于为克服现有技术中数据量庞大的缺陷,而提供一种用于图像对比的数据压缩方法、图像对比方法及装置。

为实现上述目的,本发明采用以下技术方案:用于图像对比的数据压缩方法,其包括以下步骤:

划分步骤,采用设定的阈值划分所有的特征值,保留不小于阈值的特征值;

排序步骤,将上一步保留的特征值从大至小排序,保留前N个特征值;

存储步骤,将上一步得到的N个特征值中的每X个特征值及其初始位置通过Y个整型变量存储。

本发明与现有技术相比的有益效果是:通过将特征值划分、筛选后,将特征值和初始位置压缩存储在整型变量中,整个数据量得到极大减少,处理速度得到提高,对存储要求降低,同时也不会影响对比精度,能够适应整个互联网海量的图片对比处理。

其中一方面,存储步骤中,将Y个整型变量拆分成X份单元存储位,单元存储位存储一个特征值及其初始位置的比特位数等于32×Y/X。

其中一方面,单元存储位分成两部分,一部分存储特征值所处的初始位置,另一部分存储特征值乘上固定倍率取整。固定倍率为65536。

其中一方面,Y=1,X=1或者Y=3,X=2。

本发明还公开了一种图像对比方法,其包括了以上的数据压缩方法以及还原步骤;还原步骤中,将单元存储位存储的特征值除以固定倍率得到原先特征值的近似值,同时提取单元存储位存储的特征值初始位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市墨者安全科技有限公司,未经深圳市墨者安全科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811385075.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top