[发明专利]一种图像大数据相似度比对方法及系统在审
申请号: | 202011232317.X | 申请日: | 2020-11-06 |
公开(公告)号: | CN112308162A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 罗敏刚;李中棠;朱永佳 | 申请(专利权)人: | 上海软中信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/55;G06F16/951 |
代理公司: | 上海乐泓专利代理事务所(普通合伙) 31385 | 代理人: | 苏杰 |
地址: | 200000 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 数据 相似 方法 系统 | ||
本发明的一种图像大数据相似度比对方法,通过爬虫抓取技术和大数据搜索抓取需要进行比对的图像数据,将抓取后的图像数据进行分析治理后进行结构化的存储,并按照图像的属性进行分类比对,对比过程为计算图像所包含的特征并生成一组指纹,比对图像的指纹来判断图像的相似度,不仅可以提高图像识别效率,还可以与大数据进行结合,实现大数据范围内的图片相似度的比对。
技术领域
本发明属于图像处理技术领域,具体来说是一种图像大数据相似度比对方法及系统。
背景技术
现有的图像防侵权意识和功能不够完善,无法保护图像创作者的知识产权,难以搜集网站上可能使用侵权图像的使用者,无法搜集到有效证据。这是由于现在的图像相似度比对算法比较多,但无法做到特定类型图像的细致优化,使相似度的比对阈值达到95%上下。没有与大数据结合的图像比对工具,不能实现大数据范围内的图像相似度的比对。导致了图像对比的效率和准确度不高。
经过检索,中国发明专利:一种基于感知哈希算法的图像相似度对比方法(申请号为202010177648.1,申请日为20200313),该申请案公开了一种基于感知哈希算法的图像相似度对比方法。它通过离散余弦变换DCT算法将图像进行压缩,通过pHash进行图像尺寸缩小,获取图像的颜色通道R、G、B,进而算出RGB的平均值后,将图像灰度化,分别采用颜色分布法和内容特征法提取出每张图像中的指纹,再将原图压缩成一张较小固定尺寸的灰度图像,进而确定出一个阈值,再将图像转成黑白图像,进而来对比图像的轮廓,通过图像基础指纹、颜色特征指纹、内容特征指纹多维度对比最终获取到的相似度结果。但是该申请案的不足之处在于需要对图像基础指纹、颜色特征指纹、内容特征指纹多维度进行对比,比较繁琐、效率不高。
发明内容
1.发明要解决的技术问题
本发明的目的在于解决现有的图像对比的效率和准确度不高问题。
2.技术方案
为达到上述目的,本发明提供的技术方案为:
本发明的一种图像大数据相似度比对方法,通过爬虫抓取技术和大数据搜索抓取需要进行比对的图像数据,将抓取后的图像数据进行分析治理后进行结构化的存储,并按照图像的属性进行分类比对,对比过程为计算图像所包含的特征并生成一组指纹,比对图像的指纹来判断图像的相似度。
优选的,所述方法包括如下步骤:
S100、图像抓取,通过爬虫抓取技术在特定的网站中抓取所需要的图像数据;
S200、分析治理,将抓取的图像数据进行多维度结构化划分;
S300、图像比对,计算图像所包含的特征并生成一组指纹,比对图像的指纹来判断图像的相似度。
优选的,所述步骤S100中,爬虫抓取所需要的图像数据优选选择高清图和500像素以内的缩略图。
优选的,所述步骤S200中,对图像数据进行多维度结构化划分具体包括如下维度:
优选的,所述步骤S300中图像比对包括如下步骤:
S310、统一尺寸,将图像缩小到相同的尺寸得到N个像素;
S320、简化色彩,将缩小后的图像转为N级灰度;
S330、计算平均值,计算所有N个像素的灰度平均值;
S340、灰度比较,依次将每个像素的灰度与平均值进行比较,当大于或等于平均值时记为1,当小于平均值时,记为0;
S350、计算哈希值,依次将每个灰度比较的结果进行组合,得到一个N的数字,该数字为图像的指纹;
S360、相似度比对,将不同图像的指纹进行比对,判断重合率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海软中信息技术有限公司,未经上海软中信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011232317.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置