[发明专利]一种图像大数据相似度比对方法及系统在审
申请号: | 202011232317.X | 申请日: | 2020-11-06 |
公开(公告)号: | CN112308162A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 罗敏刚;李中棠;朱永佳 | 申请(专利权)人: | 上海软中信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/55;G06F16/951 |
代理公司: | 上海乐泓专利代理事务所(普通合伙) 31385 | 代理人: | 苏杰 |
地址: | 200000 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 数据 相似 方法 系统 | ||
1.一种图像大数据相似度比对方法,其特征在于:通过爬虫抓取技术和大数据搜索抓取需要进行比对的图像数据,将抓取后的图像数据进行分析治理后进行结构化的存储,并按照图像的属性进行分类比对,对比过程为计算图像所包含的特征并生成一组指纹,比对图像的指纹来判断图像的相似度。
2.根据权利要求1所述的一种图像大数据相似度比对方法,其特征在于,所述方法包括如下步骤:
S100、图像抓取,通过爬虫抓取技术在特定的网站中抓取所需要的图像数据;
S200、分析治理,将抓取的图像数据进行多维度结构化划分;
S300、图像比对,计算图像所包含的特征并生成一组指纹,比对图像的指纹来判断图像的相似度。
3.根据权利要求2所述的一种图像大数据相似度比对方法,其特征在于:所述步骤S100中,爬虫抓取所需要的图像数据优选选择高清图和500像素以内的缩略图。
4.根据权利要求2所述的一种图像大数据相似度比对方法,其特征在于,所述步骤S300中图像比对包括如下步骤:
S310、统一尺寸,将图像缩小到相同的尺寸得到N个像素;
S320、简化色彩,将缩小后的图像转为N级灰度;
S330、计算平均值,计算所有N个像素的灰度平均值;
S340、灰度比较,依次将每个像素的灰度与平均值进行比较,当大于或等于平均值时记为1,当小于平均值时,记为0;
S350、计算哈希值,依次将每个灰度比较的结果进行组合,得到一个N的数字,该数字为图像的指纹;
S360、相似度比对,将不同图像的指纹进行比对,判断重合率。
5.根据权利要求4所述的一种图像大数据相似度比对方法,其特征在于,N为64,所述方法步骤具体为:
S310、统一尺寸,将图像缩小到相同的8x8尺寸得到64个像素;
S320、简化色彩,将缩小后的图像转为64级灰度;
S330、计算平均值,计算所有64个像素的灰度平均值;
S340、灰度比较,依次将每个像素的灰度与平均值进行比较,当大于或等于平均值时记为1,当小于平均值时,记为0;
S350、计算哈希值,依次将每个灰度比较的结果进行组合,得到一个64位的数字,该数字为图像的指纹;
S360、相似度比对,将不同图像的指纹进行比对,判断重合率。
6.根据权利要求4所述的一种图像大数据相似度比对方法,其特征在于:所述步骤S360中,当重合率大于90%时,判断高度近似;当重合率于70-90%之间,判断为近似;当重合率于50-70%之间,判断为一般相似,低于50%判断为不相似。
7.一种图像大数据相似度比对系统,用于执行上述权利要求1-6任一项所述的方法,其特征在于:包括依次通信连接的图像收集模块(100)、图像处理模块(200)和图像比对模块(300),所述图像收集模块(100)用于从特定的网站上抓取所需要的图像数据,所述图像处理模块(200)用于对抓取的图像数据进行分析治理,所述图像比对模块(300)用于对图像进行比对。
8.根据权利要求7所述的一种图像大数据相似度比对系统,其特征在于:还包括依次通信连接的图像数据库(400)、大数据搜索模块(500)和大数据比对模块(600),所述图像数据库(400)与图像处理模块(200)通信连接,所述图像数据库(400)用于结构化存储图像处理模块(200)处理后的图像数据,所述大数据搜索模块(500)用于从图像数据库(400)中快速搜索和定位图片信息,所述大数据比对模块(600)用于在大数据级别的图像数据进行比对查找工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海软中信息技术有限公司,未经上海软中信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011232317.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置