[发明专利]一种基于大数据的图像检索方法及系统在审
申请号: | 202011173216.X | 申请日: | 2020-10-28 |
公开(公告)号: | CN112287140A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 汪礼君 | 申请(专利权)人: | 汪礼君 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/583;G06K9/62 |
代理公司: | 长沙正务联合知识产权代理事务所(普通合伙) 43252 | 代理人: | 郑隽;吴婷 |
地址: | 410205 湖南省长沙市高新*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 图像 检索 方法 系统 | ||
本发明涉及一种图像检索的技术领域,揭露了一种基于大数据的图像检索方法,包括:获取海量图像数据,并将海量图像数据进行分布式存储;对所存储的海量图像数据进行图像灰度化和灰度拉伸的预处理;利用基于自编码器的多标签语义提取算法对经预处理的图像数据进行处理,得到图像的多标签语义信息;根据图像的多标签语义信息建立图像信息连接图;利用基于深度哈希的数据存储方法将结合图像信息连接图的图像数据进行存储,从而将哈希编码值作为图像特征索引,并根据图像特征索引进行图像检索。本发明还提供了一种基于大数据的图像检索系统。本发明实现了图像的检索。
技术领域
本发明涉及图像检索的技术领域,尤其涉及一种基于大数据的图像检索方法及系统。
背景技术
互联网时代,大量即时通讯软件、办公软件、购物平台、游戏平台等极大地便利和丰富了人们的学习、生活与工作,同时也产生了海量的多类别、异构性、非结构化的数据;图像数据以其直观性和信息大的特点数量爆炸性地增长,给人们生活带来极大的便利,但也因数量巨大、质量参差不齐、应用场景复杂等使得人们对图像的检索提出了更高的要求。
当前大多数的搜索引擎根据文本关键字检索图像,而检索关键字经常与图像的真实语义不匹配,因此检索性能受到影响;同时当前图像检索中主要采用对图像依次进行遍历的方式,而没有很好的索引机制来做索引,也增大了检索系统的负荷,并且传统的图像检索方法大多基于已有数据进行定时离线地构建图像索引,对于新增的图像检索存在时效性差的问题。
鉴于此,如何提取出更为准确的图像语义信息,并通过对图像语义信息进行索引编码,从而根据图像索引进行图像检索,成为本领域技术人员亟待解决的问题。
发明内容
本发明提供一种基于大数据的图像检索方法,通过HDFS将海量图像数据进行分布式存储,利用基于自编码器的多标签语义提取算法存储图像数据的多标签语义信息,并根据图像的多标签语义信息建立图像连接图,最后利用基于深度哈希的数据存储方法将结合图像连接图信息的图像数据进行存储,并根据图像的哈希索引进行更为高效的图像检索。
为实现上述目的,本发明提供的一种基于大数据的图像检索方法,包括:
获取海量图像数据,并将海量图像数据进行分布式存储;
对所存储的海量图像数据进行图像灰度化和灰度拉伸的预处理;
利用基于自编码器的多标签语义提取算法对经预处理的图像数据进行处理,得到图像的多标签语义信息;
根据图像的多标签语义信息建立图像信息连接图;
利用基于深度哈希的数据存储方法将结合图像信息连接图的图像数据进行存储,从而将哈希编码值作为图像特征索引,并根据图像特征索引进行图像检索。
可选地,所述将海量图像数据进行分布式存储,包括:
1)将k个图像数据合并为1个文件,其中k设置为10;并将合并得到的文件转换为字节码的格式;
2)创建图像存储表,设计两个列族MD(image data)、MI(image info),所述列族MD和MI分别存放文件的字节码和图像信息,所述图像信息包括图像的id和图像特征索引;同时进行预分区操作,在本发明一个具体实施例中,分区数量为9,每个分区的RowKey范围为N/(9k),其中N为图像数据的总数;
3)将海量图像数据存储到分区中的图像存储表,其中图像特征索引设置为空白。
可选地,所述对所存储的海量图像数据进行图像灰度化和灰度拉伸的预处理的流程为:
1)通过对所存储的图像中每一个像素的三个分量求最大值,并将该最大值设置为该像素点的灰度值,得到存储图像的灰度图,所述灰度化处理的公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪礼君,未经汪礼君许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011173216.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:显示装置的装配方法、装配装置以及存储介质
- 下一篇:一种驱虫多功能园林灯
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序