[发明专利]一种基于大数据的图像检索方法及系统在审

专利信息
申请号: 202011173216.X 申请日: 2020-10-28
公开(公告)号: CN112287140A 公开(公告)日: 2021-01-29
发明(设计)人: 汪礼君 申请(专利权)人: 汪礼君
主分类号: G06F16/51 分类号: G06F16/51;G06F16/583;G06K9/62
代理公司: 长沙正务联合知识产权代理事务所(普通合伙) 43252 代理人: 郑隽;吴婷
地址: 410205 湖南省长沙市高新*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 图像 检索 方法 系统
【说明书】:

发明涉及一种图像检索的技术领域,揭露了一种基于大数据的图像检索方法,包括:获取海量图像数据,并将海量图像数据进行分布式存储;对所存储的海量图像数据进行图像灰度化和灰度拉伸的预处理;利用基于自编码器的多标签语义提取算法对经预处理的图像数据进行处理,得到图像的多标签语义信息;根据图像的多标签语义信息建立图像信息连接图;利用基于深度哈希的数据存储方法将结合图像信息连接图的图像数据进行存储,从而将哈希编码值作为图像特征索引,并根据图像特征索引进行图像检索。本发明还提供了一种基于大数据的图像检索系统。本发明实现了图像的检索。

技术领域

本发明涉及图像检索的技术领域,尤其涉及一种基于大数据的图像检索方法及系统。

背景技术

互联网时代,大量即时通讯软件、办公软件、购物平台、游戏平台等极大地便利和丰富了人们的学习、生活与工作,同时也产生了海量的多类别、异构性、非结构化的数据;图像数据以其直观性和信息大的特点数量爆炸性地增长,给人们生活带来极大的便利,但也因数量巨大、质量参差不齐、应用场景复杂等使得人们对图像的检索提出了更高的要求。

当前大多数的搜索引擎根据文本关键字检索图像,而检索关键字经常与图像的真实语义不匹配,因此检索性能受到影响;同时当前图像检索中主要采用对图像依次进行遍历的方式,而没有很好的索引机制来做索引,也增大了检索系统的负荷,并且传统的图像检索方法大多基于已有数据进行定时离线地构建图像索引,对于新增的图像检索存在时效性差的问题。

鉴于此,如何提取出更为准确的图像语义信息,并通过对图像语义信息进行索引编码,从而根据图像索引进行图像检索,成为本领域技术人员亟待解决的问题。

发明内容

本发明提供一种基于大数据的图像检索方法,通过HDFS将海量图像数据进行分布式存储,利用基于自编码器的多标签语义提取算法存储图像数据的多标签语义信息,并根据图像的多标签语义信息建立图像连接图,最后利用基于深度哈希的数据存储方法将结合图像连接图信息的图像数据进行存储,并根据图像的哈希索引进行更为高效的图像检索。

为实现上述目的,本发明提供的一种基于大数据的图像检索方法,包括:

获取海量图像数据,并将海量图像数据进行分布式存储;

对所存储的海量图像数据进行图像灰度化和灰度拉伸的预处理;

利用基于自编码器的多标签语义提取算法对经预处理的图像数据进行处理,得到图像的多标签语义信息;

根据图像的多标签语义信息建立图像信息连接图;

利用基于深度哈希的数据存储方法将结合图像信息连接图的图像数据进行存储,从而将哈希编码值作为图像特征索引,并根据图像特征索引进行图像检索。

可选地,所述将海量图像数据进行分布式存储,包括:

1)将k个图像数据合并为1个文件,其中k设置为10;并将合并得到的文件转换为字节码的格式;

2)创建图像存储表,设计两个列族MD(image data)、MI(image info),所述列族MD和MI分别存放文件的字节码和图像信息,所述图像信息包括图像的id和图像特征索引;同时进行预分区操作,在本发明一个具体实施例中,分区数量为9,每个分区的RowKey范围为N/(9k),其中N为图像数据的总数;

3)将海量图像数据存储到分区中的图像存储表,其中图像特征索引设置为空白。

可选地,所述对所存储的海量图像数据进行图像灰度化和灰度拉伸的预处理的流程为:

1)通过对所存储的图像中每一个像素的三个分量求最大值,并将该最大值设置为该像素点的灰度值,得到存储图像的灰度图,所述灰度化处理的公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪礼君,未经汪礼君许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011173216.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top