[发明专利]一种基于深度学习和语义分割的图像检索方法有效
申请号: | 201810615664.7 | 申请日: | 2018-06-14 |
公开(公告)号: | CN108829826B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 李秀;金坤 | 申请(专利权)人: | 清华大学深圳研究生院 |
主分类号: | G06F16/58 | 分类号: | G06F16/58;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于深度学习和语义分割的图像检索方法。包括如下步骤:读取图像并进行预处理;通过深度学习由深度神经网络的任意一个卷积层将图像编码为一组特征图;对图像进行语义分割,获得分割图像逐像素的类别标签;根据特征图上每个像素类别标签和设置的类别权重对其进行加权处理,获得加权后的一组特征图;将获得加权后的一组特征图编码为一个固定长度的特征向量,并进行归一化处理,用归一化的特征向量表征图像的最终编码特征向量;相似性计算,返回检索结果。本发明将语义分割技术引入图像检索的特征编码,大幅提升了检索效果。本发明在获取图像每个类别的权重时,提出的根据先验知识的手工设计法和深度神经网络的参数学习法,非常有效。 | ||
搜索关键词: | 一种 基于 深度 学习 语义 分割 图像 检索 方法 | ||
【主权项】:
1.一种基于深度学习和语义分割的图像检索方法,其特征在于,包括如下步骤:S1:读取图像并进行预处理;S2:将步骤S1处理后的图像送入深度神经网络,通过深度学习由深度神经网络的任意一个卷积层将图像编码为一组特征图;S3:将步骤S1处理后的图像进行语义分割,获得分割图像,同时获取分割图像中每一像素所属的类别标签;S4:对步骤S3的分割图像进行降采样处理,使分割图像变成与步骤S2的特征图的大小一致,保证分割图像的每个位置与步骤S2的特征图的位置一一对应,将分割图像任一位置的像素对应的类别标签,看作特征图上对应位置的类别标签;S5:根据步骤S4确定的特征图的每个像素的类别标签,对其进行加权处理,获得加权后的一组特征图;S6:将步骤S5获得加权后的一组特征图编码为一个固定长度的特征向量,并进行归一化处理,用归一化的特征向量表征图像的最终编码特征向量;S7:对数据库中所有的图片和输入的待检索的图片进行步骤S1~S6的统一处理,并计算待检索图片特征向量与数据库中所有图片的特征向量之间的距离,来度量图像的相似性;S8:对步骤S7得到的相似性按照由大到小排序并返回前K张图像,即为检索结果;K由检索人根据需要设定。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810615664.7/,转载请声明来源钻瓜专利网。