[发明专利]一种图片检索方法、装置、设备和计算机可读存储介质在审
申请号: | 202010861160.0 | 申请日: | 2020-08-25 |
公开(公告)号: | CN112052350A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 陈震鸿 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 彭绪坤 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 检索 方法 装置 设备 计算机 可读 存储 介质 | ||
1.一种图片检索方法,其特征在于,所述方法包括:
采用已训练目标检测模型对输入的待检索图片进行检测,所述已训练目标检测模型为数据集中的训练用图片经预处理后对目标检测模型进行训练后得到;
采用已训练向量生成模型对所述已训练目标检测模型输出的检测结果生成一个多维向量作为所述待检索图片的向量;
以所述待检索图片的向量表示作为查询向量,从向量库中查询与所述查询向量相似的n个相似向量,所述n为不小于1的自然数;
去除所述n个相似向量中与所述查询向量的相似度低于预设阈值的m个相似向量,所述m为小于所述n的自然数;
展示与所述(n-m)个向量对应的图片作为与所述待检索图片相似的目标图片。
2.如权利要求1所述图片检索方法,其特征在于,所述采用已训练向量生成模型对所述已训练目标检测模型输出的检测结果生成一个多维向量作为所述待检索图片的向量,包括:
若所述已训练目标检测模型输出的检测结果为没有检测出所述待检索图片包含目标,则采用所述已训练向量生成模型对所述待检索图片直接生成所述待检索图片的向量;
若所述已训练目标检测模型输出的检测结果为检测出所述待检索图片包含k个目标,则对所述k个目标进行裁剪和加权处理后再生成所述待检索图片的向量,所述k为不小于2的自然数。
3.如权利要求2所述图片检索方法,其特征在于,所述对所述k个目标进行裁剪和加权处理后再生成所述待检索图片的向量,包括:
从所述待检索图片中裁剪出k张裁剪图片,所述k张裁剪图片中每张裁剪图片包含一个所述目标;
计算所述k张裁剪图片中每张裁剪图片占所述待检索图片的比例,将所述比例作为所述k张裁剪图片中每张裁剪图片所包含的目标的权值;
采用所述已训练向量生成模型对所述k张裁剪图片中每张裁剪图片分别生成对应的一个向量vi,所述向量vi的维数与所述多维向量的维数相同;
将所述向量vi分别乘以所述裁剪图片中目标的权值后求和,将所述和作为所述待检索图片的向量。
4.如权利要求1所述图片检索方法,其特征在于,所述方法还包括:
将所述数据集中的训练用图片进行预处理,得到预处理训练用图片,所述预处理包括对所述训练用图片进行水平翻转、随机旋转、随机裁切和变换颜色中的任意一种或多种组合;
将所述预处理训练用图片输入所述目标检测模型进行训练,直至损失函数收敛至预设阈值后停止训练,得到所述已训练目标检测模型。
5.如权利要求1所述图片检索方法,其特征在于,所述方法还包括:
对深度分类模型进行训练,得到所述已训练向量生成模型。
6.如权利要求5所述图片检索方法,其特征在于,所述对深度分类模型进行训练,得到所述已训练向量生成模型,包括:
将公共资源公开的图片作为训练集输入所述深度分类模型,对所述深度分类模型进行训练以得到预训练向量生成模型;
调整所述预训练向量生成模型的参数,得到所述已训练向量生成模型。
7.如权利要求1至6任意一项所述图片检索方法,其特征在于,所述方法还包括:
在离线状态下,采用所述已训练目标检测模型和已训练向量生成模型生成所述向量库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010861160.0/1.html,转载请声明来源钻瓜专利网。