[发明专利]图像搜索方法、系统和索引构建方法和介质在审
申请号: | 201710935506.5 | 申请日: | 2017-10-10 |
公开(公告)号: | CN110019867A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 刘瑞涛;刘宇 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/50 | 分类号: | G06F16/50;G06F16/953 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;周达 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像搜索 索引构建 准确度 搜索结果 | ||
1.一种图像搜索方法,其特征在于,包括:
接收附带有关键词的查询请求;
根据所述查询请求生成搜索向量;其中,所述搜索向量用于表征所述关键词;
在同一个向量空间中,选择与所述搜索向量相匹配的图像向量,得到结果集;所述图像向量用于表征图像和所述图像的文案。
2.根据权利要求1所述的方法,其特征在于,提供包括所述图像向量和访问标识的索引,所述访问标识用于访问所述图像向量表征的图像;
在选择图像向量的步骤中包括:在所述索引的图像向量与所述搜索向量进行匹配运算,得到所述结果集;所述结果集至少包括与所述搜索向量相匹配的图像向量对应的访问标识。
3.根据权利要求1所述的方法,其特征在于,在生成搜索向量的步骤中包括:根据所述关键词生成所述搜索向量。
4.根据权利要求3所述的方法,其特征在于,在生成所述搜索向量的步骤中包括:
针对所述关键词进行分词处理,得到至少一个子关键词;
根据每个所述子关键词生成词语表征值;每个所述词语表征值用于表征对应的词语;
将所述词语表征值排列形成所述搜索向量。
5.根据权利要求4所述的方法,其特征在于,在形成所述搜索向量的步骤中包括:根据所述词语表征值所表征的子关键词处于所述关键词中的顺序,对所述词语表征值进行排序。
6.根据权利要求1所述的方法,其特征在于,在选择图像向量的步骤中包括:
将所述搜索向量与图像向量的对位求和,在求得数值大于或等于第一指定阈值的情况下,认为所述图像向量与所述搜索向量相匹配;或者,
将所述搜索向量与图像向量之间的对位相减后求和,在得到的数值小于第二指定阈值的情况下,认为所述图像向量与所述搜索向量相匹配;或者,
将所述搜索向量与图像向量做内积,当得到的数值大于或等于第三指定阈值时,认为所述图像向量与所述搜索向量相匹配。
7.根据权利要求1所述的方法,其特征在于,所述图像向量包括第一数据段和第二数据段;所述第一数据段用于表征图像,所述第二数据段用于表征所述图像的文案;
在进行匹配运算的步骤中包括:分别将所述搜索向量与所述图像向量的第一数据段和所述第二数据段进行匹配运算;在所述搜索向量与所述第一数据段、所述第二数据段中的一个相匹配时,认为所述搜索向量与所述图像向量相匹配。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述结果集发送给提供所述查询请求的客户端,以用于所述客户端展示被选择的图像向量所表征的图像。
9.一种图像搜索系统,其特征在于,包括:
请求接收模块,用于接收附带有关键词的查询请求;
搜索向量生成模块,用于根据所述查询请求生成搜索向量;其中,所述搜索向量用于表征所述关键词;
查询模块,用于在同一个向量空间中,选择与所述搜索向量相匹配的图像向量,得到结果集;所述图像向量用于表征图像和所述图像的文案。
10.根据权利要求9所述的系统,其特征在于,还包括:
输出模块,用于将所述结果集发送给发出所述查询请求的客户端。
11.一种图像搜索系统,其特征在于,包括:业务服务器和搜索引擎;
所述业务服务器用于接收客户端提供的附带有关键词的查询请求;根据所述查询请求生成能表征所述关键词的搜索向量,提供给所述搜索引擎;将得到的结果集,反馈给所述客户端;
所述搜索引擎用于在同一个向量空间中,选择与所述搜索向量相匹配的图像向量,得到结果集;将所述结果集反馈给所述业务服务器;其中,所述图像向量用于表征图像和所述图像的文案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710935506.5/1.html,转载请声明来源钻瓜专利网。