[发明专利]图片搜索相关性预测模型的建立、图片搜索方法和装置有效
申请号: | 201610306220.6 | 申请日: | 2016-05-10 |
公开(公告)号: | CN106021364B | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 付立波;罗恒;方高林;徐伟 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/08 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆,胡彬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 搜索 相关性 预测 模型 建立 方法 装置 | ||
技术领域
本发明实施例涉及信息处理技术,尤其涉及一种图片搜索相关性预测模型的建立、图片搜索方法和装置。
背景技术
图片搜索是指用户输入自然语言查询,例如,通过搜索引擎提供的文本输入框输入的查询式(也称为Query),从图片集合中查找并按照相关性等指标,返回排过序的图片结果给用户的信息检索过程。相关性是搜索引擎最主要的性能指标之一,它度量了返回结果与用户查询需求的相关程度。对于图片搜索引擎,返回的图片是无结构的像素格式,而用户输入的Query是文本格式,这是两种完全不同的信息格式,两者无法直接进行运算。
目前主要通过下述三种方式描述图片搜索的相关性特征:1、文本匹配特征,通过图片周边文本与Query比较计算得到;2、分类匹配特征,对图片内容分类得到分类标签,再与Query比较计算得到;3、点击率特征,通过统计大量用户查询后的点击行为等得到特定图片与该Query的相关性度量。
上述三种描述图片搜索相关性特性的方法均具有一定的局限性:
特征文本匹配特征:图片的周边文本可能存在与图片内容的不一致性,很多情况下不能完整准确的描述图片的内容,因而会影响文本匹配特征的精准性;
分类匹配特征:受限于类别体系的完整性和分类模型的准确性。一般的,类别体系越精细,分类难度越大,分类模型的准确性越差,且分类结果与Query文本的语义偏差越大,匹配越困难。但如果类别体系太粗略,与Query的匹配精度又不够。因此,该特征一般只起辅助作用;
点击率特征:主要基于用户行为统计,一方面存在偏倚和噪声,另一方面有稀疏性,只有在高频Query下展现靠前且展现次数充足的图片,能够统计到较充分的点击,其它情况,统计不到点击,或者点击非常稀疏,缺少统计意义。
发明内容
有鉴于此,本发明实施例提供一种图片搜索相关性预测模型的建立、图片搜索方法和装置,以优选现有的图片搜索技术,提高图片搜索结果与用户输入的查询式之间的相关度。
在第一方面,本发明实施例提供了一种图片搜索相关性预测模型的建立方法,包括:
使用训练样本对预先构建的原始深层神经网络进行训练;
其中,所述训练样本包括:查询式以及图片数据,所述原始深层神经网络包括:表示向量生成网络以及相关计算网络,所述表示向量生成网络用于将所述训练样本中不同类型的数据转换为表示向量并输入至所述相关计算网络,所述相关计算网络用于将输入的至少两个表示向量转换为一个相关性度量值;
将训练完成的所述原始深层神经网络作为所述图片搜索相关性预测模型。
在第二方面,本发明实施例还提供了一种图片搜索方法,包括:
获取用户输入的图片查询式;
将所述图片查询式以及待排序图片分别输入至通过本发明实施例所述的图片搜索相关性预测模型的建立方法建立的图片搜索相关性预测模型中,分别计算各所述待排序图片与所述图片查询式之间的相关性度量值;
根据计算得到的所述相关性度量值对各所述待排序图片进行排序,并将与排序结果对应的图片搜索结果提供给所述用户。
在第三方面,本发明实施例提供了一种图片搜索相关性预测模型的建立装置,包括:
训练模块,用于使用训练样本对预先构建的原始深层神经网络进行训练;
其中,所述训练样本包括:查询式以及图片数据,所述原始深层神经网络包括:表示向量生成网络以及相关计算网络,所述表示向量生成网络用于将所述训练样本中不同类型的数据转换为表示向量并输入至所述相关计算网络,所述相关计算网络用于将输入的至少两个表示向量转换为一个相关性度量值;
模型生成模块,用于将训练完成的所述原始深层神经网络作为所述图片搜索相关性预测模型。
在第四方面,本发明实施例还提供了一种图片搜索装置,包括:
图片查询式获取模块,用于获取用户输入的图片查询式;
相关性度量值计算模块,用于将所述图片查询式以及待排序图片分别输入至通过本发明实施例所述的图片搜索相关性预测模型的建立装置建立的图片搜索相关性预测模型中,分别计算各所述待排序图片与所述图片查询式之间的相关性度量值;
图片搜索结果提供模块,用于根据计算得到的所述相关性度量值对各所述待排序图片进行排序,并将与排序结果对应的图片搜索结果提供给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610306220.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多点式防堵风量测量系统
- 下一篇:用于涡轮式流量计的运行状态监控器