[发明专利]一种相关搜索系统及方法有效
申请号: | 201410380639.7 | 申请日: | 2014-08-04 |
公开(公告)号: | CN104143005B | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 杨锦峰 | 申请(专利权)人: | 五八同城信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律恒立业知识产权代理事务所(特殊普通合伙)11416 | 代理人: | 顾珊,庞立岩 |
地址: | 300457 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相关 搜索 系统 方法 | ||
技术领域
本发明涉及搜索引擎技术领域,特别是一种相关搜索系统及方法。
背景技术
随着互联网的发展,通过互联网网络侧可以为客户端提供各种服务。其中一种就是搜索服务,也就是在网络侧设置搜索引擎,当网络侧的搜索引擎接收客户端发送的搜索请求后,检索互联网网络侧候选数据库中所存储的匹配该搜索请求携带的关键词的所有字面索引,提供给客户端。为了提高使用客户端的用户搜索体验度,提出了相关搜索技术,也就是网络侧的搜索引擎在接收搜索请求后,不仅仅检索互联网网络侧候选数据库中匹配该搜索请求携带的关键词的所有字面索引,还检索互联网网络侧候选数据库所存储的匹配该搜索请求携带的关键词的相关或相近字面索引,提供给客户端,用于用户的进一步搜索。
然而,现有的相关搜索技术使用词频-逆文档频率法对关键词进行提取,然而由于该方法提取的关键词的准确性不高,影响了相关搜索的结果的准确率。
因此,需要一种相关搜索系统及方法,以简单的结构实现高效精准的相关搜索。
发明内容
本发明的目的是提供一种相关搜索系统及方法。
根据本发明的一个方面,提供了一种相关搜索的方法,其特征在于,包括如下步骤:a)接收搜索词,提取关键词及关键词参数;b)基于所述关键词及所述关键词参数,筛选出至少一个候选搜索词;c)利用神经网络语言模型计算所述搜索词与所述候选搜索词之间的相关性,并获取其他特征相关性;d)进行对多种特征相关性的加权计算,得到相关搜索词结果。
优选地,所述步骤a中还包括获取用户设备情景信息。
优选地,所述步骤a还包括获取用户身份信息。
优选地,所述步骤b中通过垂直搜索引擎进行对所述候选搜索词的筛选。
优选地,所述步骤c利用神经网络语言模型计算当前搜索词与候选搜索词之间的相关性的方法如下:c1)提取所述搜索词或所述候选搜索词中的所述关键词在所述神经网络语言模型中的向量;c2)计算所述搜索词或所述候选搜索词的模型向量;c3)计算所述搜索词或所述候选搜索词的模型向量之间的距离。
优选地,所述其他特征相关性包括以下分数中的至少一种:关键词相关分数、字面距离分数、搜索次数分数、共同出现搜索分数、物理距离分数。
优选地,步骤d包括如下步骤:
d1)提取各种特征相关性分数的权重;
d2)进行加权计算,求出所述候选搜索词与所述搜索词的相关性分数;
d3)将计算分数排序;
d4)选取分数最高的1个或多个所述候选搜索词作为所述相关搜索词以向用户返回结果。
优选地,基于所述用户设备情景信息对各种特征相关性分数配置不同的权重,步骤c基于所述用户设备情景信息,进行对多种特征相关性分数的加权计算。
根据本发明的另一方面,提供了一种相关搜索的系统,其特征在于,所述系统包括接收模块、关键词提取模块、搜索词数据库、筛选模块、相关性计算模块,以及融合模块,其中,所述接收模块用于接收来自客户端的搜索词,并将所述搜索词向所述关键词提取模块输出;所述关键词提取模块用于提取关键词及关键词参数,并将所述关键词及关键词参数输出至所述筛选模块;所述搜索词数据库用于存储候选搜索词;所述筛选模块用于在所述搜索词数据库中,以所述关键词参数为筛选条件,搜索出候选搜索词;所述相关性计算模块用于利用神经网络语言模型计算所述搜索词与所述候选搜索词之间的相关性,并获取其他特征相关性分数;所述融合模块用于对多种特征相关性分数的加权计算,得到相关搜索词结果。
优选地,所述接收模块还读取客户端的用户设备情景信息,并将所述用户设备情景信息向所述融合模块输出。
优选地,所述融合模块首先基于所述用户设备情景信息对各种特征相关性分数配置不同的权重,然后根据该权重,进行对多种特征相关性分数的加权计算,得到所述相关搜索词结果。
根据本发明的一种相关搜索系统及方法,能够实现以简单的结构实现高效精准的相关搜索。
附图说明
参考随附的附图,本发明更多的目的、功能和优点将通过本发明实施方式的如下描述得以阐明,其中:
图1示意性示出了本发明的一种相关搜索方法的流程图。
图2示意性示出了本发明的一种相关搜索系统的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五八同城信息技术有限公司,未经五八同城信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410380639.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于图片匹配检测钓鱼网页的方法及装置
- 下一篇:校园触摸查询一体机