[发明专利]一种相关搜索系统及方法有效
申请号: | 201410380639.7 | 申请日: | 2014-08-04 |
公开(公告)号: | CN104143005B | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 杨锦峰 | 申请(专利权)人: | 五八同城信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律恒立业知识产权代理事务所(特殊普通合伙)11416 | 代理人: | 顾珊,庞立岩 |
地址: | 300457 天津市滨海新*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相关 搜索 系统 方法 | ||
1.一种相关搜索的方法,其特征在于,包括如下步骤:
a)接收搜索词,提取关键词及关键词参数;
b)基于所述关键词及所述关键词参数,利用所述关键词参数的组合作为筛选条件筛选出至少一个候选搜索词;
c)利用神经网络语言模型计算所述搜索词与所述候选搜索词之间的相关性,并获取其他特征相关性,其中所述搜索词与所述候选搜索词之间的相关性通过如下方法计算:
c1)提取所述搜索词和所述候选搜索词中的关键词在所述神经网络语言模型中的向量;
c2)计算所述搜索词和所述候选搜索词的模型向量;
c3)计算所述搜索词和所述候选搜索词的模型向量之间的距离;
d)基于用户设备情景信息对各种特征相关性分数配置不同的权重,进行包括基于用户设备情景信息的多种特征相关性的加权计算,得到相关搜索词结果,其中所述多种特征相关性的加权计算包括:
d1)提取各种特征相关性分数的权重;
d2)进行加权计算,求出所述候选搜索词与所述搜索词的相关性分数;
d3)将计算分数排序;
d4)选取分数最高的1个或多个所述候选搜索词作为所述相关搜索词以向用户返回结果。
2.根据权利要求1所述的方法,其特征在于,所述步骤a中还包括获取用户设备情景信息。
3.根据权利要求1所述的方法,其特征在于,所述步骤a还包括获取用户身份信息。
4.根据权利要求1所述的方法,其特征在于,所述步骤b中通过垂直搜索引擎进行对所述候选搜索词的筛选。
5.根据权利要求1所述的方法,其特征在于,所述其他特征相关性包括以下分数中的至少一种:关键词相关分数、字面距离分数、搜索次数分数、共同出现搜索分数、物理距离分数。
6.一种相关搜索的系统,其特征在于,所述系统包括接收模块、关键词提取模块、搜索词数据库、筛选模块、相关性计算模块,以及融合模块,其中,
所述接收模块用于接收来自客户端的搜索词,并将所述搜索词向所述关键词提取模块输出;
所述关键词提取模块用于提取关键词及关键词参数,并将所述关键词及关键词参数输出至所述筛选模块,利用所述关键词参数的组合作为筛选条件筛选出至少一个候选搜索词;
所述搜索词数据库用于存储候选搜索词;
所述筛选模块用于在所述搜索词数据库中,以所述关键词参数为筛选条件,搜索出候选搜索词;
所述相关性计算模块用于利用神经网络语言模型计算所述搜索词与所述候选搜索词之间的相关性,并获取其他特征相关性分数;以及
所述融合模块用于基于用户设备情景信息对各种特征相关性分数配置不同的权重,进行对多种特征相关性分数的加权计算,得到相关搜索词结果。
7.根据权利要求6所述的系统,其特征在于,所述接收模块还读取客户端的用户设备情景信息,并将所述用户设备情景信息向所述融合模块输出。
8.根据权利要求7所述的系统,其特征在于,所述融合模块首先基于所述用户设备情景信息对各种特征相关性分数配置不同的权重,然后根据该权重,进行对多种特征相关性分数的加权计算,得到所述相关搜索词结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五八同城信息技术有限公司,未经五八同城信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410380639.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于图片匹配检测钓鱼网页的方法及装置
- 下一篇:校园触摸查询一体机