[发明专利]查询词相似度计算方法及装置、查询词搜索方法及装置有效
申请号: | 201510534925.9 | 申请日: | 2015-08-27 |
公开(公告)号: | CN105045781B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 王跃;俞琪;曾洪雷 | 申请(专利权)人: | 广州神马移动信息科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 张阳 |
地址: | 510627 广东省广州市天河区黄埔大*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 查询 相似 计算方法 装置 搜索 方法 | ||
1.一种为当前真实用户的查询计算查询词相似度的方法,其特征在于,包括:
确定与第一查询词对应的第一特征向量集合,及,与第二查询词对应的第二特征向量集合;其中,所述第一特征向量集合和所述第二特征向量集合依据历史搜索日志确定,所述历史搜索日志包含不同真实用户针对所述第一查询词而发生的点击网页行为的日志数据,以及,不同真实用户针对所述第二查询词而发生的点击网页行为的日志数据;
计算所述第一特征向量集合和所述第二特征向量集合的特征相似度;
在所述第一查询词和所述第二查询词均满足预设条件的情况下,将所述特征相似度确定为所述第一查询词和第二查询词之间的查询词相似度,
其中,所述第一特征向量集合包括:由第一标题词语集合中每个标题词语的点击次数所构建的第一标题特征向量;
相应的,所述第二特征向量集合包括:由第二标题词语集合中每个标题词语的点击次数所构建的第二标题特征向量;
其中,所述第一标题词语集合为在所述历史搜索日志中由所述第一查询词对应的所有点击网页中提取到的所有网页标题的集合,所述第二标题词语集合为在所述历史搜索日志中由所述第二查询词对应的所有点击网页中提取到的所有网页标题的集合;或者,所述第一标题词语集合为在所述历史搜索日志中由所述第一查询词对应的所有点击网页中提取到的所有网页标题,并将所有网页标题进行二元分词后得到的分词结果的集合;所述第二标题词语集合为在所述历史搜索日志中由所述第二查询词对应的所有点击网页中提取到的所有网页标题,并将所有网页标题进行二元分词后得到的分词结果的集合。
2.如权利要求1所述的方法,其特征在于,还包括:
计算所述第一查询词和所述第二查询词之间的字样相似度;
在所述第一查询词和所述第二查询词均不满足预设条件的情况下,将所述字样相似度确定为所述第一查询词与所述第二查询词之间的查询词相似度。
3.如权利要求1所述的方法,其特征在于,还包括:
计算所述第一查询词和所述第二查询词之间的字样相似度;
在所述第一查询词和所述第二查询词其中一个不满足预设条件的情况下,将所述特征相似度和所述字样相似度的结合结果,确定为所述第一查询词与所述第二查询词之间的查询词相似度。
4.如权利要求1所述的方法,其特征在于,所述计算所述第一特征向量集合和所述第二特征向量集合的特征相似度,包括:
在所述第一特征向量集合和所述第二特征向量集合中,计算每对相同类型的特征向量之间的夹角余弦,得到一个或多个夹角余弦;其中,所述第一特征向量集合包括由历史搜索日志中提取的、与所述第一查询词对应的一个或多个类型的特征向量;所述第二特征向量集合包括由所述历史搜索日志中提取的、与所述第二查询词对应的所述一个或多个类型的特征向量;
计算所述一个或多个夹角余弦之间的拟合结果;
将所述拟合结果确定为所述第一特征向量集合和所述第二特征向量集合的特征相似度。
5.如权利要求1所述的方法,其特征在于,
所述第一特征向量集合包括:由第一网页网址集合中每个网页网址的点击次数所构建的第一网址特征向量;其中,所述第一网页网址集合为在所述历史搜索日志中由所述第一查询词对应的所有点击网页的网址的集合;
相应的,所述第二特征向量集合包括:由第二网页网址集合中每个网页网址的点击次数所构建的第二网址特征向量;其中,所述第二网页网址集合为在所述历史搜索日志中由所述第二查询词对应的所有点击网页的网址的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州神马移动信息科技有限公司,未经广州神马移动信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510534925.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:包含染料的衣物洗涤护理组合物
- 下一篇:浇注型聚酰胺、其生产方法及其用途