[发明专利]获取与页面相关的搜索词的方法、装置和系统有效

专利信息
申请号: 201710391699.2 申请日: 2017-05-27
公开(公告)号: CN107193987B 公开(公告)日: 2020-12-29
发明(设计)人: 蔡建山 申请(专利权)人: 阿里巴巴(中国)有限公司
主分类号: G06F16/953 分类号: G06F16/953;G06F16/9535
代理公司: 北京展翼知识产权代理事务所(特殊普通合伙) 11452 代理人: 屠长存
地址: 310052 浙江省杭州市滨江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 获取 页面 相关 搜索词 方法 装置 系统
【说明书】:

发明公开了一种获取与页面相关的搜索词的方法、装置和系统。在该搜索词获取方法中,分析用户的浏览日志,以从浏览日志中识别出用户的搜索行为记录和浏览行为记录;从搜索行为记录中提取对应的搜索词,从浏览行为记录中提取对应的页面识别信息;基于用户的浏览日志中搜索行为记录和浏览行为记录之间的关联关系,确定与页面识别信息对应的搜索词子列表,搜索词子列表中包括与对应于页面识别信息的浏览行为记录相关联的搜索行为记录所对应的搜索词。由此,能够高效地确定与页面具有语义联系的相关搜索词,提高搜索词的新颖性和多样性。

技术领域

本发明涉及页面浏览与搜索技术领域,尤其涉及一种获取与页面相关搜索词的方法、装置和系统及与页面相关的搜索词的推荐方法与装置。

背景技术

随着信息的快速膨胀,搜索引擎成为获取知识的重要手段。相应地,需要挖掘更多与页面具有关联关系的搜索词,以便于快速准确地向用户提供搜索结果。

一方面,当用户使用搜索词进行搜索时,搜索引擎往往还会向用户提供一些与搜索词含义相似的同义搜索词的搜索结果。为此,需要整理同义搜索词库。而一般而言,同义搜索词是通过对各搜索词的语义进行分析来获取的,同义搜索词的获得途径较为狭窄。相应地,通过搜索词结合同义搜索词得到的搜索结果(页面)在新颖性和多样性方面都存在不足。

另一方面,用户在阅读页面(例如网页)内容时,如果对当前页面内容不满意,或者想进一步获取与页面内容相关的知识,往往会打开搜索引擎页面,主动发起搜索。此时,搜索词可能是页面内容中存在的词语,也可能是用户浏览页面内容时想到的页面内容中不存在的词语。此时,若在页面上主动展示与当前页面相关的搜索词,则可以帮助用户快速跳转至搜索结果页,极大的缩短了知识获取的路径,提升用户体验。

而为了显示与页面内容相关的搜索词,传统方法一般是分析用户当前浏览的页面内容。这包含页面抓取、页面解析、关键词提取、匹配文本相似搜索词等步骤,这些步骤的逻辑通常比较复杂,非常消耗服务器时间和资源,推荐效率极为低下。并且,使用这种方法推荐出的搜索词与当前页面在内容上相似,不可能推荐出当前页面内容中不存在但与当前页面内容有语义上的联系的搜索词,而这样的搜索词很有可能是阅读当前页面内容的用户因为对相关内容感兴趣而期望进行搜索的。因此,现有传统搜索词推荐方法的推荐结果的新颖性和多样性都严重不足。

因此,仍然需要一种获取与页面相关的搜索词的方案。

发明内容

本发明的目的是提供一种获取与页面相关的搜索词的方法、装置和系统,以期基于用户行为高效地确定页面相关的搜索词,提高相关搜索词的新颖性和多样性。

根据本发明的一个方面,提供了一种获取与页面相关的搜索词的方法,该方法可以包括:分析用户的浏览日志,以从浏览日志中识别出用户的搜索行为记录和浏览行为记录;从搜索行为记录中提取对应的搜索词,从浏览行为记录中提取对应的页面识别信息;基于用户的浏览日志中搜索行为记录和浏览行为记录之间的关联关系,确定与页面识别信息对应的搜索词子列表,搜索词子列表中包括与对应于页面识别信息的浏览行为记录相关联的搜索行为记录所对应的搜索词。

由此,即可基于用户的行为高效地确定与页面相关的搜索词,拓展搜索词的来源,以提高相关搜索词的新颖性和多样性。

优选地,该方法还可以包括:聚合从多个用户的浏览日志获取的搜索词子列表,以得到与各个页面识别信息分别对应的搜索词合并列表。

由此,通过聚合大量用户的搜索词子列表,可以参考广大用户的搜索+浏览行为或浏览+搜索行为挖掘出更多与页面有关联关系的搜索词。

聚合时,可以将多个搜索词子列表中重复出现的相同的搜索词合并为一个搜索词。并且,还可以根据该搜索词在各搜索词子列表中出现的次数等信息,对搜索词合并列表中的所有搜索词排序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710391699.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top