[发明专利]一种用于挖掘与检索词相关的关键词的方法和装置有效

专利信息
申请号: 201710138638.5 申请日: 2017-03-09
公开(公告)号: CN108572971B 公开(公告)日: 2022-11-01
发明(设计)人: 陈敏;秦首科;韩友;黄飞;袁腾飞;邱学忠;贾银芳;刘国庆;韩聪 申请(专利权)人: 百度在线网络技术(北京)有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/9538
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 杨泽;刘芳
地址: 100085 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 挖掘 检索 相关 关键词 方法 装置
【说明书】:

发明提供了一种用于挖掘与检索词相关的关键词的方法和装置,该方法包括:根据搜索引擎中的搜索日志信息,获得与检索词query具有高相关性的历史展现结果,其中,所述历史展现结果包括历史展现页面中所展现的针对query的历史搜索结果和/或与query相关的辅助展现结果;根据所述历史展现结果,生成与query相对应的至少一个聚合结果;从所述至少一个聚合结果中提取与query相关的关键词。根据本发明的方案,引入了用户历史搜索行为指导,且借鉴了海量历史搜索结果,较大程度地弥补了检索词本身的信息量不足的问题,从而利于挖掘出能够反映用户搜索意图的真正关键词。

技术领域

本发明涉及计算机技术领域,尤其涉及一种用于挖掘与检索词相关的关键词的方法和装置。

背景技术

现有技术中,用户在搜索时主要通过其输入的检索词来表达其搜索意图,因此,搜索引擎对检索词的意图理解是否准确非常关键。而针对检索词的关键词提取技术,是搜索引擎检索词理解的基础模块。

目前通常采用以下两种关键词提取技术:一,通过各种自然语言处理工具,分析检索词本身所包含的各个基础词条的权重,从而从检索词中提取出其中的关键词;二,聚合所有检索词,基于TF-IDF或者各种主题模型(PLSA/LDA等),提取其中的关键词。上述两种关键词提取技术存在以下缺点:一方面,用户输入的检索词通常比较随意,甚至偏口语化,且部分检索词可能存在错别字,甚至拼音等,如果仅仅从检索词本身出发,则不能较好地获取到匹配用户搜索意图的真正关键词;另一方面,没有充分借鉴现有的海量第三方网页上的相关知识,很难挖掘到匹配用户搜索意图的真正关键词。

发明内容

本发明的目的是提供一种用于挖掘与检索词相关的关键词的方法和装置。

根据本发明的一个方面,提供一种用于挖掘与检索词相关的关键词的方法,其中,该方法包括:

根据搜索引擎中的搜索日志信息,获得与检索词query具有高相关性的历史展现结果,其中,所述历史展现结果包括历史展现页面中所展现的针对query的历史搜索结果和/或与query相关的辅助展现结果;

根据所述历史展现结果,生成与query相对应的至少一个聚合结果;

从所述至少一个聚合结果中提取与query相关的关键词。

根据本发明的另一个方面,还提供了一种用于挖掘与检索词相关的关键词的装置,其中,该装置包括:

第一获得装置,用于根据搜索引擎中的搜索日志信息,获得与检索词query具有高相关性的历史展现结果,其中,所述历史展现结果包括历史展现页面中所展现的针对query的历史搜索结果和/或与query相关的辅助展现结果;

生成装置,用于根据所述历史展现结果,生成与query相对应的至少一个聚合结果;

第一提取装置,用于从所述至少一个聚合结果中提取与query相关的关键词。

与现有技术相比,本发明具有以下优点:能够基于与检索词具有高相关性的历史展现结果,来聚合得到与检索词相对应的至少一个聚合结果,并从该至少一个聚合结果中提取与检索词相关的关键词,该挖掘与检索词相关的关键词的方案引入了用户历史搜索行为指导,且借鉴了海量历史搜索结果,较大程度地弥补了检索词本身的信息量不足的问题,从而利于挖掘出能够反映用户搜索意图的真正关键词。此外,当用户发起实际搜索时,可先查找到线下挖掘得到的与用户输入的检索词相关的关键词再发起搜索,从而能够为用户提供更高质量的搜索服务;并且,若基于海量用户最近的历史搜索行为来挖掘与检索词相关的关键词,则在用户的实际搜索中基于该等挖掘得到的与检索词相关的关键词所获得的搜索结果,更可能满足用户的实时搜索需求。此外,将该挖掘与检索词相关的关键词的方案应用于实际搜索过程中的广告触发时,能够大幅提升搜索广告触发比例,大量提升搜索流量的变现效率。

附图说明

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710138638.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top