[发明专利]一种用于挖掘与检索词相关的关键词的方法和装置有效
申请号: | 201710138638.5 | 申请日: | 2017-03-09 |
公开(公告)号: | CN108572971B | 公开(公告)日: | 2022-11-01 |
发明(设计)人: | 陈敏;秦首科;韩友;黄飞;袁腾飞;邱学忠;贾银芳;刘国庆;韩聪 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 挖掘 检索 相关 关键词 方法 装置 | ||
1.一种用于挖掘与检索词相关的关键词的方法,其中,该方法包括:
根据搜索引擎中的搜索日志信息,获得与检索词query具有高相关性的历史展现结果,其中,所述历史展现结果包括历史展现页面中所展现的针对query的历史搜索结果和/或与query相关的辅助展现结果,其中,所述与query相关的辅助展现结果表示所述历史展现页面中除历史搜索结果以外的不包含所述query且与所述query相关的展现结果项;
聚合所述历史搜索结果对应的页面中的信息和/或聚合所述辅助展现结果所展现内容,得到与query相对应的至少一个聚合结果;
从所述至少一个聚合结果中提取多个基础词条;
对于所述多个基础词条中的每个基础词条,根据该基础词条的特征计算该基础词条的权值;
根据计算得到的所述多个基础词条所分别对应的权值,从该多个基础词条中提取与query相关的关键词,并将所述query与所述query相关的关键词存储至数据库,以用于用户在搜索时查找与所述用户输入的检索词相关的关键词;若所述历史展现结果包括历史展现页面中所展现的针对query的历史搜索结果,所述聚合所述历史搜索结果对应的页面中的信息,得到与query相对应的至少一个聚合结果,还包括:
根据所述query以及与所述历史搜索结果相对应的多个url,构建多个query,url对;
根据所述多个query,url对,聚合所述历史搜索结果对应的页面中的信息。
2.根据权利要求1所述的方法,其中,所述历史展现结果包括历史展现页面中所展现的与query相关的辅助展现结果,所述聚合所述辅助展现结果所展现内容的步骤包括:
对所述辅助展现结果中的所有展现内容进行聚合。
3.根据权利要求1的方法,其中,所述从所述至少一个聚合结果中提取多个基础词条的步骤包括:
对于所述至少一个聚合结果中的每个聚合结果,对该聚合结果进行分词处理,获得与该聚合结果相应的多个基础词条。
4.根据权利要求1或3所述的方法,其中,基础词条的特征包括以下至少一项:
-基础词条的词性/重要等级;
-基础词条在聚合结果中的TF-IDF特征;
-基础词条所在的展现结果项所对应的用户行为特征;
-基础词条在query中的出现情况。
5.根据权利要求1所述的方法,其中,所述根据搜索引擎中的搜索日志信息,获得与检索词query具有高相关性的历史展现结果的步骤包括:
根据搜索引擎中的搜索日志信息,并结合预定指标信息,获得与query具有高相关性的历史展现结果。
6.根据权利要求5所述的方法,其中,所述预定指标信息所指示的预定指标包括以下至少一项:
-历史展现量;
-历史展现位置;
-历史点击量;
-历史点击时间分布。
7.根据权利要求1所述的方法,其中,该方法还包括:
根据用户输入的检索词,查找与所述用户输入的检索词相关的关键词;
基于所述用户输入的检索词以及与所述用户输入的检索词相关的关键词发起搜索,并将搜索结果提供给所述用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710138638.5/1.html,转载请声明来源钻瓜专利网。