[发明专利]一种搜索推荐词的推送方法和装置在审
申请号: | 201711481961.9 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108197244A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 彭睿棋 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 推送 方法和装置 目标网页 网页 网页确定 搜索词 索引表 匹配 应用 分析 | ||
本发明实施例提供了一种搜索推荐词的推送方法和装置,所述方法包括:采用输入的搜索词进行搜索得到至少一个搜索网页;当从所述搜索网页确定出目标网页时,从索引表中获取与所述目标网页匹配的搜索推荐词;推送所述搜索推荐词。应用本发明实施例可以帮用户在海量的网页中找到感兴趣的信息,精准分析用户所需并推荐出用户想要的内容。
技术领域
本发明涉及互联网数据处理技术领域,特别是涉及一种搜索推荐词的推送方法和一种搜索推荐词的推送装置。
背景技术
目前,大多数互联网用户在上网时都有类似的行为:从输入网址到浏览页面,然后顺着页面链接不断打开新的网页。随机游走模型就是针对浏览网页的用户行为建立的抽象模型。之所以要建立这个抽象的概念模型,是因为包括PageRank算法在内的很多链接分析算法都是建立在随机游走模型基础上的。在复杂网络的动态演化中,为用户找到较优的搜索结果提供了一条最短的路径。
搜索引擎的使用场景,也有类似的行为:输入query(查询词、搜索词)浏览搜索结果,然后点击搜索结果打开新的网页,所有的网页都和查询query有一定的相关性,但是当新打开的网页不符合预期,没有找到满意的答案,需要重新改写query二次搜索才有可能找到满意的结果,搜索过程曲折费时。
针对这个问题,合理使用随机游走模型,当用户点击搜索结果后展现用户潜在的,接下来可能搜索的query,可以减少用户的搜索成本,无需手动改写query,帮助用户快速便捷找到搜索结果,能在一定程度上能有效提升搜索体验。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索推荐词的推送方法和相应的搜索推荐词的推送装置。
依据本发明的一个方面,提供了一种搜索推荐词的推送方法,包括:
采用输入的搜索词进行搜索得到至少一个搜索网页;
当从所述搜索网页确定出目标网页时,从索引表中获取与所述目标网页匹配的搜索推荐词;
推送所述搜索推荐词。
可选地,所述索引表通过如下方式生成:
获取用户的行为日志;
从所述行为日志中提取原始搜索词,以及,基于所述原始搜索词进行搜索得到的至少一个原始搜索网页;
确定所述原始搜索词与所述原始搜索网页之间的传递关系;
基于所述原始搜索词、所述原始搜索网页,以及所述原始搜索词与所述原始搜索网页之间的传递关系建立索引表。
可选地,在所述确定所述原始搜索词与所述原始搜索网页之间的传递关系之后,包括:
计算所述原始搜索词与对应的原始搜索网页之间的相关性;
筛选出相关性超过预设阈值的原始搜索词与对应的原始搜索网页。
可选地,所述相关性包括点击率、搜索率和/或浏览率。
可选地,所述从索引表中获取与所述目标网页匹配的搜索推荐词,包括:
在所述索引表中查找是否存在与所述目标网页匹配的原始搜索网页;
将所述原始搜索网页对应的原始搜索词作为搜索推荐词。
可选地,在所述从索引表中获取与所述目标网页匹配的搜索推荐词之后,还包括:
对所述搜索推荐词进行消重处理;
对所述搜索推荐词进行归一化处理;
对所述搜索推荐词进行敏感词过滤处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711481961.9/2.html,转载请声明来源钻瓜专利网。