[发明专利]获取与页面相关的搜索词的方法、装置和系统有效
申请号: | 201710391699.2 | 申请日: | 2017-05-27 |
公开(公告)号: | CN107193987B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 蔡建山 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/9535 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 屠长存 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 页面 相关 搜索词 方法 装置 系统 | ||
1.一种针对当前浏览页面推荐相关搜索词的方法,包括:
分析用户的浏览日志,以从所述浏览日志中识别出用户的搜索行为记录和浏览行为记录;
从所述搜索行为记录中提取对应的搜索词,从所述浏览行为记录中提取对应的页面识别信息;
基于所述用户的浏览日志中所述搜索行为记录和所述浏览行为记录之间的关联关系,确定与所述页面识别信息对应的搜索词子列表,所述搜索词子列表中包括与对应于所述页面识别信息的浏览行为记录相关联的搜索行为记录所对应的搜索词,所述搜索词子列表包括后置搜索词子列表,所述后置搜索词子列表包括后置搜索词,所述后置搜索词是在对应于所述页面识别信息的浏览行为记录之后发生并与该浏览行为记录相关联的搜索行为记录所对应的搜索词;
提供当前浏览页面的页面识别信息对应的后置搜索词子列表中的至少一个后置搜索词。
2.根据权利要求1所述的方法,还包括:
聚合从多个用户的浏览日志获取的搜索词子列表,以得到与各个页面识别信息分别对应的搜索词合并列表。
3.根据权利要求2所述的方法,还包括:
对所述搜索词子列表中的各个搜索词分别设置权重,
并且,所述聚合从多个用户的浏览日志获取的搜索词子列表的步骤包括:
对于同一个页面识别信息,基于从所述多个用户的浏览日志获取的与其对应的搜索词的权重,得到所述搜索词在所述搜索词合并列表中的总权重;以及
基于所述总权重对与所述同一个页面识别信息对应的所述搜索词合并列表中的搜索词排序。
4.根据权利要求3所述的方法,其中,
基于所述搜索词的输入方式来设置所述权重;并且/或者基于所述搜索词对应的搜索行为记录与所述页面识别信息对应的浏览行为记录之间的时间间隔和/或间隔的搜索行为记录和/或浏览行为记录数量来设置所述权重。
5.根据权利要求1所述的方法,其中,所述分析用户的浏览日志以从所述浏览日志中识别出用户的搜索行为记录和浏览行为记录的步骤包括:
根据页面的HOST及URL特征、请求参数,并且/或者根据页面的标题,从所述浏览日志中识别出所述用户的搜索行为和浏览行为。
6.根据权利要求1-5中任何一项所述的方法,其中,
所述搜索词子列表还包括前置搜索词子列表,
所述前置搜索词子列表包括前置搜索词,所述前置搜索词是在对应于所述页面识别信息的浏览行为记录之前发生并与该浏览行为记录相关联的搜索行为记录所对应的搜索词。
7.根据权利要求6所述的方法,其中,所述基于所述搜索行为记录和所述浏览行为记录之间的关联关系,确定与所述页面识别信息对应的搜索词子列表的步骤包括:
将同一个用户的浏览日志中的行为记录划分成一个或多个会话,使得每个会话满足以下至少一项条件:会话中的第一条行为记录与最后一条行为记录之间的时间差不大于第一阈值;和/或会话中相邻两条行为记录之间的时间间隔不大于第二阈值;和/或会话中的搜索行为记录和/或浏览行为记录的数量不大于第三阈值,其中,所述行为记录包括所述搜索行为记录和所述浏览行为记录;
将同一个会话中,浏览行为记录之前的所有搜索行为记录对应的搜索词确定为所述浏览行为记录对应的页面识别信息的所述前置搜索词;
将同一个会话中,浏览行为记录之后的所有搜索行为记录对应的搜索词确定为所述浏览行为记录对应的页面识别信息的所述后置搜索词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710391699.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子元件销售用展示盒
- 下一篇:一种计算机展示体验台