[发明专利]用于确定用户兴趣的方法和装置有效
申请号: | 201811316647.X | 申请日: | 2018-11-07 |
公开(公告)号: | CN109408725B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 刘华;王小宇 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/284 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 确定 用户 兴趣 方法 装置 | ||
1.一种用于确定用户兴趣的方法,包括:
获取目标用户在第一时间段内的用户行为数据,所述第一时间段包括多个子时间段;
从所述第一时间段的用户行为数据中提取用于表征所述目标用户的兴趣的特征词得到第一特征词集合,以及确定所述目标用户浏览包含有所述第一特征词集合中的特征词的资讯页面时的动作参数;
从所述第一特征词集合中剔除敏感度大于或等于预设阈值的特征词,得到第二特征词集合,其中,敏感度用于指示所述目标用户对所述第一特征词集合中的热门特征词的敏感度;
基于所述第二特征词集合和所述目标用户浏览包含有所述第二特征词集合中的特征词的资讯页面时的动作参数,确定所述目标用户的长期兴趣;
其中,敏感度通过如下步骤确定:对于所述多个子时间段中的子时间段,确定该子时间段内的热门特征词总数,以及确定在该子时间段内目标用户浏览过的热门特征词的数量;基于所确定的热门特征词总数和所述目标用户浏览过的热门特征词的数量,确定在所述第一时间段内所述目标用户对热门特征词的敏感度。
2.根据权利要求1所述的方法,其中,所述从所述第一特征词集合中剔除敏感度大于或等于预设阈值的特征词,得到第二特征词集合,包括:
获取所述第一时间段内的热门特征词集合;
确定所述目标用户对所述热门特征词集合中的热门特征词的敏感度;
响应于所述敏感度大于或等于预设阈值,从所述第一特征词集合中剔除所述热门特征词集合中的热门特征词;
将剔除热门特征词后的第一特征词集合确定为第二特征词集合。
3.根据权利要求2所述的方法,其中,所述获取所述第一时间段内的热门特征词集合,包括:
获取所述第一时间段内的资讯页面;
从获取的资讯页面中提取用于表征用户兴趣的至少一个特征词;
对于所述至少一个特征词中的特征词,确定浏览过包含该特征词的资讯页面的浏览用户数、推送过包含该特征词的资讯页面的推送用户数、以该特征词为主题的资讯页面数量;基于所确定的浏览用户数、推送用户数和资讯页面数量,确定该特征词的热门度;若该特征词的热门度大于或等于预设阈值,将该特征词确定为热门特征词;
基于所确定的热门特征词生成热门特征词集合。
4.根据权利要求1所述的方法,其中,所述基于所述第二特征词集合和所述目标用户浏览包含有所述第二特征词集合中的特征词的资讯页面时的动作参数,确定所述目标用户的长期兴趣,包括:
对于所述第二特征词集合中的特征词,确定该特征词上次被所述目标用户浏览的日期以及出现该特征词的子时间段的数量;基于所述目标用户浏览包含有该特征词的资讯页面时的动作参数确定该特征词的权重;基于所确定的日期、数量和权重确定所述目标用户的长期兴趣。
5.根据权利要求1所述的方法,其中,所述方法还包括:
获取所述目标用户在第二时间段内的用户行为数据,所述第二时间段小于所述第一时间段;
从所述第二时间段的用户行为数据中提取特征词得到第三特征词集合,以及确定所述目标用户浏览包含有所述第三特征词集合中的特征词的资讯页面时的动作参数;
基于所述第三特征词集合和所述目标用户浏览包含有所述第三特征词集合中的特征词的资讯页面时的动作参数,确定所述目标用户的短期兴趣。
6.根据权利要求5所述的方法,其中,所述基于所述第三特征词集合和所述目标用户浏览包含有所述第三特征词集合中的特征词的资讯页面时的动作参数,确定所述目标用户的短期兴趣,包括:
对于所述第三特征词集合中的特征词,基于所述目标用户浏览包含有该特征词的资讯页面时的动作参数确定该特征词的权重;基于所确定的权重确定所述目标用户的短期兴趣。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811316647.X/1.html,转载请声明来源钻瓜专利网。