[发明专利]一种文章推荐方法和装置有效
申请号: | 201810930290.8 | 申请日: | 2018-08-15 |
公开(公告)号: | CN109241410B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 黄玉兰;赵琳;宋佳颖;杨月奎 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文章 推荐 方法 装置 | ||
1.一种文章推荐方法,其特征在于,包括:
获取样本用户的第一历史点击文章数据,所述第一历史点击文章数据包括样本用户在第一历史时间段内点击过的样本文章;
根据所述第一历史点击文章数据和主题模型对样本用户进行聚簇,得到若干用户簇;
获取样本用户的第二历史点击文章数据,所述第二历史点击文章数据包括样本用户在第二历史时间段内点击过的候选文章,所述第二历史时间段的时间长度小于所述第一历史时间段,且所述第二历史时间段的结束时刻与所述第一历史时间段的结束时刻相同;
根据所述第二历史点击文章数据获取所述用户簇对应的待推荐文章;
当需要推荐文章时,确定当前需要推荐文章的目标用户所属的至少一个目标用户簇,得到目标用户簇集合;
获取在第三历史时间段内基于目标用户簇向用户推荐的历史推荐文章被点击展示的点击展示次数;
根据所述点击展示次数对目标用户簇集合中用户簇进行过滤,得到过滤后目标用户簇集合;
基于过滤后目标用户簇集合中目标用户簇对应的待推荐文章向所述目标用户推荐相应的文章。
2.如权利要求1所述的文章推荐方法,其特征在于,根据所述第一历史点击文章数据和主题模型对样本用户进行聚簇,包括:
根据所述第一历史点击文章数量和主题模型,获取样本用户对主题感兴趣的主题概率分布;
根据所述主题概率分布将所述样本用户划分到所述主题对应的用户簇。
3.如权利要求1所述的文章推荐方法,其特征在于,在根据所述第一历史点击文章数据和主题模型对样本用户进行聚簇之前,所述方法还包括:
根据所述第一历史点击文章数据获取样本用户在第一历史时间段内点击样本文章的点击次数;
根据样本用户在第一历史时间段内点击样本文章的点击次数,对第一历史点击文章数据进行过滤,得到过滤后历史点击文章数据;
根据所述第一历史点击文章数据和主题模型对样本用户进行聚簇,包括:根据所述过滤后历史点击文章数据和主题模型对样本用户进行聚簇。
4.如权利要求1所述的文章推荐方法,其特征在于,根据所述第二历史点击文章数据获取所述用户簇对应的待推荐文章,包括:
根据所述第二历史点击文章数据获取所述候选文章在所述用户簇内被点击展示的点击展示次数,得到所述候选文章对应的簇内点击展示次数;
根据所述簇内点击展示次数,获取所述候选文章与用户簇之间的相关度;
根据所述相关度对候选文章进行排序,并从排序后的文章中选择所述用户簇对应的待推荐文章。
5.如权利要求4所述的文章推荐方法,其特征在于,根据所述簇内点击展示次数,获取所述候选文章与用户簇之间的相关度,包括:
获取所述候选文章对应的簇外点击展示次数;其中,簇外点击展示次数为候选文章在除当前用户簇以外的其余用户簇内点击展示次数之和;
根据所述候选文章对应的簇外点击展示次数、簇内点击展示次数,获取所述候选文章与用户簇之间的相关度。
6.如权利要求1所述的文章推荐方法,其特征在于,根据所述目标用户簇对应的待推荐文章向所述目标用户推荐相应的文章,包括:
获取至少一个目标用户簇对应的待推荐文章,得到待推荐文章集合;
基于逻辑回归模型计算所述待推荐文章集合内待推荐文章的逻辑回归值;
根据逻辑回归值对所述待推荐文章集合内的待推荐文章进行排序;
从排序后的待推荐文章集合中选择文章向目标用户进行推荐。
7.如权利要求1所述的文章推荐方法,其特征在于,根据所述点击展示次数对目标用户簇集合中用户簇进行过滤,包括:
根据所述点击展示次数获取所述历史推荐文章的展示未点击次数;
当所述展示未点击次数大于预设阈值时,将所述目标用户簇从所述目标用户簇集合中删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810930290.8/1.html,转载请声明来源钻瓜专利网。