[发明专利]文章倒排方法、文章推荐方法、装置、设备及存储介质有效
申请号: | 201910651692.9 | 申请日: | 2019-07-18 |
公开(公告)号: | CN110347781B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 张晗 | 申请(专利权)人: | 深圳市雅阅科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/335 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允 |
地址: | 518000 广东省深圳市宝安区新安街道*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 方法 推荐 装置 设备 存储 介质 | ||
1.一种基于人工智能的文章倒排方法,其特征在于,包括:
构建每篇文章的贝塔分布,其中,所述贝塔分布中的第一参数表示在统计周期内文章被点击的次数,所述贝塔分布中的第二参数表示在统计周期内文章被展示但未被点击的次数;
通过每篇文章的贝塔分布为对应的文章生成一个随机数,作为文章对应的收益值;
根据每篇文章对应的收益值对文章进行倒排得到文章倒排结果。
2.根据权利要求1所述方法,其特征在于,所述构建每篇文章的贝塔分布,包括:
加载文章参考数据表并加载正排数据;其中,所述文章参考数据表包括文章标识与文章的点击量和展示量之间的对应关系;所述正排数据包括文章标识与文章的属性信息之间的对应关系;
针对所述正排数据中每篇文章,根据所述文章参考数据表构建每篇文章的贝塔分布。
3.根据权利要求2所述方法,其特征在于,所述针对所述正排数据中每篇文章,根据所述文章参考数据表确定每篇文章的贝塔分布,包括:
针对所述正排数据中每篇文章,当文章标识存在于所述文章参考数据表中,获取文章对应的点击量和展示量,根据所获取的点击量为文章的贝塔分布中的第一参数进行赋值,并根据所获取的展示量与点击量的差值为文章的贝塔分布中的第二参数进行赋值;
当文章标识不存在于所述文章参考数据表中,则采用第一默认值和第二默认值分别为文章的贝塔分布中的第一参数和第二参数进行赋值。
4.根据权利要求1所述方法,其特征在于,所述方法还包括:
采集文章平台上的用户行为日志;
针对每个采集周期采集的用户行为日志,剔除点击次数大于预设阈值的用户对应的用户行为日志得到每个采集周期的有效用户行为日志;
根据统计周期内所采集的有效用户行为日志,针对每个文章统计文章对应的点击量和展示量,并存储每个文章的文章标识与文章的点击量和展示量的对应关系;其中,所述统计周期包括多个采集周期。
5.根据权利要求4所述方法,其特征在于,当文章为视频文章时,则所述根据统计周期内所采集的有效用户行为日志,针对每个文章统计文章对应的点击量,包括:
根据统计周期内所采集的有效用户行为日志,针对每个视频文章统计视频文章对应的有效点击量,所述有效点击量为针对视频文章的点击总次数和视频文章在自动播放模式下的有效播放次数总和。
6.一种基于人工智能的文章推荐方法,其特征在于,包括:
获取登录用户的用户画像数据;
根据文章在当前统计周期内的被点击次数以及展示但未被点击次数确定文章的贝塔分布,并根据文章的贝塔分布生成随机数作为文章的收益值;
根据文章的收益值进行排序得到文章倒排结果;
根据所述文章倒排结果召回与所述登录用户的用户画像数据匹配的预设数量篇文章;
根据召回的文章进行文章推荐。
7.根据权利要求6所述方法,其特征在于,所述根据文章的收益值进行排序得到文章倒排结果,包括:
根据正排数据中文章标签对文章进行聚类;
针对每类文章,按照文章的收益值对文章进行降序排序得到每类文章各自对应的文章倒排结果;
保存每类文章的文章标签以及每类文章的文章倒排结果之间的对应关系。
8.根据权利要求7所述方法,其特征在于,所述根据所述文章倒排结果召回与所述登录用户的用户画像数据匹配的预设数量篇文章,包括:
根据每类文章的文章倒排结果,从每类文章中召回与所述登录用户的用户画像数据匹配的预设数量篇文章;
记录每类文章的文章标签与被召回的文章之间的对应关系;
则所述根据召回的文章进行文章推荐,包括:
根据每类文章的文章标签与被召回的文章的对应关系进行文章推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市雅阅科技有限公司,未经深圳市雅阅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910651692.9/1.html,转载请声明来源钻瓜专利网。