[发明专利]基于用户短期兴趣的新闻推荐方法、装置及介质在审
申请号: | 201910379183.5 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110275952A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 王健宗;贾雪丽 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F17/27;G06K9/62 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 张超艳;李玉琦 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻组 相似度 矩阵 画像 短期兴趣 行为数据 词向量 二分图 排序 存储介质 电子装置 离散变量 数据分析 数据获得 随机游走 分群 构建 降序 聚类 分析 采集 吸收 | ||
本发明涉及数据分析,提供一种基于用户短期兴趣的新闻推荐方法,包括:采集用户对新闻的行为数据;获得新闻矩阵对应的词向量矩阵;词向量矩阵进行聚类得到每个新闻分群的新闻组;通过每个用户对每个新闻长期行为数据和短期行为数据获得每个用户长期画像和短期画像;分析每个用户长期画像与每个新闻组之间第一相似度;按照第一相似度降序对每个用户的新闻组排序,取排序靠前第一设定数量的新闻组;分析每个用户最近短期画像与第一设定数量新闻组中每个新闻的第二相似度;根据第二相似度构建用户‑新闻二分图;在二分图上使用吸收随机游走方法选取被推荐新闻。本发明还提供一种电子装置及存储介质。本发明适用于离散值较多的离散变量。
技术领域
本发明涉及数据分析技术领域,更为具体地,涉及一种基于用户短期兴趣的新闻推荐方法、装置及介质。
背景技术
在推荐新闻时参考用户的阅读历史是至关重要的。根据内容描绘出一个用户的轮廓被称为用户画像。基于内容的新闻推荐的关键问题是如何根据用户的阅读历史构建用户画像。在处理这个问题时,大多数基于内容的推荐系统将用户的阅读历史考虑为一个整体。一个用户的长期兴趣可能相对稳定,但是从短期来看,用户关注的内容会发生变化。比如一个体育运动爱好者,他的关注点可能会随着不同项目的比赛而改变。因此,采用长期阅读历史确定用户的偏好,并不能准确的为他推荐新闻,也无法更好的激发用户的阅读兴趣。
发明内容
鉴于上述问题,本发明的目的是提供一种结合用户长期与短期的偏好来给用户推荐新闻的基于用户短期兴趣的新闻推荐方法、电子装置及存储介质。
为了实现上述目的,本发明提供一种电子装置,所述电子装置包括存储器和处理器,所述存储器中包括基于用户短期兴趣的新闻推荐程序,所述基于用户短期兴趣的新闻推荐程序被所述处理器执行时实现如下步骤:
步骤S1,采集用户对新闻的行为数据,所述行为数据包括新闻矩阵;
步骤S2,根据所述新闻矩阵获得对应的词向量矩阵;
步骤S3,对所述词向量矩阵进行聚类,得到每个新闻的分群结果,根据所述分群结果将每个新闻分群到对应的新闻组;
步骤S4,通过每个用户对每个新闻的长期行为数据和短期行为数据分别获得每个用户的长期画像和短期画像,所述长期画像和短期画像用于表征用户对新闻包含的词对应的词向量的偏好;
步骤S5,分析每个用户的长期画像与不同新闻组之间的相似度,得到多个第一相似度;
步骤S6,按照降序对所述多个第一相似度进行排序,基于排序的结果得到每个用户对应的第一设定数量的新闻组;
步骤S7,分析每个用户最新的短期画像与所述第一设定数量的新闻组中每个新闻之间的第二相似度;
步骤S8,根据所述第二相似度构建用户新闻二分图;
步骤S9,在所述用户新闻二分图上使用吸收随机游走方法选取被推荐的新闻,从而得到每个用户的推荐新闻。
此外,为了实现上述目的,本发明还提供一种基于用户短期兴趣的新闻推荐方法,包括:
步骤S1,采集用户对新闻的行为数据,所述行为数据包括新闻矩阵;
步骤S2,根据所述新闻矩阵获得对应的词向量矩阵;
步骤S3,对所述词向量矩阵进行聚类,得到每个新闻的分群结果,根据所述分群结果将每个新闻分群到对应的新闻组;
步骤S4,通过每个用户对每个新闻的长期行为数据和短期行为数据分别获得每个用户的长期画像和短期画像,所述长期画像和短期画像用于表征用户对新闻包含的词对应的词向量的偏好;
步骤S5,分析每个用户的长期画像与不同新闻组之间的相似度,得到多个第一相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910379183.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:问答方法、装置、设备和计算机可读存储介质
- 下一篇:人格分类方法及装置