[发明专利]基于用户短期兴趣的新闻推荐方法、装置及介质在审
申请号: | 201910379183.5 | 申请日: | 2019-05-08 |
公开(公告)号: | CN110275952A | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 王健宗;贾雪丽 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/335 | 分类号: | G06F16/335;G06F16/35;G06F17/27;G06K9/62 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 张超艳;李玉琦 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 新闻组 相似度 矩阵 画像 短期兴趣 行为数据 词向量 二分图 排序 存储介质 电子装置 离散变量 数据分析 数据获得 随机游走 分群 构建 降序 聚类 分析 采集 吸收 | ||
1.一种基于用户短期兴趣的新闻推荐方法,其特征在于,包括:
步骤S1,采集用户对新闻的行为数据,所述行为数据包括新闻矩阵;
步骤S2,根据所述新闻矩阵获得对应的词向量矩阵;
步骤S3,对所述词向量矩阵进行聚类,得到每个新闻的分群结果,根据所述分群结果将每个新闻分群到对应的新闻组;
步骤S4,通过每个用户对每个新闻的长期行为数据和短期行为数据分别获得每个用户的长期画像和短期画像,所述长期画像和短期画像用于表征用户对新闻包含的词对应的词向量的偏好;
步骤S5,分析每个用户的长期画像与不同新闻组之间的相似度,得到多个第一相似度;
步骤S6,按照降序对所述多个第一相似度进行排序,基于排序的结果得到每个用户对应的第一设定数量的新闻组;
步骤S7,分析每个用户最新的短期画像与所述第一设定数量的新闻组中每个新闻之间的第二相似度;
步骤S8,根据所述第二相似度构建用户新闻二分图;
步骤S9,在所述用户新闻二分图上使用吸收随机游走方法选取被推荐的新闻,从而得到每个用户的推荐新闻。
2.根据权利要求1所述的基于用户短期兴趣的新闻推荐方法,其特征在于,在步骤S3中,对所述词向量矩阵进行聚类的步骤包括:
对词向量矩阵进行层次聚类,得到层次聚类树状图,所述层次聚类树状图的一个叶结点对应一个新闻;
获得层次聚类每一次聚类结果对应的邓恩指数,在邓恩指数最大值对应的层对所述层次聚类树状图进行切割,获得最佳层次聚类树状图,最佳层次聚类树状图中属于同一父节点的叶结点对应的新闻属于同一新闻组,从而获得每个新闻的新闻分组。
3.根据权利要求2所述的基于用户短期兴趣的新闻推荐方法,其特征在于,
在步骤S2中,对词向量矩阵使用线性判别分析方法进行分析,获得每个新闻的多个主题的主题概率矩阵及每个主题对应的不同的词向量的词概率矩阵,通过每个新闻的主题概率矩阵、词概率矩阵、词向量矩阵组合获得每个新闻的主题值,每个新闻的主题值构成主题矩阵;
在步骤S3中,对所述词向量矩阵进行聚类,得到每个新闻的分群结果,根据所述分群结果将每个新闻分群到对应的新闻组,从而得到每个新闻组的新闻的主题值构成的主题向量;
在步骤S4中,使用线性判别分析方法作为检测潜在主题的语言模型,得到每个用户的长期画像和短期画像;
在步骤S5中,采用向量相似度度量方法确定用户长期画像与每个新闻组的第一相似度;
在步骤S7中,采用向量相似度度量方法确定用户短期画像与所述第一设定数量的每个新闻组的第二相似度;
在步骤S8中,在每个用户的第二相似度中按照降序对每个新闻组进行排序,取前第二设定数量的新闻组,得到每个用户的所述第二设定数量的新闻组,根据每个用户与各自的第二设定数量的新闻组中的新闻构建用户-新闻二分图,其中,二分图上边线的权重根据用户对新闻的评分设定,评分越高,边线的权重越大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910379183.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:问答方法、装置、设备和计算机可读存储介质
- 下一篇:人格分类方法及装置