[发明专利]一种基于多级匹配的兴趣激活新闻推荐方法及系统在审
申请号: | 202111533758.8 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114201683A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 杨振宇;崔来平;王钰;马凯洋 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06Q50/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 杨琪 |
地址: | 250353 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多级 匹配 兴趣 激活 新闻 推荐 方法 系统 | ||
本发明提供了一种基于多级匹配的兴趣激活新闻推荐方法及系统,包括:获取候选新闻和用户历史点击新闻,分别进行新闻编码,得到候选新闻表示和用户历史点击新闻表示;基于用户历史点击新闻表示,获得用户全局兴趣特征;基于候选新闻表示和用户历史点击新闻表示,获得用户动态兴趣特征;基于候选新闻表示和用户历史点击新闻表示,获得每个候选新闻与用户历史点击新闻的不同相似度下的局部兴趣匹配排名特征;联合用户全局兴趣特征、动态兴趣特征和局部兴趣匹配排名特征,预测用户浏览每个候选新闻的概率,基于预测概率向用户推荐候选新闻。在准确性和速度之间提供了改进的折衷,丰富了用户的兴趣表示,增强了预测用户浏览每个候选新闻的概率的鲁棒性和可解释性。
技术领域
本发明属于新闻的个性化推荐技术领域,尤其涉及一种基于多级匹配的兴趣激活新闻推荐方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
新闻推荐作为推荐系统研究领域的一个重要分支,旨在通过新闻内容和用户信息尽可能多的帮助用户找到与用户兴趣偏好相匹配的新闻。个性化的新闻推荐对帮助用户找到自己感兴趣的新闻、缓解信息过载至关重要。随着基于人工神经网络的深度学习取得了巨大的进步,人们开始尝试利用经典的神经网络架构处理新闻推荐问题。它们通常对每条新闻进行词嵌入获得新闻的表示,然后通过整合用户浏览过的历史新闻来学习每个用户的综合兴趣表示,最后,将该综合向量表示与候选新闻向量匹配来执行推荐。
虽然基于深度学习的方法在新闻推荐上取得了一定的成功,但是,也存在着一定的问题。由于新闻的重要语义特征隐含在不同粒度的文本片段中,然而现有的一些深度学习方法,将学习到的固定用户特征表示只有在最后一步才能与候选新闻匹配,缺乏文本对词语之间的交互,造成的信息损失难以衡量。此外,固定的向量也不能充分表达用户的不同兴趣。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种基于多级匹配的兴趣激活新闻推荐方法及系统,在考虑候选新闻的情况下,依据候选新闻的不同来推导用户兴趣的动态特征向量,进一步加强用户的兴趣表示,增强了预测用户浏览每个候选新闻的概率的鲁棒性和可解释性。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于多级匹配的兴趣激活新闻推荐方法,其包括:
获取候选新闻和用户历史点击新闻,分别进行新闻编码,得到候选新闻表示和用户历史点击新闻表示;
基于用户历史点击新闻表示,获得用户全局兴趣特征;
基于候选新闻表示和用户历史点击新闻表示,采用目标注意力机制来计算每个用户历史点击新闻和每个候选新闻之间的注意力得分,使用注意力得分对用户历史点击新闻进行加权计算,获得用户动态兴趣特征;
基于候选新闻表示和用户历史点击新闻表示,在多个不同的相似度水平上捕捉被点击新闻和候选新闻在语义上的相关性,获得不同层次的每个候选新闻与用户历史点击新闻的局部兴趣匹配排名特征;
联合用户全局兴趣特征、动态兴趣特征和局部兴趣匹配排名特征,预测用户浏览每个候选新闻的概率,基于预测概率向用户推荐候选新闻。
进一步的,所述新闻编码的具体步骤为:
获取新闻的标题;
使用新闻标题构建向量表示,得到新闻标题的单词向量序列;
将新闻标题单词向量序列输入卷积神经网络,得到上下文单词表示向量的序列;
将上下文单词表示向量的序列输入单词级注意力网络,得到新闻的最终表示。
进一步的,所述局部兴趣匹配排名特征的获取步骤为:
基于候选新闻表示和用户历史点击新闻表示,计算关联矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111533758.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:日志管理方法及服务器集群
- 下一篇:一种智能疾病诊断设备及方法