[发明专利]一种基于图神经网络会话序列推荐方法及系统有效
申请号: | 202010789843.X | 申请日: | 2020-08-07 |
公开(公告)号: | CN111859160B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 李冬芬;王惠明;刘明哲;钟豪;王林平;唐小川 | 申请(专利权)人: | 成都理工大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/951;G06F16/901;G06N3/0442;G06N3/08 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610059 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 会话 序列 推荐 方法 系统 | ||
本发明公开了一种基于图神经网络会话序列推荐方法及系统,方法包括:从第三方新闻库爬取新闻源数据,进行清洗和深度分析,输出结构化数据;从数据库和用户属性表中提取新闻标签和用户属性,并将其向量化,经过计算得出与该用户属性最相近的新闻推荐;为用户提供个性化的标签选项,并且实时监测用户行为并反馈数据回传至模型;获取用户行为数据,对获取数据进行分析和筛选,并将筛选后的数据构建为会话序列数据;利用用户会话序列数据来训练GNN模型,预测用户下一时刻行为,实现新闻推荐。本发明还提供一种基于图神经网络会话序列推荐系统。本方案采用基于内容的推荐策略,并将协同过滤算法作为补充,更敏捷地捕捉用户的兴趣点并实时进行新闻推荐。
技术领域
本发明涉及领域,尤其涉及一种基于图神经网络会话序列推荐方法及系统。
背景技术
21世纪是信息爆炸增长的时代,人们面对互联网上良莠不齐的信息往往束手无策,很难获取到符合自己兴趣和期望的内容。例如在新闻领域,每天有数以万计的新闻出现在我们面前,如何为用户提供及时、准确、符合用户期望的新闻内容成为当下的一个研究热题。个性化推荐算法是解决上述问题的一个利器。
传统的推荐算法在新闻推荐领域的应用主要有以下三个方法:1)基于协同过滤的推荐;2)基于相似内容的推荐;3)基于新闻热点的推荐。在构建召回模型的时候,通常假定用户属性和用户历史行为是被持续记录的,即模型是基于用户属性和历史行为进行构建的。然而在某些服务或应用场景下,用户身份或属性是未知的,且用户历史行为数据的获取也是困难。现有的推荐系统对用户特征表示不够准确,忽略了item中复杂的转换特性,因此不能实现实时捕捉用户的兴趣点并进行实时新闻推荐。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于图神经网络会话序列推荐方法及系统,采用基于内容的推荐策略,并将协同过滤算法作为补充,更敏捷地捕捉用户的兴趣点并实时进行新闻推荐。
本发明的目的是通过以下技术方案来实现的:
一种基于图神经网络会话序列推荐方法,方法包括以下步骤:
S1,新闻预处理,从第三方新闻库爬取新闻源数据,并进行新闻内容的清洗和深度分析,最终输出为经过预处理的结构化新闻数据;
S2,基于标签推荐,从数据库和用户属性表中提取新闻标签和用户属性,并将其向量化,经过余弦相似度的计算得出与该用户属性最相近的新闻推荐;
S3,用户体验反馈,为用户提供一系列个性化的标签选项,并且实时监测用户行为作为反馈数据回传至模型;
S4,会话序列分析,获取用户行为数据,同时对获取的数据进行分析和筛选,并将筛选后的行为数据构建为会话序列数据;
S5,会话训练推荐,利用用户会话序列数据来训练GNN模型,达到预测用户下一时刻行为的目标,从而实现新闻推荐。
具体的,所述步骤S1中新闻预处理过程具体包括以下子步骤:
S101,基于scrapy框架利用爬虫软件从新闻源数据库中并发爬取半结构化或纯文本的新闻源数据,并进行数据清洗和组织,生成结构化数据;
S102,采用TF-IDF算法进行关键字提取,从而为每篇新闻打上标签,并分析该新闻的热度情况,最终生成预处理后的新闻数据,存入数据库。
具体的,所述步骤S2中基于标签推荐具体过程包括以下子步骤:
S201,从数据库中获取新闻数据,并提取出每个新闻的标签,采用词袋模型生成对应新闻的标签向量;
S202,获取用户体验反馈部分在用户属性表中生成的用户属性,并生成对应用户的属性向量;
S203,基于相似度计算模型,经过余弦相似度的计算得出与该用户属性最相近的新闻作为推荐候选集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都理工大学,未经成都理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010789843.X/2.html,转载请声明来源钻瓜专利网。