[发明专利]一种基于内容的跨领域推荐方法在审

专利信息
申请号: 201910454275.5 申请日: 2019-05-29
公开(公告)号: CN110232153A 公开(公告)日: 2019-09-13
发明(设计)人: 佘焕波;田翔 申请(专利权)人: 华南理工大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06Q30/06;G06K9/62;G06N3/04;G06N3/08
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 梁莹;顾思妍
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 目标领域 用户行为 源领域 内容语义 文本信息 编码网络 兴趣向量 训练数据 用户兴趣 语义向量 词表 计算相似度 构建 向量 匹配
【说明书】:

发明提供一种基于内容的跨领域推荐方法,包括以下步骤:步骤S1:得到用户兴趣词表;步骤S2:采用源领域的用户行为序列中项目的文本信息作为源领域训练数据,采用目标领域中每个项目的文本信息作为目标领域训练数据;步骤S3:构建内容语义编码网络模型;步骤S4:利用步骤S3训练好的内容语义编码网络模型对源领域的用户行为和目标领域的项目进行内容语义编码,得到用户行为兴趣向量和项目语义向量;步骤S5:对每个用户,利用其兴趣向量与项目语义向量计算相似度,并得到k个最相似的项目作为推荐项目。本发明能够基于源领域用户行为序列中的项目的文本信息编码出用户兴趣向量,并与目标领域的项目进行匹配,进而实现跨领域的推荐。

技术领域

本发明涉及推荐技术领域,更具体地说,涉及一种基于内容的跨领域推荐方法。

背景技术

随着移动互联网技术的不断发展,网络中的信息量以指数规律迅速扩展和增加,网络上的信息过载和信息迷航问题日益严重。为了给用户提供满意的信息和服务,推荐系统应运而生,成为了众多研究学者关注的研究领域。推荐系统通过预测用户对信息资源的喜好程度来进行信息过滤。

目前常用的推荐方法是基于协同过滤的推荐算法,此类方法主要用于单领域推荐,需要大量的用户行为数据,经常面临数据稀疏以及冷启动问题。近年来,出现了一种新的研究趋势,即跨领域推荐,旨在缓解数据稀疏性和冷启动对推荐系统性能的影响。现实中,在不同推荐领域都会遇到这些问题。例如,某在线购物网站拥有不止一个商品领域,如书籍、美妆、电子产品、影片等,同一个用户的在不同领域的喜好或许是相似的。因此对于缺乏用户行为数据的目标领域,如何通过提取用户行为较为丰富的源领域的用户行为偏好信息,对目标领域的推荐进行补充,成为推荐算法的研究方向之一。

发明内容

本发明的目的在于克服现有技术中的缺点与不足,提供一种基于内容的跨领域推荐方法,该推荐方法可解决现有推荐方法面临的数据稀疏以及冷启动的问题,不仅可实现跨领域的推荐,而且提高目标领域的推荐性能。

为了达到上述目的,本发明通过下述技术方案予以实现:一种基于内容的跨领域推荐方法,其特征在于:包括以下步骤:

步骤S1:分别采集源领域的文本语料和目标领域的文本语料,并进行分词统计,得到用户兴趣词表;

步骤S2:采用源领域的用户行为序列中项目的文本信息作为源领域训练数据,采用目标领域中每个项目的文本信息作为目标领域训练数据;

步骤S3:构建内容语义编码网络模型,利用步骤S2构建的源领域训练数据和目标领域训练数据对内容语义编码网络模型进行分类训练;

步骤S4:利用步骤S3训练好的内容语义编码网络模型对源领域的用户行为和目标领域的项目进行内容语义编码,得到用户行为兴趣向量和项目语义向量;

步骤S5:对每个用户,利用其兴趣向量与项目语义向量计算相似度,并得到k个最相似的项目作为推荐项目。

在上述方案中,本发明针对现有的基于协同过滤的单领域推荐算法需要大量的用户行为数据,经常面临数据稀疏以及冷启动问题,提出了一种基于内容的跨领域推荐方法。该方法能够基于源领域用户行为序列中的项目的文本信息编码出用户兴趣向量,并与目标领域的项目进行匹配,进而实现跨领域的推荐。

在步骤S1中,所述分别采集源领域的文本语料和目标领域的文本语料,并进行分词统计,得到用户兴趣词表是指:对源领域和目标领域的所有文本语料进行采集并分词,采用词频排序方式取词频最高的N个词作为兴趣词表,然后对兴趣词表进行去除停用词处理,最终得到用户兴趣词表。

步骤S2包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910454275.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top