[发明专利]一种融合文本相似度和协同过滤的标签推荐方法和系统在审

专利信息
申请号: 202111059171.8 申请日: 2021-09-10
公开(公告)号: CN113722443A 公开(公告)日: 2021-11-30
发明(设计)人: 张灿;房鹏展 申请(专利权)人: 焦点科技股份有限公司
主分类号: G06F16/33 分类号: G06F16/33;G06F16/35;G06F40/211;G06F40/216;G06F40/30;G06K9/62
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 陈建和
地址: 210032 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 融合 文本 相似 协同 过滤 标签 推荐 方法 系统
【说明书】:

发明公开了一种融合文本相似度和协同过滤的标签推荐方法,其特征在于,包括步骤一:生成标签知识库;步骤二:物品标签映射得到物品标签相似度矩阵;步骤三:计算用户标签相似度矩阵;步骤四:计算物品协同相似矩阵和用户协同相似矩阵;步骤五:计算用户对物品的兴趣预测评分。标签推荐系统能直观捕捉用户对物品标签属性的偏好,加强了推荐系统的可解释性,与协同过滤结合补充了推荐的发散性、多样性和合理性,能达到更准确地为用户推荐其感兴趣的物品,提高平台的用户粘性的效果。

技术领域

本发明涉及电子商务和信息技术领域,特别是涉及一种融合文本相似度和协同过滤的标签推荐方法和系统。

背景技术

推荐系统能够帮人们在面临海量信息时快速找到需要的物品。目前的推荐系统常用技术有基于内容的推荐、基于协同过滤的推荐、深度学习推荐等。基于内容的推荐算法中,标签推荐算法是一种能对用户兴趣进行建模的实用性算法,用户通过打标签标记自己喜好的物品类型,系统推荐与标签相符的物品给用户。其缺陷在于获取标签的过程通常是显性的,一般由用户主动标记,因而标签数量较少,不能较全面覆盖用户偏好,且难捕捉用户通过行为表现出的隐式偏好。另一方面,标签的文字表述样式繁杂,不易管理。推荐系统常采用协同过滤算法根据用户历史行为计算物品相似度矩阵、用户相似度矩阵进行个性化推荐,这种算法能根据用户隐式行为偏好进行推荐,但缺少建模用户对物品内容属性偏好的直接考量。而深度学习推荐算法能通过模型学习用户和物品的代理向量,通过向量运算实现高效的大规模物品推荐,但其可解释性不强,且用户与物品交互矩阵非常稀疏,很难解决冷启动问题。

因此,需要一种可解释性强,能提供直观的解释的完整、实用性强且高性能的标签推荐方法和系统

发明内容

本发明所要解决的技术问题是克服现有技术的不足,提供一种融合文本相似度和协同过滤的标签推荐方法和系统。

为解决上述技术问题,本发明提供一种融合文本相似度和协同过滤的标签推荐方法,其特征在于,包括如下步骤:

步骤一:生成标签知识库;对数据库中全部物品的文本内容进行新词发现,获取指定数量的关键词,所述文本内容包括标题、详情描述,所述关键词是描述物品关键属性的业务术语,对于每个所述的关键词,筛选包含该关键词的物品,对筛选后的物品的文本内容进行文本聚类,通过文本聚类发掘包含该关键词的相似标签词,所述相似标签词组成标签知识库,其中包含若干类知识,每条知识的形式为[标准标签,相似标签1,…,相似标签k],其中,所述标准标签为所有相似标签中共现频率最高的词语,所述相似标签为该类知识中除标准标签以外的其他相似标签词;

步骤二:物品标签映射得到物品标签相似度矩阵;具体为:基于标签知识库训练深度学习的句向量模型,将文本内容中每一个句子都输入句向量模型得到内容向量,计算内容向量与标签知识库中每条标签的向量的余弦相似度,选择余弦相似度最高的标签所对应的标准标签作为物品的标签;每个物品被映射到至少一个标签;基于tf-idf算法计算物品与全量标准标签的tf-idf权值,得到物品标签相似度,构成物品标签相似度矩阵,所述物品标签相似度矩阵是一个Nprods行T列的矩阵,所述Nprods是指所有物品的数量,T等于标签知识库中所有标准标签的数量;

步骤三:计算用户标签相似度矩阵;基于数据库中用户历史行为记录构建用户行为偏好矩阵,构建用户标签相似度矩阵为行为评分与物品标签相似度矩阵的乘积,所述用户标签相似度矩阵中的第i个值为用户与单个标准标签i的相似度。

步骤四:计算物品协同相似矩阵和用户协同相似矩阵;所述物品协同相似矩阵的计算方法为:对所有物品,计算两两之间的第一相似度和第二相似度的加权平均值;所述用户协同相似矩阵的计算方法为:计算两两用户标签相似度矩阵向量的余弦相似度;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111059171.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top