[发明专利]一种标签推荐方法及系统在审
申请号: | 201710544732.0 | 申请日: | 2017-07-06 |
公开(公告)号: | CN107341242A | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 李凤莲;张雪英;李彦民;焦江丽;田玉楚;王燕;黄丽霞 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京高沃律师事务所11569 | 代理人: | 王戈 |
地址: | 030000 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标签 推荐 方法 系统 | ||
技术领域
本发明涉及个性化推荐领域,特别是涉及一种标签推荐方法及系统。
背景技术
现如今,Web技术的发展突飞猛进,用户可以在多种多样的网络平台上对一个项目标注多个不同的标签,尤其是在各个平台的推荐系统应用方面,系统通过标签来探索每个用户的喜好特征,当用户对未标注过标签的项目标注标签时,可以更有效地向用户推荐合适的标签供用户标注,帮助用户快速找到自己满意的标签。项目是指用户标注标签的对象,例如电影、视频、文章等。以往的推荐算法大多针对的是基于二元关系的用户-项目的评分矩阵数据进行研究,随着标签数据的加入,由用户、项目和标签组成的三元关系数据处理成为了近年来推荐算法研究的重点。
由于推荐系统中用户、项目和标签数量的与日俱增,三者组成的权值数据规模呈指数速度增长,数据稀疏性逐渐变大,由此用于处理该数据的推荐算法的推荐准确性降低,成为推荐技术需解决的最主要的问题。
发明内容
本发明的目的是提供一种标签推荐方法及系统,以解决现有技术中推荐算法推荐准确性低的问题。
为实现上述目的,本发明提供了如下方案:
一种标签推荐方法,所述方法包括:
依次获取所有用户对所有项目标注的标签总集合,所述标签总集合包括所有的第一标签集合,所述第一标签集合为一个用户对一个项目标注的标签的集合,所述第一标签集合包括M个标签,M为大于0的整数;
利用Apriori算法寻找所述标签总集合中的最大频繁项集;
将所述最大频繁项集设定为新的标识;
将所述第一标签集合中所述最大频繁项集替换为所述新的标识,形成第二标签集合;
将用户、项目、第二标签集合相互对应,生成用户-项目-标签的三维张量数据,并将三者的关联权重设为1;
利用HOSVD算法对所述三维张量数据进行分解,得到每个用户对每个项目标注的标签的权重值;
根据所述标签权重值,向第一用户推荐标签,供所述第一用户对项目标注标签使用,所述第一用户为第一次对所述第一项目标注标签的用户,所述第一项目为所有项目中的任意一个项目。
可选的,所述利用Apriori算法寻找所述标签总集合中的最大频繁项集之前,还包括:
将标签数据转换成适用于Apriori算法计算的格式。
可选的,所述利用Apriori算法寻找所述标签总集合中的最大频繁项集,具体包括:
设定最小支持度,所述最小支持度为标签出现的频率的设定阈值;
将所有第一标签集合中出现频率大于所述最小支持度的标签生成频繁一项集,所述频繁一项集中每个元素为一个标签;
将两个不同的频繁一项集合并为一个二项集,遍历所有的频繁一项集,生成所有的二项集,所述二项集中包括两个标签,将所有二项集中两个标签同时出现的频率大于所述最小支持度的二项集生成频繁二项集;所述频繁二项集中每个元素为二项集中的两个标签;
将频繁k项集中的任意两个元素连接,形成k+1项集,所述频繁k项集中每个元素包括k个不同的标签,所述k+1项集中包括k+1个不同的标签;遍历所述频繁k项集中的所有元素,生成所有的k+1项集;其中k为大于1的整数;
判断是否所有的k+1项集中的k+1个标签同时出现的频率均小于所述最小支持度,得到第一判断结果;
当所述第一判断结果表示所有的k+1项集中的k+1个标签同时出现的频率均小于所述最小支持度时,确定所述频繁k项集为最大频繁项集;
当所述第一判断结果表示所有的k+1项集出现的频率不全小于所述最小支持度时,将所有k+1项集中的k+1个标签同时出现频率大于所述最小支持度的k+1项集生成频繁k+1项集,所述频繁k+1项集中每个元素包括k+1项集中的k+1个不同的标签。
可选的,所述利用HOSVD算法对所述三维张量数据进行分解,具体包括:
将所述三维张量数据利用公式沿着三个模方向进行分解,其中所述三维张量表示为A1为所述三维张量A的1-模的矩阵展开形式;A2为所述三维张量A的2-模的矩阵展开形式;A3为所述三维张量A的3-模的矩阵展开形式;
利用奇异值分解算法对所述A1、A2、A3进行分解,得到
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710544732.0/2.html,转载请声明来源钻瓜专利网。