[发明专利]一种标签推荐方法及系统在审
申请号: | 201710544732.0 | 申请日: | 2017-07-06 |
公开(公告)号: | CN107341242A | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 李凤莲;张雪英;李彦民;焦江丽;田玉楚;王燕;黄丽霞 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京高沃律师事务所11569 | 代理人: | 王戈 |
地址: | 030000 *** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标签 推荐 方法 系统 | ||
1.一种标签推荐方法,其特征在于,所述方法包括:
依次获取所有用户对所有项目标注的标签总集合,所述标签总集合包括所有的第一标签集合,所述第一标签集合为一个用户对一个项目标注的标签的集合,所述第一标签集合包括M个标签,M为大于0的整数;
利用Apriori算法寻找所述标签总集合中的最大频繁项集;
将所述最大频繁项集设定为新的标识;
将所述第一标签集合中所述最大频繁项集替换为所述新的标识,形成第二标签集合;
将用户、项目、第二标签集合相互对应,生成用户-项目-标签的三维张量数据,并将三者的关联权重设为1;
利用HOSVD算法对所述三维张量数据进行分解,得到每个用户对每个项目标注的标签的权重值;
根据所述标签权重值,向第一用户推荐标签,供所述第一用户对第一项目标注标签使用,所述第一用户为第一次对所述第一项目标注标签的用户,所述第一项目为所有项目中的任意一个项目。
2.根据权利要求1所述的方法,其特征在于,所述利用Apriori算法寻找所述标签总集合中的最大频繁项集之前,还包括:
将标签数据转换成适用于Apriori算法计算的格式。
3.根据权利要求1所述的方法,其特征在于,所述利用Apriori算法寻找所述标签总集合中的最大频繁项集,具体包括:
设定最小支持度,所述最小支持度为标签出现的频率的设定阈值;
将所有第一标签集合中出现频率大于所述最小支持度的标签生成频繁一项集,所述频繁一项集中每个元素为一个标签;
将两个不同的频繁一项集合并为一个二项集,遍历所有的频繁一项集,生成所有的二项集,所述二项集中包括两个标签,将所有二项集中两个标签同时出现的频率大于所述最小支持度的二项集生成频繁二项集;所述频繁二项集中每个元素为二项集中的两个标签;
将频繁k项集中的任意两个元素连接,形成k+1项集,所述频繁k项集中每个元素包括k个不同的标签,所述k+1项集中包括k+1个不同的标签;遍历所述频繁k项集中的所有元素,生成所有的k+1项集;其中k为大于1的整数;
判断是否所有的k+1项集中的k+1个标签同时出现的频率均小于所述最小支持度,得到第一判断结果;
当所述第一判断结果表示所有的k+1项集中的k+1个标签同时出现的频率均小于所述最小支持度时,确定所述频繁k项集为最大频繁项集;
当所述第一判断结果表示所有的k+1项集出现的频率不全小于所述最小支持度时,将所有k+1项集中的k+1个标签同时出现频率大于所述最小支持度的k+1项集生成频繁k+1项集,所述频繁k+1项集中每个元素包括k+1项集中的k+1个不同的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710544732.0/1.html,转载请声明来源钻瓜专利网。