[发明专利]一种兴趣标签推荐方法及系统在审
申请号: | 201210385630.6 | 申请日: | 2012-10-12 |
公开(公告)号: | CN103729360A | 公开(公告)日: | 2014-04-16 |
发明(设计)人: | 贺翔;王业;亓超 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 杨波 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 兴趣 标签 推荐 方法 系统 | ||
技术领域
本发明属于互联网技术领域,尤其涉及一种兴趣标签推荐方法及系统。
背景技术
随着互联网技术的不断发展,越来越多的用户通过互联网进行相关活动,例如浏览新闻、购物等。但是随着互联网信息的不断增多,用户需要关注的内容随着增多。为帮助用户关注其感兴趣的内容,很多互联网应用中增加了兴趣标签,根据用户的兴趣标签向用户推荐相应的内容。兴趣标签是用户用来描述自己兴趣的词语,例如用户可以用“篮球”、“NBA”、“林书豪”等词语作为兴趣标签,来描述自己的兴趣。现有兴趣标签的推荐方法主要有:随机推荐:给用户随机推荐几个兴趣标签;热点推荐:根据当前的热点事件,给用户推荐兴趣标签按类别推荐。但是上述的推荐方式存在以下缺点:随机推荐方式准确性不高,推荐效果差,可能会推荐很多用户不感兴趣的标签;热点推荐方式只能覆盖热门兴趣标签,不能根据用户的选择和喜好进行相关推荐。
发明内容
本发明提供了一种兴趣标签推荐方法及系统,旨在解决现有技术的兴趣标签的推荐方式准确性不高、不能推荐相关的兴趣标签问题。
本发明是这样实现的,一种兴趣标签推荐方法,包括:
统计存在的兴趣标签的特征向量;
根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度;
根据存在的兴趣标签与推荐的兴趣标签的相似度进行兴趣标签的推荐。
本发明实施例采取的另一技术方案为:一种兴趣标签兴趣标签推荐系统,包括:
特征向量统计模块:用于统计存在的兴趣标签的特征向量;
相似度计算模块:用于根据存在的兴趣标签的特征向量,计算存在的兴趣标签与推荐的兴趣标签的相似度;
兴趣标签推荐模块:用于跟据存在的兴趣标签与推荐的兴趣标签的相似度进行兴趣标签的推荐。
本发明实施例的技术方案具有如下优点或有益效果:本发明实施例的兴趣标签推荐方法及系统根据某个兴趣标签,计算该兴趣标签与其他标签的相似度,进行兴趣标签推荐,提高了推荐的相关性,减少了对用户的干扰;另外本发明实施例的兴趣标签推荐方法及系统进行兴趣标签推荐时还参考了标签间的共现关系,使推荐更加准确。
附图说明
附图1是本发明第一实施例的兴趣标签推荐方法的流程图;
附图2是本发明第二实施例的兴趣标签推荐方法的流程图;
附图3是本发明第一实施例的兴趣标签推荐系统的结构示意图;
附图4是本发明第二实施例的兴趣标签推荐系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,是本发明第一实施例的兴趣标签推荐方法的流程图。本发明第一实施例的兴趣标签推荐方法包括以下步骤:
步骤100:统计存在的兴趣标签的特征向量;
在步骤100中,兴趣标签为用户预先设定,或者根据用户的浏览历史或者操作等计算出来的标签。统计兴趣标签的特征向量具体包括:提取互联网相关文件中标题或正文包含该兴趣标签的所有文章;对包含该兴趣标签的所有文章切词、提取特征词,统计特征词的词频(Tf,term frequency);对特征词进行相关排序,取一定数量的词,作为兴趣标签的特征向量Vx。其中,对特征词根据Tf*Idf(inverse document frequency,文档频率倒数)排序,取前50个词,作为这个兴趣标签x的特征向量Vx。可以理解,取词的数量可以根据需求进行设定。
步骤110:根据存在的兴趣标签的特征向量,计算存在的兴趣标签x与推荐的兴趣标签y的相似度;
在步骤110中,存在的兴趣标签x与推荐的兴趣标签y的相似度定义为:R(x,y)=cos(Vx,Vy),其中,R(x,y)表示存在的兴趣标签x与推荐的兴趣标签y的相似度,cos表示余弦函数,Vx及Vy分别表示存在的兴趣标签x及推荐的兴趣标签y的特征向量。
步骤120:根据存在的兴趣标签x与推荐的兴趣标签y的相似度进行兴趣标签的推荐。
在步骤120中,可以设定相似度阈值,在存在的兴趣标签x与推荐的兴趣标签y的相似度大于设定的阈值时才进行推荐,另外,可以理解,相似度阈值可以根据需要进行设定和变更。
请参阅图2,是本发明第二实施例的兴趣标签推荐方法的流程图。本发明第二实施例的兴趣标签推荐方法包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210385630.6/2.html,转载请声明来源钻瓜专利网。