[发明专利]一种针对用户兴趣的关注关系提取及标注方法有效
申请号: | 201610040066.2 | 申请日: | 2016-01-20 |
公开(公告)号: | CN105718573B | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 刘梦娟;王巍;郭威;马小栓;罗绪成 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 用户 兴趣 关注 关系 提取 标注 方法 | ||
本发明提供一种针对用户兴趣的关注关系提取及标注方法,目的是为存在关注功能的网络平台提取出能够反映用户共同兴趣的关注关系,并对该条关注关系所代表的兴趣特征进行关键词标注。方法包括:首先建立全网络平台的关注关系图;其次计算任意关注者和被关注者之间的相关性系数;然后依据相关性系数提取出能够反映用户共同兴趣的关注关系;最后对提取的关注关系进行关键词标注。
技术领域
本发明属于互联网技术领域,特别涉及一种针对用户兴趣的关注关系提取及标注方法。
背景技术
随着越来越多的网络平台提供关注功能,网站用户之间形成一种关注网络。例如,视频分享网站的用户可以关注自己感兴趣的用户;电子商务网站的用户可以关注自己感兴趣的达人买家;微博平台的用户可以关注自己的好友,或者感兴趣的其他用户。通过关注关系,关注用户可以获得被关注者收看或者上传的视频信息,购买的商品记录,以及发表的微博内容等。这种关注关系被认为是关注者和被关注者可能具有共同兴趣的一种隐含表达。因此许多网站的推荐系统,开始利用用户之间的关注关系来提高推荐性能。然而,通过分析实际网络平台的用户行为记录,发现并非所有存在关注关系的用户之间都具有共同兴趣,这是因为网络平台中用户间建立关注关系的原因非常多,有可能是现实中的好友,有可能是有共同兴趣的陌生人,有可能只是随意添加的关注关系,有可能关注者曾经对被关注者感兴趣,但是随着时间推移,关注者或者被关注者的兴趣发生了变化,导致关注者对被关注者的行为不再感兴趣。因此,如何从全部关注关系中提取出能反映用户真实兴趣的关注关系是利用关注关系进行推荐的关键。
另一方面,网络平台上用户的兴趣通常具有多样性,例如一个视频分享站点的用户,可能喜欢收看爱情片、悬疑片、古装片等多种类型的视频,其关注者可能只在爱情片方面与其具有共同兴趣,因此如果将被关注者观看的所有类型的视频信息都推荐给关注者,那么推荐的绝大多数视频可能都是关注者不感兴趣的。因此,有必要对关注关系所代表的兴趣类型通过关键词的方式进行标注。综上,本发明提出一种针对用户兴趣的关注关系提取及标注方法,用以表示关注者对被关注者的真实兴趣及兴趣类型。本发明提出的技术可广泛应用于各种网络平台的推荐系统中。
发明内容
本发明的目的是为了在网络平台的所有关注关系中,提取出能够反映用户真实兴趣的关注关系,并对关注关系所代表的兴趣用关键词及权重进行标注。为实现上述发明目的,本发明提供一种针对用户兴趣的关注关系的提取和标注方法,其特征在于,包括以下步骤:
步骤1、根据用户的关注关系,构建初始关注图G(U,E),图中的节点是存在关注关系的网络平台用户,假设用户x关注了用户y,则建立一条从用户节点y指向用户节点x的边,边的方向表明用户x对用户y的行为内容感兴趣,而不能表明用户y对用户x的行为感兴趣,因此初始关注图是一个包含网络平台全部关注关系的有向无权图;
步骤2、通过分析用户历史行为数据,计算初始关注图中关注用户与被关注用户的兴趣相似性,相似性度量可使用但不限于皮尔逊相关系数或者余弦相似度等方法,皮尔逊相关系数是一个统计学指标,可用于度量两个用户之间的相关性,计算公式如公式(1)所示:
其中,ITEM={I1,I2,I3,...,In}表示网络平台上所有n个物品的集合,xi表示用户x对物品Ii的感兴趣程度,可以使用但不限于如下指标来计算:如果使用评分行为来计算,xi就是用户x对物品Ii的评分值,如果未评分则xi=0;如果使用对物品的操作行为来计算,xi就表示用户x是否对物品Ii执行操作行为,执行xi=1,否则xi=0;表示用户x,y对所有物品的评分或者操作行为的平均值,计算公式如公式(2)所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610040066.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分词的方法及装置
- 下一篇:基于map对象开发的用户选择操作的记录方法