[发明专利]一种针对用户兴趣的关注关系提取及标注方法有效
申请号: | 201610040066.2 | 申请日: | 2016-01-20 |
公开(公告)号: | CN105718573B | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 刘梦娟;王巍;郭威;马小栓;罗绪成 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 用户 兴趣 关注 关系 提取 标注 方法 | ||
1.一种针对用户兴趣的关注关系提取及标注方法,其特征在于,包括以下步骤:
步骤1、根据用户的关注关系,构建初始关注图G(U,E),图中的节点是存在关注关系的网络平台用户,假设用户x关注了用户y,则建立一条从用户节点y指向用户节点x的边,边的方向表明用户x对用户y的行为内容感兴趣,而不能表明用户y对用户x的行为感兴趣,因此初始关注图是一个包含网络平台全部关注关系的有向无权图;
步骤2、通过分析用户历史行为数据,计算初始关注图中关注用户与被关注用户的兴趣相似性;
步骤3、根据关注用户与被关注用户的兴趣相似性度量指标,提取关注关系,方法如下:首先由网络平台预设衡量用户兴趣相似性的最低阈值,将用户间的兴趣相似性度量指标大于阈值的关注关系作为有效的关注关系进行提取,边的权重为两个用户的兴趣相似性度量指标;
步骤4:在提取关注关系的基础上,对每条关注关系所表示的兴趣特征进行关键词标注:首先对网络平台上的每个物品进行特征标注;然后,通过关注用户和被关注用户共同操作过的物品的特征关键词,对提取的关注关系进行标注;最后,将得到的标注关键词的权重进行归一化处理。
2.根据权利要求1所述的一种针对用户兴趣的关注关系提取及标注方法,其特征在于,所述的标注方法为:
4.1对网络平台上的每个物品进行特征标注,方法如下:首先判断物品是否存在由用户或者网络平台主动标注的关键词,如果存在主动标注的关键词,则将这些关键词加入到物品特征关键词列表中;其次,从物品相关的文本信息中提取代表物品特征的关键词及每个关键词的词频,并将其加入到物品特征关键词列表中;最后从物品特征关键词列表中选择K个关键词表征该物品的特征,选择方法如下:包括所有的M个主动标注关键词,以及词频最高的(K–M)个从物品相关文本信息中提取的关键词,按重要性由高到低排列如下:
KeyList={Key1,Key2,Key3,...,KeyM,KeyM+1,...,KeyP,...,KeyQ,...,KeyK}
重要性排列规则如下:
(1)对于主动标注的关键词,按照物品被主动标注的顺序依次排列;对于从物品相关文本信息中提取的关键词,按照关键词在文本信息中的词频由高到低依次排列;每个关键词的权重计算如下所示:
其中Keyk为第k个关键词,K为该物品提取关键词的总数;
(2)如果从物品相关文本信息中提取的关键词中存在词频相同的关键词,则所有词频相同的关键词随机排序,权重按照如下公式计算:
这里假设从KeyP到KeyQ的(Q–P+1)个关键词具有相同词频,则每个词频相同的关键词具有相同的权重;
(3)如果物品特征关键词列表KeyList中的关键词个数不足K个,则按照实际的关键词个数标记物品;
4.2通过关注用户和被关注用户共同操作过的物品的特征关键词,对提取的关注关系进行标注,标注方法如下:假设关注用户x和被关注用户y共同操作过的物品为D个ITEM(x∩y)={I1,I2,I3,...,ID},其中每个物品Ii的特征关键词列表为KeyListi;将D个物品的特征关键词求并集,得到(y→x)关注关系所对应的特征关键词列表KeyList(y→x);计算KeyList(y→x)中每个关键词对应的权重,按照如下公式计算:
其中,|KeyList(y→x)|表示关注关系(y→x)所对应的特征关键词列表中关键词的个数,wL(keyk)表示关注关系的特征关键词列表中第k个关键词的权重,w(keyk(m))表示关键词keyk在第m个物品的特征关键词列表中的权重;最后,将KeyList(y→x)中的关键词按权重由高到低排序,选择其中权重最大的N个关键词对关注关系(y→x)进行标注;
4.3将得到的N个关键词的权重进行归一化,使得各关键词的权重之和为1,针对关注关系(y→x),N个关键词的权重归一化计算,如下所示:
重复步骤4.2、4.3,可以得到每条有效关注关系的标注关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610040066.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:分词的方法及装置
- 下一篇:基于map对象开发的用户选择操作的记录方法