[发明专利]一种基于结构和属性相似度的用户实体解析方法有效
申请号: | 201710470266.6 | 申请日: | 2017-06-20 |
公开(公告)号: | CN107330020B | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 徐杰;刘震;卢思变;陈文龙 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q50/00 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于结构和属性相似度的用户实体解析方法,通过对社交网络的分析和建模,结合了社交网络中的好友关系和用户个人资料,即结构信息和属性信息,实现了跨社交平台的用户实体解析的目的。在实体解析的过程中,引入了动态阈值的概念,在迭代的不同时期使用不同的阈值来适应当前情况下的数据特点,调控属性和结构所占比重,以获得更为准确地结果。 | ||
搜索关键词: | 一种 基于 结构 属性 相似 用户 实体 解析 方法 | ||
【主权项】:
一种基于结构属性相似度的用户实体解析方法,其特征在于,包括以下步骤:(1)、建立属性相似度矩阵和邻接矩阵根据社交平台A和社交平台B上的所有账户两两之间的属性相似度,构建属性相似度矩阵Sm×n,其中,m和n分别为平台A和B中的账户总数,Sm×n中的元素表示对应两个账户间的属性相似度;分别根据社交平台A和社交平台B上的所有账户两两之间是否为好友关系,建立邻接矩阵和其中,邻接矩阵的每一行、每一列都代表该平台内的一个账户,邻接矩阵中元素表示该平台内对应两个账户之间是否为好友关系,如果为好友关系,则该元素值为1,如果不为好友关系则该元素值为0;(2)、建立关联矩阵根据邻接矩阵和先验匹配对,建立社交平台A和社交平台B中未识别账户与已识别账户之间的关联矩阵其中,τ表示先验匹配对的个数,关联矩阵的每一行代表未识别账户,每一列都代表已识别账户,关联矩阵中元素表示未识别账户与已识别账户之间是否为好友关系,如果为好友关系,则该元素值为1,如果不为好友关系则该元素值为0;(3)、建立共同好友矩阵根据关联矩阵和先验匹配对,建立社交平台A和社交平台B中未识别账户的共同好友矩阵;F(m-τ)×(n-τ)=RA(m-τ)×τ×(RB(n-τ)×τ)T]]>其中,()T表示转置,共同好友矩阵的每一行代表社交平台A中的一个未识别账户每一列代表社交平台B中的一个未识别账户共同好友矩阵中元素fij表示和vB在先验匹配对中的共同好友个数;(4)、从共同好友矩阵中选出最大非零元素对应的两个未识别账户组成的账户对,并存放在账户对集合Q中,Q={(i,j)|fij=max(F(m‑τ)×(n‑τ))};(5)、在属性相似度矩阵Sm×n中,取出账户对集合Q中所有账户对之间的属性相似度,并存放在相似度集合S*中,S*={sij|sij∈Sm×n,(i,j)∈Q};(6)、根据预设的初始阈值,将相似度集合S*中低于初始阈值的元素删除,同时将账户对集合Q中的对应元素删除;(7)、判断账户对集合Q是否为空,如果为空,则将共同好友矩阵中中的最大非零元素置0,再返回步骤(4);如果不为空,则进入步骤(8);(8)、取出相似度集合S*中的最大元素max(S*),并在账户对集合Q中选出与max(S*)对应的账户对(i,j),则(i,j)对应的一组账户标记为匹配成功,并加入到本轮迭代的结果集M中;(9)、账户对集合Q中删除加入到结果集M中的账户对(i,j),以及与(i,j)有共同账户的账户对,同时删除相似度集合S*中对应元素;(10)、判断账户对集合Q中是否还存在元素,如果存在,则返回步骤(8);如果不存在,则输出结果集M;(11)、将结果集M中对应的账户对加入到先验匹配对中,再返回步骤(2),进行本轮的下一次迭代,当结果集M中没有新的匹配对输出时本轮迭代结束;(12)、修改初始阈值的大小,再返回步骤(2),进行下一轮的迭代,当通过修改初始阈值后,结果集M中任然没有新的匹配对输出时迭代结束,完成用户实体解析。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710470266.6/,转载请声明来源钻瓜专利网。
- 上一篇:二氧化碳四级转子式压缩膨胀机
- 下一篇:一种旋片电子抽气泵