[发明专利]一种跨平台微博社区账户匹配方法有效
申请号: | 201410000302.9 | 申请日: | 2014-01-02 |
公开(公告)号: | CN104765729B | 公开(公告)日: | 2018-08-31 |
发明(设计)人: | 李晓菲;梁循;周小平;施晓菁;申华;张海燕 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 平台 社区 账户 匹配 方法 | ||
1.一种跨平台微博社区账户匹配方法,其特征在于,该方法包括:
第一阶段:数据预处理,结构化微博社区数据并对已知匹配账户进行标记;
第二阶段:循环迭代匹配账户,通过已知的账户匹配对,利用关系矩阵寻找高关系融合度的疑似账户匹配对,再通过账户发布的微博内容的相似度在疑似账户匹配对集合中挑选出匹配账户,加入到账户匹配对集合中。
2.如权利要求1所述的方法,其特征在于,该方法第一阶段进一步包括:
对已知账户匹配对集合获取,选择已知的某个行业身份获认证的微博意见领袖账户或者准确了解的朋友圈账户构成初始的账户匹配对集合;对结构化微博社区数据,是将已知匹配账户进行跨平台标记,并将其和粉丝账户关系表示为粉丝的关注关系矩阵。
3.如权利要求1所述的方法,其特征在于,该方法第二阶段进一步包括:
对循环迭代匹配账户,是将每次挖掘到的账户匹配对加入到账户匹配对集合中,用循环迭代的思想,再次根据新得到的账户匹配对的粉丝关系得到更多的网络账户节点后,进行下一循环的账户匹配对的挖掘。
4.如权利要求1所述的方法,其特征在于,该方法第二阶段进一步包括:
对疑似账户匹配对的获得,是根据已结构化的关注关系矩阵,利用公式RS=Rtencent×Rsina得到未匹配账户之间的关系强度,Rtencent和Rsina分别为腾讯微博和新浪微博中的账户匹配对集合中的账户同未匹配的账户之间的关注关系矩阵;再根据预设的关系强度阈值L,选择可以继续进行匹配的账户作为疑似账户匹配对集合中的元素。
5.如权利要求1所述的方法,其特征在于,该方法第二阶段进一步包括:
对账户匹配对的获得,将疑似账户匹配对集合中各元素的初始标签集合在一起形成“分量池”,进行标签去重后得到新的含N个标签有序序列,再将元素维数改为N维,按原有的TF-IDF方法赋值,最后进行两两的余弦相似度检验,将余弦值大于预设阈值α的两个账户合并成一个节点,加入到账户匹配对集合中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410000302.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种社交网络事件分析的方法和装置
- 下一篇:参数配置方法及装置