[发明专利]一种跨平台微博社区账户匹配方法有效

专利信息
申请号: 201410000302.9 申请日: 2014-01-02
公开(公告)号: CN104765729B 公开(公告)日: 2018-08-31
发明(设计)人: 李晓菲;梁循;周小平;施晓菁;申华;张海燕 申请(专利权)人: 中国人民大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100872 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 平台 社区 账户 匹配 方法
【权利要求书】:

1.一种跨平台微博社区账户匹配方法,其特征在于,该方法包括:

第一阶段:数据预处理,结构化微博社区数据并对已知匹配账户进行标记;

第二阶段:循环迭代匹配账户,通过已知的账户匹配对,利用关系矩阵寻找高关系融合度的疑似账户匹配对,再通过账户发布的微博内容的相似度在疑似账户匹配对集合中挑选出匹配账户,加入到账户匹配对集合中。

2.如权利要求1所述的方法,其特征在于,该方法第一阶段进一步包括:

对已知账户匹配对集合获取,选择已知的某个行业身份获认证的微博意见领袖账户或者准确了解的朋友圈账户构成初始的账户匹配对集合;对结构化微博社区数据,是将已知匹配账户进行跨平台标记,并将其和粉丝账户关系表示为粉丝的关注关系矩阵。

3.如权利要求1所述的方法,其特征在于,该方法第二阶段进一步包括:

对循环迭代匹配账户,是将每次挖掘到的账户匹配对加入到账户匹配对集合中,用循环迭代的思想,再次根据新得到的账户匹配对的粉丝关系得到更多的网络账户节点后,进行下一循环的账户匹配对的挖掘。

4.如权利要求1所述的方法,其特征在于,该方法第二阶段进一步包括:

对疑似账户匹配对的获得,是根据已结构化的关注关系矩阵,利用公式RS=Rtencent×Rsina得到未匹配账户之间的关系强度,Rtencent和Rsina分别为腾讯微博和新浪微博中的账户匹配对集合中的账户同未匹配的账户之间的关注关系矩阵;再根据预设的关系强度阈值L,选择可以继续进行匹配的账户作为疑似账户匹配对集合中的元素。

5.如权利要求1所述的方法,其特征在于,该方法第二阶段进一步包括:

对账户匹配对的获得,将疑似账户匹配对集合中各元素的初始标签集合在一起形成“分量池”,进行标签去重后得到新的含N个标签有序序列,再将元素维数改为N维,按原有的TF-IDF方法赋值,最后进行两两的余弦相似度检验,将余弦值大于预设阈值α的两个账户合并成一个节点,加入到账户匹配对集合中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410000302.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top