[发明专利]基于全视角特征的跨社交网络用户识别方法有效
申请号: | 201710674020.0 | 申请日: | 2017-08-09 |
公开(公告)号: | CN107480714B | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 申德荣;汪潜;聂铁铮;寇月;于戈 | 申请(专利权)人: | 东北大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 | 代理人: | 俞鲁江 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视角 特征 社交 网络 用户 识别 方法 | ||
本发明公开一种基于全视角特征的跨社交网络用户识别方法,首先,对多个社交网络进行社区划分,并初始化参考点。接着,迭代地进行以下三个步骤:(1)利用参考点计算未识别用户的全视角特征,以计算用户之间相似度;(2)采用改进的稳定婚姻匹配算法来完成用户识别工作;(3)对于新识别用户对,根据社区中心度等特征对参考点集合进行更新。不断重复以上3个步骤,直到参考点集合不再更新,得到匹配的锚链接用户集合。采用本发明的跨社交网络用户识别方法,一方面考虑了用户在社交网络上的全局位置,提高了用户识别方法的准确率和召回率;另外,通过迭代调整的识别策略,既解决了多个相似度相近的用户对的正确识别问题,也避免了冷启动的问题。
技术领域
本发明属于社交网络的数据挖掘和数据集成领域,主要涉及一种基于全视角特征的跨社交网络用户识别方法。
背景技术
随着互联网的发展,越来越多的人在网络上建立了各种虚拟的账户。和传统SMS(Short Message Service)等应用不同,社交网络作为WEB2.0时代的产物,侧重于社交属性,为人们提供了丰富的社交服务,比如利用社交网络分享动态、传递知识、发布话题等等。其中大多数人会通过多种社交网络和朋友进行交流沟通,但是用户的不同账户由于分布在不同社交网络上,彼此之间互不关联。如果能够把这些线上的关系网融合成一个单一的环境,可以有助于用户保持联系,同时也提供了一种在多网络上进行用户搜索的途径。另外,多社交网络的融合也将提升好友推荐、商业广告发布等的精准度。用户识别(匹配)作为多社交网络融合的一种方式,已成为当今热门的研究方向之一。
跨社交网络用户识别作为多社交网络融合的重要方面,通过分析社交网络上用户之间的好友关系及用户本身生成内容,将分布在不同社交网络上属于同一实体的用户识别出来,从而达到对多社交网络融合的目的。跨社交网络用户识别通常处理利用爬虫获取到的社交网络数据,这些数据主要由三个部分组成:一部分用来描述社交网络好友关系,一部分用于描述社交网络用户的属性信息(通常来源于用户在个人主页上填写的信息),最后一部分来源于用户在社交网络上发布的内容。通过分析和识别这些社交网络用户数据,从而将不同社交网路上的用户识别出来:一方面,通过多社交网络融合,丰富用户的概要信息,并解决冷启动的问题;另一方面,可以“间接”实现单点登录SSO(Single Sign On)的登录模式,提升用户服务体验。
社交网络用户主要包括三个步骤:用户特征提取、用户之间相似度计算和用户匹配过程。在用户特征提取阶段,目的在于将用户之间的好友关系和属性、内容等特征从社交网络数据中提取出来。通常通过设计高效、合理的机器学习模型来完成这一目标。其次,计算用户之间相似度,如果用户之间的相似度越大,则属于同一实体的可能性越大,通常利用提取的用户特征和相似度函数来计算用户相似度。最后,根据用户相似度来完成用户识别,这里通常采用特定的匹配策略。
现有的混合式的社交网络用户匹配研究主要是考虑对社交网络的信息特征处理上,存在一些不足之处:首先,是冷启动问题。传统的混合匹配模型只是把结构信息和属性信息简单的结合在一起,把共同的关系用户数目作为了亲密程度的定义,比如MNA算法中把候选匹配对中邻居已匹配的个数作为结构相似度的度量,所以在开始阶段,由于已匹配的信息较少或者不全面,就面临了冷启动的问题。如果盲目的采用启发式的算法来解决,会使初始的点的计算脱离于结构,给后续的计算带来一定的影响。其次,只考虑了局部的结构信息。现有的方法只考虑两者的邻居或者是两者相关联的地点等局部信息。然而,用户在社交网络的位置,并不仅仅是和周围的用户有关,从社交网络整体的角度来看,网络的结构一般是由大量的星网状核心子图构成。这是因为社交网络的关系可以大致分为强关系和弱关系,简单来说,强关系就是现实生活中的朋友、同事、师生、家人等直接关系,弱关系则主要指关系较浅但是社会关系广泛的一类关系,比如说兴趣关系,这是社交网络上广泛存在的一种关系。在社交网络中,用户往往因为一些兴趣或者工作关系被集中到一起,或者说,用户在社交网络中的位置往往取决他的兴趣、他的工作方向、个人生活经历等等。因此,需要从全局角度来考虑用户的概要信息。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710674020.0/2.html,转载请声明来源钻瓜专利网。