[发明专利]一种跨社交网络身份匹配方法在审
申请号: | 202210257148.8 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114663245A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 马廷淮;黄锐 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F16/9536;G06K9/62;H04L51/52;H04L41/14;H04L41/12 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 224002 江苏省盐城*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 网络 身份 匹配 方法 | ||
本发明公开了一种跨社交网络身份匹配方法,包括采集不同社交网络的账户数据,进行数据清洗;基于双向模型搭建跨社交网络身份匹配框架;将数据清洗后的账户数据通过跨社交网络身份匹配框架划分为训练集和测试集;加载训练集对跨社交网络身份匹配框架中的参数进行训练得到网络模型;采用测试集对网络模型进行测试,得到最优网络模型,将待匹配账户数据通过最优网络模型进行身份匹配,提高精准匹配效率。
技术领域
本发明涉及一种跨社交网络身份匹配方法,属于社交网络分析技术领域。
背景技术
目前,社交网络广泛使用以及社交账号实名制度的不完全覆盖给不法分子提供了可乘之机。为了确定某个已经构成犯罪的用户在现实中的真实身份,跨社交网络身份匹配技术发展为匹配不同社交网络之间属于同一个真实用户的不同账号来挖掘该用户更多信息,从而确定犯罪者身份的有效方法。
现有的与之相关的技术可以分为两类:身份匹配的框架及身份关联算法。申请号为CN202010376438.5,专利名称为“一种身份匹配方法和装置”的中国专利,公开了获取与目标人物相关的多个联系方式的社交网络数据,并进行训练,获取每个联系方式的向量来进行身份匹配。但该方法只是提出了一种抽象的框架,并没有为具体的账户特征信息进行处理。由于账户的特征信息类型繁杂,需要针对每一种不同的数据提出模型进行处理。申请号为CN202110607064.8,专利名称为“融合多模态信息及权重张量的用户身份关联方法”以及申请号为CN202110148895.3专利名称为“融合用户特征和嵌入学习的跨社交网络用户身份关联方法”,都采用了多个用户特征对不同社交网络中的账户进行身份关联,但是,使用的特征越多,存在匹配速度变慢的问题。
现有技术的匹配过程中,庞大的用户数量和复杂的网络结构增加了匹配消耗的时间并且提高精准匹配的难度。因此亟需设计一种能够降低网络身份匹配消耗时间,且能够精准匹配的方法,为打击网络违法犯罪活动提供便利。
发明内容
本发明的目的在于克服现有技术中的不足,提供一种跨社交网络身份匹配方法,快速进行网络身份匹配。
为达到上述目的,本发明所采用的技术方案是:
提供一种跨社交网络身份匹配方法,包括如下步骤:
采集不同社交网络的账户数据,进行数据清洗;
基于双向模型搭建跨社交网络身份匹配框架;
将数据清洗后的账户数据通过跨社交网络身份匹配框架划分为训练集和测试集;
加载训练集对跨社交网络身份匹配框架中的参数进行训练得到网络模型;
采用测试集对网络模型进行测试,得到最优网络模型;
将待匹配账户数据通过最优网络模型进行身份匹配。
进一步的,所述跨社交网络身份匹配框架包括:预处理模块,用户空间向量生成模块及社区分类模块;
所述预处理模块根据数据清洗后的账户数据构建社交网络拓扑图,得到账户节点;
所述用户空间向量生成模块生成账户节点中的社交结构信息及互动值向量;
所述社区分类模块采用社区中心感知策略,使用社交网络拓扑图及账户节点的空间向量,将账户节点进行分类。
进一步的,所述社交结构信息是社交网络拓扑图使用已知标签账户补充账户数据之间的结构向量;所述互动值向量是社交网络拓扑图根据账户数据之间的亲密程度赋予。
进一步的,所述用户空间向量生成模块处理过程如下:
使用随机游走策略对账户节点的社交结构信息进行采样;
使用Skip-gram处理采样后社交结构信息中的节点序列,生成嵌入向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210257148.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种调节吸力的吸盘
- 下一篇:老年病人护理用翻身装置