[发明专利]一种多平台虚拟身份账号的多维碰撞识别方法有效

专利信息
申请号: 201911271999.2 申请日: 2019-12-12
公开(公告)号: CN111160130B 公开(公告)日: 2022-04-01
发明(设计)人: 徐舒霖;胥小波;聂小明;王伟;康英来;范晓波;敖佳 申请(专利权)人: 中国电子科技网络信息安全有限公司
主分类号: G06V10/774 分类号: G06V10/774;G06V40/16;G06Q50/00;G06F40/284
代理公司: 成都九鼎天元知识产权代理有限公司 51214 代理人: 邓世燕
地址: 610207 四川省成都市*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 平台 虚拟 身份 账号 多维 碰撞 识别 方法
【权利要求书】:

1.一种多平台虚拟身份账号的多维碰撞识别方法,其特征在于:包括如下步骤:

步骤一、对不同虚拟身份账号的头像进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则进入步骤二;

步骤二、对不同虚拟身份账号的属性进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则进入步骤三;其中:对不同虚拟身份账号的属性进行相似度匹配的方法为:

第一步、将每一个用户的所有简介属性表示成一个属性向量P=f1,f2,...,fn,其中fi表示第i个属性域;

第二步、建立一个相似性向量V(P1,P2)=v1,v2,...,vn,其中vi=compi(fi,P1,fi,P2),0≤vi≤1,若|V|代表向量V的维数,则|V|=|P1|=|P2|;

第三步、定义权重向量W来控制每个属性域的影响力,并将相似性向量V和与它同维的权重向量W相乘获得两个属性向量P1和P2的相似性得分,然后判断相似性得分是否大于设定的阈值:若是,则匹配成功,若否,则属性匹配不成功;

其中,采用MN函数对用户名进行相似度计算,具体方法为:

(1)预处理阶段:删除用户名中的特殊符号及在指定“黑名单”中出现的单词;

(2)匹配阶段:

采用如下公式计算预处理后不同用户名之间的相似性:

其中,w1和w2是来自用户名1和用户名2的单词数组,|wi|表示wi的单词数,wi[k]表示矩阵数组wi的第k个单词;支持函数Part用来计算部分字符串匹配:

其中:s1、s2是待匹配的字符串,l(s)是字符串s的长度,LCS函数返回最长公共子串;

步骤三、对不同虚拟身份账号的推文进行相似度匹配:若匹配成功,则判断这些虚拟身份账号属于同一用户;若匹配不成功,则判断这些虚拟身份账号不属于同一个用户;其中:对不同虚拟身份账号的推文进行相似度匹配的方法为:从多个维度对虚拟身份账号的推文信息进行相似度建模,然后将相似度权重分配问题转换为排序学习问题,再将排序学习问题转换为分类问题,最后利用机器学习方式对各个相似度权重进行学习从而实现相似性检测;

其中,从多个维度对社虚拟身份账号的推文信息进行相似度建模的方法为:

第一步、推文合并:

将每个虚拟身份账号发布的所有推文进行合并,形成长文本语料集;

第二步、推文关键词相似度计算:

抽取出每个虚拟身份账号所有推文中的关键词,并将关键词转换为语义向量,然后以空间距离为度量来计算不同虚拟身份账号的关键词相似度;

第三步、推文主题相似度计算:

抽取出每个虚拟身份账号所有推文中的主题,并将主题转换为语义向量,然后以空间距离为度量来计算不同虚拟身份账号的主题相似度;

第四步、推文提及的命名实体相似度计算:

提取出每个虚拟身份账号所有推文中提及到的所有命名实体,以每个实体的逆文档频率作为每个实体的权重,然后用不同虚拟身份账号提及到的命名实体相似度来判定账号的相似度;

第五步、推文发布时间分布相似度计算:

提取出每个虚拟身份账号一天的推文发布时间分布,然后在此基础上使用KL距离来判定不同虚拟身份账号每日推文发布时间分布的差异程度;

第六步、推文时间线内容相似度计算:

对每个虚拟身份账号发布的推文时间线进行梳理,计算虚拟身份账号发布某条推文的时间点前后一天是否在另一个虚拟身份账号中也提到了相似主题的内容,以此来判定不同虚拟身份账号的相关程度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技网络信息安全有限公司,未经中国电子科技网络信息安全有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911271999.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top