[发明专利]基于相似子图匹配的在线马甲检测方法在审
申请号: | 201910548779.3 | 申请日: | 2019-06-24 |
公开(公告)号: | CN110458182A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 周薇;王景丽;李嘉诚;韩冀中;虎嵩林 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00;G06F16/9536 |
代理公司: | 11200 北京君尚知识产权代理有限公司 | 代理人: | 陈艳<国际申请>=<国际公布>=<进入国 |
地址: | 100093*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络图 检测 相似度 匹配 交互网络 社交活动 兴趣网络 构建 判定 特征矩阵 训练分类 训练数据 算法 配对 | ||
1.一种基于相似子图匹配的在线马甲检测方法,包括以下步骤:
利用训练数据训练分类算法,建立检测模型;
构建所有被封禁账号的交互网络图和兴趣网络图;
构建待检测账号的交互网络图和兴趣网络图;
将待检测账号与所有被封禁账号分别进行配对,组成账号对;
根据相似子图匹配方法,计算每个账号对的交互网络相似度和兴趣网络相似度;
将交互网络相似度和兴趣网络相似度组成特征矩阵,输入到一检测模型中,由该检测模型判断待检测账号和封禁账号之间是否匹配,如果匹配,则判定该待检测账号为马甲账号,否则判定为正常账号。
2.如权利要求1所述的方法,其特征在于,交互网络图为根据账号之间的交互关系建立的带标签的有向加权图Gu=(V,E,W),其中V表示交互网络中的一个账号节点集合,E表示账号节点与账号节点之间的交互关系即边的集合,W表示边的权重集合。
3.如权利要求1所述的方法,其特征在于,交互网络相似度的计算公式如下:
其中,u,v分别表示两个账号作为各自交互网络图的中心节点,H(u,v)表示两个账号之间的交互网络相似度,X表示这两个账号的交互网络中相同节点的集合,Φ(*)表示两个节点之间的亲密程度,通过两个节点之间的路径和权重计算得到,Vu和Vv分别表示两个中心节点的交互网络图中的所有节点集合。
4.如权利要求3所述的方法,其特征在于,Φ(*)的计算公式如下:
其中,u,v分别表示两个账号作为各自交互网络图的中心节点,W表示边的权重集合,P表示u,v两节点之间的最短路径。
5.如权利要求4所述的方法,其特征在于,权重集合W的计算公式为:
其中,ui,uj表示节点集合,A表示两个社交网络账号ui和社交网络账号uj的交互集合,Ai表示其中某个交互关系,两个账户之间的交互类型由Type(·)函数获得。
6.如权利要求1所述的方法,其特征在于,兴趣网络图为一个带标签并且有向的中心节点的图G’u=(V’,E’,L),其中,V’是与中心节点u有关系的兴趣节点,E’是边的集合,L是兴趣节点的兴趣标签。
7.如权利要求1所述的方法,其特征在于,兴趣网络相似度的计算公式如下:
其中,u,v分别表示两个账号作为各自交互网络图的中心节点,I(u,v)表示两个账号之间的兴趣网络相似度,Y表示两个账号的兴趣网络中相同兴趣标签的集合,Ψ(*)表示每个相同变迁的权重相似度。
8.如权利要求1所述的方法,其特征在于,分类算法包括逻辑回归算法、支持向量机算法、随机森林算法、自适应增强算法。
9.一种基于相似子图匹配的在线马甲检测系统,包括:
图构建模块,用于为所有的封禁账号和待检测账号构建交互网络图和兴趣网络图;
训练模块,用于利用训练数据训训练分类算法,构建检测模型;
账号对匹配模块,用于将待检测账号与每个被封禁账号组成账号对进行匹配;
相似子图匹配模块,用于对每个账号对之间的交互网络图和兴趣网络图进行相似子图匹配,计算交互网络相似度和兴趣网络相似度;
分类模块,用于通过检测模型判断待检测账号和封禁账号之间是否匹配,若匹配则判定马甲账号,否则判定为正常账号。
10.如权利要求9所述的系统,其特征在于,检测模型通过分类算法识别马甲账号与正常账号,分类算法包括逻辑回归算法、支持向量机算法、随机森林算法、自适应增强算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910548779.3/1.html,转载请声明来源钻瓜专利网。