[发明专利]一种基于图嵌入的诈骗号码识别方法有效
申请号: | 201910410802.2 | 申请日: | 2019-05-16 |
公开(公告)号: | CN110177179B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 万辛;李鹏;安茂波;林格平;刘发强;孙旭东;刘铭;李正正 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;杭州东信北邮信息技术有限公司 |
主分类号: | H04W12/12 | 分类号: | H04W12/12;H04M3/22;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 嵌入 诈骗 号码 识别 方法 | ||
1.一种基于图嵌入的诈骗号码识别方法,其特征在于,包括有:
步骤一、基于用户在一段时间内的通话信令,计算每个用户的多个通话特征指标,并由每个用户的所有通话特征指标构成每个用户的通话特征指标向量,同时,提取和用户在一段时间内存在通话关系的联系人作为用户的直接邻居,由每个用户的所有直接邻居构成每个用户的直接邻居组;
步骤二、构建、并训练识别诈骗号码的图嵌入神经网络,所述图嵌入神经网络的输入是目标用户和多个关联用户的通话特征指标向量,输出是标识目标用户号码是否是疑似诈骗号码的标签信息,所述关联用户是目标用户的直接邻居,或不是目标用户的直接邻居;
步骤三、将待识别的目标用户和多个关联用户的通话特征指标向量输入训练后的图嵌入神经网络,然后根据图嵌入神经网络的输出判断待识别的目标用户号码是否是疑似诈骗号码,
步骤二所构建的图嵌入神经网络包含有嵌入层、K个隐藏层和输出层,当输入目标用户和多个关联用户的通话特征指标向量时,其计算过程如下:
步骤1、将输入的所有关联用户构成一个关联用户组,并为输入的目标用户构建K个邻居用户组:Z1、Z2、…、ZK,其中,Z1、Z2、…或ZK分别是目标用户的第1、2、…或K阶邻居用户组;
步骤2、将k设置为1,根据目标用户的直接邻居组,从关联用户组中挑选出目标用户的所有直接邻居作为目标用户的第1阶邻居用户,并将所有第1阶邻居用户添加到目标用户的第1阶邻居用户组中;
步骤3、将所有用户的通话特征指标向量经过图嵌入神经网络的嵌入层来获得各自初始的嵌入向量;
步骤4、根据目标用户在第1阶邻居用户组中的所有直接邻居的嵌入向量,更新目标用户的嵌入向量,然后将更新后的目标用户的嵌入向量输入至图嵌入神经网络的最后一个隐藏层中,最后将目标用户的嵌入向量更新为最后一个隐藏层的输出向量;
步骤5、将更新后的目标用户的嵌入向量输入至图嵌入神经网络的输出层,从而获得图嵌入神经网络的输出值,所述输出值即是目标号码是否是疑似诈骗号码的标签信息。
2.根据权利要求1所述的方法,其特征在于,步骤一中的通话特征指标包括:呼叫频次、被叫号码数、离散度、忙时率、通话间隔平均值、呼叫间隔平均值、通话时长平均值、振铃时长平均值、未接通振铃时长平均值、接通率、被叫释放率、主叫类型、被叫类型、主叫地区、被叫地区。
3.根据权利要求1所述的方法,其特征在于,步骤2和3之间还包括有:
步骤A、将k加1,然后判断k是否小于或等于K,如果是,则从目标用户的第k-1阶邻居用户组中逐一提取每个第k-1阶邻居用户,并将每个第k-1阶邻居用户在关联用户组中的所有直接邻居添加到目标用户的第k阶邻居用户组中,当提取完所有第k-1阶邻居用户后,转向步骤A;如果否,则转向步骤3,
步骤3和4之间还包括有:
步骤B1、将k减1,然后判断k是否大于1,如果是,则继续步骤B2;如果否,则转向步骤4;
步骤B2、从目标用户的第k阶邻居用户组中逐一提取每个第k阶邻居用户,并根据每个第k阶邻居用户在第k+1阶邻居用户组的所有直接邻居的嵌入向量,更新每个第k阶邻居用户的嵌入向量,然后将更新后的每个第k阶邻居用户的嵌入向量输入至图嵌入神经网络的第K-k个隐藏层中,最后将每个第k阶邻居用户的嵌入向量更新为第K-k个隐藏层的输出向量,当提取完所有第k阶邻居用户后,转向步骤B1。
4.根据权利要求1或3所述的方法,其特征在于,步骤4或B2中,根据目标用户或每个第k阶邻居用户在第1阶邻居用户组或第k+1阶邻居用户组的所有直接邻居的嵌入向量,更新目标用户或每个第k阶邻居用户的嵌入向量,进一步包括有:
步骤C1、将目标用户或每个第k阶邻居用户和其在第1阶邻居用户组或第k+1阶邻居用户组的每个直接邻居的嵌入向量拼接成一个用户-邻居特征指标向量,然后计算目标用户或每个第k阶邻居用户和其每个直接邻居之间的相关度:f(di,dj)=σf(Wf[di:dj]+bf),其中,f(di,dj)是用户i和其第j个直接邻居之间的相关度,di、dj分别是用户i、用户i的第j个直接邻居的嵌入向量,[di:dj]是di和dj拼接后的用户-邻居特征指标向量,σf是非线性激活函数,Wf是线性转换矩阵,bf是偏置向量,σf根据实际业务需要而设置,Wf和bf通过步骤二对图嵌入神经网络进行训练而获得;
步骤C2、计算每个第k阶邻居用户或目标用户的每个直接邻居对其特征更新的贡献值:其中,aij是用户i的第j个直接邻居对用户i特征更新的贡献值,N是用户i的直接邻居数,dt是用户i的第t个直接邻居,当t=0时,dt是用户i的嵌入向量;
步骤C3、更新每个第k阶邻居用户或目标用户的嵌入向量:其中,di'是更新后的用户i的嵌入向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;杭州东信北邮信息技术有限公司,未经国家计算机网络与信息安全管理中心;杭州东信北邮信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910410802.2/1.html,转载请声明来源钻瓜专利网。