[发明专利]一种GoIP诈骗窝点的识别方法、系统及计算机可读存储介质有效
申请号: | 202210045845.7 | 申请日: | 2022-01-17 |
公开(公告)号: | CN114066490B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 林建洪;陈晓莉;冯杰;赵祥廷;聂宜君;徐佳丽 | 申请(专利权)人: | 浙江鹏信信息科技股份有限公司 |
主分类号: | G06F17/00 | 分类号: | G06F17/00;G06Q30/00;G06Q50/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 冷红梅 |
地址: | 311100 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 goip 诈骗 窝点 识别 方法 系统 计算机 可读 存储 介质 | ||
1.一种GoIP诈骗窝点的识别方法,其特征在于,包括以下步骤:
S1、采集历史样本数据集;历史样本数据集包括GoIP诈骗设备和正常通信设备的通信数据信息及设备信息;
S2、采用历史样本数据集对神经网络进行训练,得到神经网络模型;
对历史样本数据集及其对应的神经网络模型输出的属于GoIP诈骗电话的置信度进行GMM聚类分析,得到历史分簇结果;
S3、获取待测样本数据集并输入神经网络模型,输出各待测样本对应的属于GoIP诈骗电话的置信度,以判断各待测样本是否为GoIP诈骗电话;若置信度超过预设阈值,则待测样本为GoIP诈骗电话,转至步骤S4;
S4、将属于GoIP诈骗电话的待测样本数据集及其对应的置信度与历史分簇结果进行概率匹配,得到目标分簇结果;
S5、根据目标分簇结果判断是否存在待测样本数量大于预设数量阈值且所有待测样本对应的置信度的平均值大于预设置信度阈值的目标簇;若是,则目标簇为诈骗窝点簇;
用于神经网络训练或输入神经网络模型的通信数据信息包括24小时每个小时的通话次数、24小时每个小时的通话时长、24小时每个小时的通话对象数、24小时经过的基站数、通话对象归属地的离散程度、24小时的工作总时长、三天内用过的IMEI数、历史三天内单天通话最高次数,设备信息包括通话次数最多的IMEI信息;
用于GMM聚类分析或概率匹配的通信数据信息包括通话的基站位置和定位位置、24小时有通话的小时数、24小时的总通话次数,设备信息包括IMEI信息;
所述步骤S2中,神经网络模型的训练过程包括:
S21、将24小时每个小时的通话次数、24小时每个小时的通话时长、24小时每个小时的通话对象数并行输入双向LSTM网络,之后通过双向LSTM网络的输出连接的第一FC层输出;
将通话次数最多的IMEI信息进行编码之后依次输入embedding层、CNN网络,并通过CNN网络的输出连接的第二FC层输出;
将24小时经过的基站数、通话对象归属地的离散程度、24小时的工作总时长、三天内用过的IMEI数、历史三天内单天通话最高次数输入第三FC层并输出;
S22、将步骤S21中各FC层的输出通过第四FC层结合,并通过sigmoid层输出,得到属于GoIP诈骗电话的置信度。
2.根据权利要求1所述的一种GoIP诈骗窝点的识别方法,其特征在于,所述步骤S4中,根据待测样本数据集中的各待测样本对应的通话的基站位置和定位位置、24小时有通话的小时数、24小时的总通话次数、IMEI信息以及置信度分别计算其属于历史分簇结果中各个簇的概率,并将各待测样本归属至其对应的概率最高的簇中,得到目标分簇结果。
3.根据权利要求2所述的一种GoIP诈骗窝点的识别方法,其特征在于,所述步骤S5之后,还包括以下步骤:
S6、将诈骗窝点簇的信息发送至监管平台。
4.根据权利要求3所述的一种GoIP诈骗窝点的识别方法,其特征在于,所述监管平台根据诈骗窝点簇中的待测样本对应的通信数据信息中的定位位置确定诈骗窝点位置。
5.根据权利要求1-4任一项所述的一种GoIP诈骗窝点的识别方法,其特征在于,所述步骤S2中的历史分簇结果定期更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鹏信信息科技股份有限公司,未经浙江鹏信信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210045845.7/1.html,转载请声明来源钻瓜专利网。