[发明专利]黑名单筛查方法、装置、计算机设备及存储介质在审
申请号: | 201910198221.7 | 申请日: | 2019-03-15 |
公开(公告)号: | CN110083750A | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 李晨光 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06Q30/06;G06Q40/02 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 林燕云 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标注 卷积神经网络 目标用户信息 用户信息 计算机设备 概率 存储介质 序列集合 筛查 预设 多维度分析 多维度数据 获取目标 序列输入 用户数据 大数据 检测 预测 分析 | ||
1.一种黑名单筛查方法,其特征在于,包括:
将根据预设的用户名单所爬取的各用户信息分别进行标注,得到与各用户信息一一对应的标注序列,以组成标注序列集合;其中,所述用户名单中各用户的用户信息至少包括2种属性信息;
将所述标注序列集合中每一标注序列作为待训练卷积神经网络的输入,将所述标注序列集合中每一标注序列对应的自然人失信概率作为待训练卷积神经网络的输出,对所述待训练卷积神经网络进行训练,得到用于预测自然人失信概率的卷积神经网络模型;
若检测到待预测失信人概率的目标用户信息,获取所述目标用户信息对应的目标标注序列;
将所述目标标注序列输入至所述卷积神经网络模型,计算得到与所述目标用户信息对应的目标自然人失信概率;以及
若所述目标自然人失信概率大于预设的失信人概率阈值,将所述目标用户信息对应的添加至黑名单清单。
2.根据权利要求1所述的黑名单筛查方法,其特征在于,所述将根据预设的用户名单所爬取的各用户信息进行标注,得到与各用户一一对应的标注序列,以组成标注序列集合之前,还包括:
通过爬虫工具爬取预设的用户名单中各用户对应的用户信息,将所爬取的用户信息以每一用户的唯一识别标识为主键分别存储至数据表格。
3.根据权利要求2所述的黑名单筛查方法,其特征在于,所述通过爬虫工具爬取预设的用户名单中各用户对应的用户信息,将所爬取的用户信息以每一用户的唯一识别标识为主键分别存储至数据表格,包括:
获取所述用户名单中每一用户对应的授权文件,通过图像识别获取每一授权文件中的唯一识别标识;
通过所述爬虫工具爬取预设的网址中所存储的用户信息,若检测到预设的网址中存在身份验证,将与所述用户名单中每一用户对应的授权文件上传至对应的网址以进行身份验证;
若所述授权文件通过身份验证,爬取与所述授权文件对应的用户信息,以得到与所述用户名单中每一用户对应的用户信息;
以所述用户名单中每一用户对应的唯一识别标识为主键,将每一用户对应的用户信息组成一条用户数据,并存储于数据表格中对应的区域。
4.根据权利要求1所述的黑名单筛查方法,其特征在于,所述将根据预设的用户名单所爬取的各用户信息分别进行标注,得到与各用户信息一一对应的标注序列,以组成标注序列集合,包括:
根据所述用户名单获取每一用户对应的用户类型;
若当前用户对应的用户类型为个人用户,根据预设的个人用户标注策略获取当前用户所对应的用户信息中每一字段信息的字段取值,以根据各字段取值组成与当前用户对应的标注序列;
若当前用户对应的用户类型为企业用户,根据预设的企业用户标注策略获取当前用户所对应的用户信息中每一字段信息的字段取值,以根据各字段取值组成与当前用户对应的标注序列;
由与各用户信息一一对应的标注序列组成标注序列集合。
5.根据权利要求4所述的黑名单筛查方法,其特征在于,所述根据预设的个人用户标注策略获取当前用户所对应的用户信息中每一字段信息的字段取值,以根据各字段取值组成与当前用户对应的标注序列,包括:
统计当前用户对应的用户信息中各字段信息对应的信息条数,以作为每一字段信息的字段取值,并根据各字段取值组成与当前用户对应的标注序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910198221.7/1.html,转载请声明来源钻瓜专利网。