[发明专利]风险样本检测方法、装置、电子设备及存储介质有效
申请号: | 202010413977.1 | 申请日: | 2020-05-15 |
公开(公告)号: | CN111340144B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 林建滨 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 李娇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险 样本 检测 方法 装置 电子设备 存储 介质 | ||
本说明书实施例提供了一种风险样本检测方法、装置、电子设备及存储介质,通过先基于目标样本数据集,分别训练目标分类模型以及参考分类模型,目标分类模型属于深度学习模型,参考分类模型属于除深度学习模型以外的机器学习模型,然后通过比较目标分类模型以及参考分类模型在目标样本数据集上的分类指标值,识别目标样本数据集中的风险样本。
技术领域
本说明书实施例涉及风控技术领域,尤其涉及一种风险样本检测方法、装置、电子设备及存储介质。
背景技术
随着科学技术的发展,人工智能正在日益渗透到各种的技术领域。而深度学习是目前最活跃的分支,由于其出色的性能已经广泛应用各种场景上去(如CV、NLP等),在各行各业发挥着举足轻重的作用。也正因为如此,关于深度学习模型的安全问题就非常值得重视。
发明内容
本说明书实施例提供了一种风险样本检测方法、装置、电子设备及存储介质。
第一方面,本说明书实施例提供了一种风险样本检测方法,包括:获取目标样本数据集,所述目标样本数据集包括多个样本以及每个样本的类别标签;基于所述目标样本数据集,分别训练得到目标分类模型以及参考分类模型,其中,所述目标分类模型属于深度学习模型,所述参考分类模型属于除深度学习模型以外的机器学习模型;通过比较所述目标分类模型以及所述参考分类模型在所述目标样本数据集上的分类指标值,识别所述目标样本数据集中的风险样本。
第二方面,本说明书实施例提供了一种风险样本检测装置,包括:获取模块,用于获取目标样本数据集,所述目标样本数据集包括多个样本以及每个样本的类别标签;训练模块,用于基于所述目标样本数据集,分别训练得到目标分类模型以及参考分类模型,其中,所述目标分类模型属于深度学习模型,所述参考分类模型属于除深度学习模型以外的机器学习模型;识别模块,用于通过比较所述目标分类模型以及所述参考分类模型在所述目标样本数据集上的分类指标值,识别所述目标样本数据集中的风险样本。
第三方面,本说明书实施例提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一方面提供的风险样本检测方法的步骤。
第四方面,本说明书实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面提供的风险样本检测方法的步骤。
本说明书一个实施例提供的风险样本检测方法,通过先基于目标样本数据集,分别训练目标分类模型以及参考分类模型,目标分类模型属于深度学习模型,参考分类模型属于除深度学习模型以外的机器学习模型,然后通过比较目标分类模型以及参考分类模型在目标样本数据集上的分类指标值,识别目标样本数据集中的风险样本。该过程利用了深度学习模型与传统机器学习模型对于数据学习的侧重点不同,通过在目标样本数据集上对比两个模型的分类指标值的一致性,有效地实现了目标样本数据集中的风险样本识别,提高模型训练数据的安全性,从而有利于防御模型后门攻击。
附图说明
图1为本说明书实施例提供的一个示例性样本图片;
图2为本说明书实施例提供的另一个示例性样本图片;
图3为本说明书实施例第一方面提供的一种风险样本检测方法的流程图;
图4为本说明书实施例第一方面提供的深度神经网络模型的结构示意图;
图5为本说明书实施例第一方面提供的SVM模型的处理流程示意图;
图6为本说明书实施例第二方面提供的一种风险样本检测装置的模块框图;
图7为本说明书实施例第三方面提供的一种电子设备的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010413977.1/2.html,转载请声明来源钻瓜专利网。