[发明专利]分类模型训练方法以及装置在审
申请号: | 202210635079.X | 申请日: | 2022-06-07 |
公开(公告)号: | CN115034300A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 鲍梦瑶;刘佳伟;章鹏;张谦;贾茜 | 申请(专利权)人: | 蚂蚁区块链科技(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 吴肖肖 |
地址: | 200010 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 以及 装置 | ||
本说明书实施例提供分类模型训练方法以及装置,其中所述分类模型训练方法包括:获取训练样本数据以及目标样本标签,并根据所述训练样本数据以及所述目标样本标签训练获得中间分类器,其中,所述训练样本数据包括目标项目的历史待审核项目数据,将所述训练样本数据及所述目标样本标签输入所述中间分类器,获得所述训练样本数据对应的样本测试结果,根据所述样本测试结果,确定所述训练样本数据的训练样本标签,根据所述训练样本数据以及所述训练样本标签,训练获得目标分类模型,其中,所述目标分类模型用于对所述目标项目的待审核项目数据进行分类,并输出对应的分类结果,所述分类结果用于确定所述待审核项目数据的合规审核结果。
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种分类模型训练方法。本说明书一个或者多个实施例同时涉及一种分类模型训练装置,一种计算设备,以及一种计算机可读存储介质。
背景技术
随着信息技术快速发展,大数据时代已经来临。大数据为用户带来信息共享、便捷生活的同时,还存在着个人隐私泄漏等诸多数据安全的问题。
目前出现越来越多的应用程序,以为用户提供多样化的服务,但为保证应用程序能够通过合理的方式收集用户的相关属性信息,用户在使用应用程序前,应用程序通常会向用户展示隐私协议,以使得用户阅读并了解相关的隐私协议内容,做到向用户告知隐私协议内容的目的,但应用程序在向用户展示隐私协议之前,需对该隐私协议的内容进行合规自查,以确定其内容是否符合规定的合规条件,而目前的合规自查方式,多是借助机器学习模型来实现,但由于机器学习模型需要借助大量有标签的样本数据进行模型训练,以保证其输出结果的准确性,而目前样本数据的标签多是通过人工标注生成,对于庞大的样本数据集,人工标注不仅会耗费大量时间,影响模型训练的效率,而且对人员的监管合规行业经验的要求也较高,人工标注过程中,往往会存在信息获取滞后、信息真实性不易核验等问题,使得人工标注生成的标签,其准确性较低,利用这部分标签进行模型训练,会对模型训练结果的准确性产生影响。因此亟需一种有效的方法以解决此类问题。
发明内容
有鉴于此,本说明书实施例提供了一种分类模型训练方法。本说明书一个或者多个实施例同时涉及一种分类模型训练装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种分类模型训练方法,包括:
获取训练样本数据以及目标样本标签,并根据所述训练样本数据以及所述目标样本标签训练获得中间分类器,其中,所述训练样本数据包括目标项目的历史待审核项目数据;
将所述训练样本数据及所述目标样本标签输入所述中间分类器,获得所述训练样本数据对应的样本测试结果;
根据所述样本测试结果,确定所述训练样本数据的训练样本标签;
根据所述训练样本数据以及所述训练样本标签,训练获得目标分类模型,其中,所述目标分类模型用于对所述目标项目的待审核项目数据进行分类,并输出对应的分类结果,所述分类结果用于确定所述待审核项目数据的合规审核结果。
可选地,所述获取训练样本数据以及目标样本标签,包括:
获取训练样本数据以及初始样本标签,并根据所述训练样本数据以及所述初始样本标签训练获得初始分类器,其中,所述训练样本数据包括目标项目的历史待审核项目数据;
将所述训练样本数据及所述初始样本标签输入所述初始分类器,获得所述训练样本数据对应的第一样本测试结果;
根据所述第一样本测试结果,确定所述训练样本数据的目标样本标签。
可选地,所述将所述训练样本数据及所述目标样本标签输入所述中间分类器,获得所述训练样本数据对应的样本测试结果,包括:
将所述训练样本数据及所述目标样本标签输入第一中间分类器,获得所述训练样本数据对应的第二样本测试结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蚂蚁区块链科技(上海)有限公司,未经蚂蚁区块链科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210635079.X/2.html,转载请声明来源钻瓜专利网。