[发明专利]数据处理方法、装置、电子设备及存储介质在审
申请号: | 202310589219.9 | 申请日: | 2023-05-24 |
公开(公告)号: | CN116523797A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 许啸;李沅坷;程元鸿;金驰 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06V10/764;G06V10/40;G06N3/0464;G06N3/08;G06N3/048 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 樊晓 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种数据处理方法、装置、设备及存储介质,可以应用于计算机技术领域、信息安全技术领域、人工智能技术领域和金融技术领域。该方法包括:对初始图像样本数据进行噪声处理,得到中间图像样本数据,其中,中间图像样本数据包括中间图像样本;利用初始图像处理模型对中间图像样本数据进行处理,确定与中间图像样本对应的样本损失值;根据样本损失值,确定中间图像样本的目标分组;以及根据目标分组,利用中间图像样本数据对初始图像处理模型进行训练,得到训练后的目标图像处理模型。
技术领域
本公开涉及计算机技术领域、信息安全技术领域、人工智能技术领域和金融技术领域,尤其涉及一种数据处理方法、装置、电子设备、存储介质和程序产品。
背景技术
相关技术中,在对图像处理模型进行模型训练时,会使用一些大型的数据集中的数据样本,这些数据样本的安全性通常无法核实,因此,会造成训练后的图像处理模型不能正常使用。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:相关技术中的利用未知的数据样本进行模型训练时,不能对数据样本的安全性进行确认,使得图像处理模型不能正常使用。
发明内容
鉴于上述问题,本公开提供了数据处理方法、装置、电子设备、存储介质和程序产品。
本公开的第一方面提供了一种数据处理方法,包括:
对初始图像样本数据进行噪声处理,得到中间图像样本数据,其中,中间图像样本数据包括中间图像样本;
利用初始图像处理模型对中间图像样本数据进行处理,确定与中间图像样本对应的样本损失值;
根据样本损失值,确定中间图像样本的目标分组;以及
根据目标分组,利用中间图像样本数据对初始图像处理模型进行训练,得到训练后的目标图像处理模型。
根据本公开的实施例,利用初始图像处理模型对中间图像样本数据进行处理,确定与中间图像样本对应的样本损失值,包括:
利用初始图像处理模型对中间图像样本数据进行处理,确定初始图像处理模型的损失变化曲线;
根据损失变化曲线,确定初始图像处理模型的的预设训练周期;以及
根据预设训练周期,确定与中间图像样本对应的样本损失值。
根据本公开的实施例,根据样本损失值,确定中间图像样本的目标分组,包括:
根据样本损失值,对中间图像样本进行排序,得到中间图像样本排序结果;以及
根据中间图像样本排序结果,按照预设规则确定中间图像样本的目标分组。
根据本公开的实施例,根据中间图像样本排序结果,按照预设规则确定中间图像样本的目标分组,包括:
根据中间图像样本排序结果,确定中间图像样本的排序位置;
在确定排序位置小于或等于第一预设阈值的情况下,确定中间图像样本是第一子目标分组,其中,第一子目标分组表征中间图像样本为第一异常样本;
在确定排序位置大于第一预设阈值且小于第二预设阈值的情况下,确定中间图像样本是第二子目标分组,其中,第二子目标分组表征中间图像样本为第二异常样本,第二异常样本的样本损失值小于第一异常样本的样本损失值;以及
在确定排序位置大于或等于第二预设阈值的情况下,确定中间图像样本是第三子目标分组,其中,第三子目标分组表征中间图像样本为正常样本。
根据本公开的实施例,对初始图像样本数据进行噪声处理,得到中间图像样本数据,包括:
将初始图像样本数据输入至编码器中,输出均值向量和标准差向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310589219.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:避雷器组装设备
- 下一篇:一种LED显示屏的拼装结构