[发明专利]一种神经网络的训练方法及系统在审
申请号: | 202011583732.X | 申请日: | 2020-12-28 |
公开(公告)号: | CN112668698A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 户磊;刘冲冲;朱海涛;付贤强;何武 | 申请(专利权)人: | 北京的卢深视科技有限公司;合肥的卢深视科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨明月 |
地址: | 100083 北京市海淀区学院*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 训练 方法 系统 | ||
本发明提供一种神经网络的训练方法及系统,该方法包括:将样本数据输入到目标神经网络中,获取所述样本数据对应的预测标签;根据样本标签和所述预测标签之间的偏差程度,判断所述样本标签是否正确;若判断得知所述样本标签错误,则不利用所述样本数据和所述样本标签对所述目标神经网络进行训练。本发明通过比较样本数据的样本标签和预测标签之间的偏差,来判定样本数据对应的样本标签是否正确,并只利用正确的样本标签对目标神经网络进行训练,避免了错误的样本标签对神经网络进行训练带来的精度影响,提高了目标神经网络的训练精度。
技术领域
本发明涉及计算机及人工智能技术领域,尤其涉及一种神经网络的训练方法及系统。
背景技术
基于深度学习原理的分类器已被广泛应用于人们的生产生活中,比如反动、色情暴力图片的分类器,可用于净化互联网环境,缺陷工件图片的分类器,能够快速筛选出缺陷工件等等。
然而,基于深度学习原理的分类器在训练时,依赖大量的数据支持,这些数据一般并非只需要采集到即可,还需要付诸大量的人力物力予以标注,最终分类器的性能受标注质量影响很大。
而大规模数据的标注质量常常良莠不齐,甚至出现明显的错误标注。使用含有错误标注的数据训练的分类器难以达到最优性能,反而会让分类器网络变得复杂,泛化能力差。
因此,利用错误标注的数据样本会使得神经网络的训练精度降低。
发明内容
本发明提供一种神经网络的训练方法及系统,用以解决现有技术中因标注信息错误而导致神经网络训练精度低的缺陷,实现错误标注信息的筛选,从而提高神经网络的训练精度。
本发明提供一种神经网络的训练方法,包括:
将样本数据输入到目标神经网络中,获取所述样本数据对应的预测标签;
根据样本标签和所述预测标签之间的偏差程度,判断所述样本标签是否正确;
若判断得知所述样本标签错误,则不利用所述样本数据和所述样本标签对所述目标神经网络进行训练。
根据本发明提供的一种神经网络的训练方法,还包括:
若判断获知所述样本标签正确,则利用所述样本数据和所述样本标签对所述目标神经网络进行训练。
根据本发明提供的一种神经网络的训练方法,将样本数据输入到目标神经网络中,获取所述样本数据对应的预测标签,包括:
将所述目标神经网络切分为特征提取模块和目标分类器;
对所述目标分类器进行复制,获取多个目标分类器,所述目标分类器的学习参数两两不同;
将所述样本数据输入到所述特征提取模块中,获取样本特征;
将所述样本特征分别输入到每一目标分类器中,获取每一目标分类器对所述样本数据的预测标签,即为所述样本数据对应的预测标签。
根据本发明提供的一种神经网络的训练方法,所述根据所述样本标签和所述预测标签之间的偏差程度,判断所述样本标签是否正确,包括:
若判断得知所述样本标签与所有目标分类器对所述样本数据的预测标签之间的偏差均大于预设阈值,则判断所述样本标签错误。
根据本发明提供的一种神经网络的训练方法,所述根据所述样本标签和所述预测标签之间的偏差程度,判断所述样本标签是否正确,还包括:
若判断得知所述样本标签与所有目标分类器对所述样本数据的预测标签之间的偏差均大于预设阈值,则根据所述样本标签与所有目标分类器对所述样本数据的预测标签之间的偏差,获取平均偏差;
根据所述平均偏差和所述预设阈值,获取随机阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京的卢深视科技有限公司;合肥的卢深视科技有限公司,未经北京的卢深视科技有限公司;合肥的卢深视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011583732.X/2.html,转载请声明来源钻瓜专利网。