[发明专利]神经网络训练方法、目标检测方法、装置、设备和介质在审
申请号: | 202210101367.7 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114511066A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 蒋旻悦;谭啸;孙昊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/82;G06V10/764;G06K9/62 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 姜浩然;吴丽丽 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 方法 目标 检测 装置 设备 介质 | ||
本公开提供了一种神经网络训练方法、目标检测方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及计算机视觉、图像识别和深度学习技术。实现方案为:对第一图像样本和第二图像样本分别进行变换操作,以得到第一变换图像至第四变换图像;将第一变换图像、第三变换图像分别输入第一老师网络、第二老师网络,生成第一伪标签、第二伪标签;将第二变换图像、第四变换图像分别输入第二学生网络、第一学生网络,以生成第一检测结果、第二检测结果;基于老师网络的伪标签和检测结果,调整学生网络的参数;基于学生网络的参数,调整老师网络的参数;以及基于两个老师网络中至少之一,生成目标神经网络。
技术领域
本公开涉及人工智能技术领域,尤其涉及计算机视觉、图像识别和深度学习技术,具体涉及一种神经网络训练方法、目标检测方法、装置、电子设备、计算机可读存储介质和计算机程序产品,具体可用于智慧城市和智能交通场景下。
背景技术
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
在目前的半监督训练方法中,需要预先训练老师网络并固化老师网络的参数,然后再用老师网络预测无标注数据的伪标签,以训练学生网络。但是,目前的半监督训练需要在训练学生网络前完成对老师网络的训练,训练流程较为复杂,且伪标签的精度难以保证,会影响学生网络的训练效果。
在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。
发明内容
本公开提供了一种神经网络训练方法、目标检测方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
根据本公开的一方面,提供了一种神经网络训练方法,包括:对第一图像样本进行第一变换操作,以得到第一变换图像,并且,对第一图像样本进行第二变换操作,以得到第二变换图像;对第二图像样本进行第三变换操作,以得到第三变换图像,并且,对第二图像样本进行第四变换操作,以得到第四变换图像;将第一变换图像输入第一老师网络,以生成对应于第一图像样本中的目标的第一伪标签,并且,将第三变换图像输入第二老师网络,以生成对应于第二图像样本中的目标的第二伪标签,其中,第一老师网络和第二老师网络为使用有标签样本预先训练的网络;将第二变换图像输入第二学生网络,以生成对应于第一图像样本中的目标的第一检测结果;将第四变换图像输入第一学生网络,以生成对应于第二图像样本中的目标的第二检测结果;基于第二伪标签和第二检测结果,调整第一学生网络的参数,并且,基于第一伪标签和第一检测结果,调整第二学生网络的参数;基于经调整的第一学生网络的参数,调整第一老师网络的参数,并且,基于经调整的第二学生网络的参数,调整第二老师网络的参数;以及基于第一老师网络和第二老师网络中至少之一,生成目标神经网络。
根据本公开的另一方面,提供了一种目标检测方法,包括:获取待检测的图片数据;以及使用如本公开所述的神经网络训练方法训练所获得的目标神经网络对图片数据进行目标检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210101367.7/2.html,转载请声明来源钻瓜专利网。