[发明专利]一种网络集成的训练方法及装置、电子设备和存储介质在审
申请号: | 201911054426.4 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110796202A | 公开(公告)日: | 2020-02-14 |
发明(设计)人: | 李艺;段逸群;孙鹏宇;旷章辉;陈益民;张伟 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 11277 北京林达刘知识产权代理事务所(普通合伙) | 代理人: | 刘新宇 |
地址: | 518054 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标网络 集成网络 网络集成 网络处理性能 存储介质 电子设备 损失函数 桥接 | ||
本公开涉及一种网络集成的训练方法及装置、电子设备和存储介质,其中,该方法包括:获取待训练的第一目标网络,其中所述第一目标网络中包括以桥接方式连接的至少两个待集成网络;根据所述至少两个待集成网络的各自损失及所述第一目标网络的整体损失所得到的目标损失函数,训练所述第一目标网络,得到训练后的第二目标网络。采用本公开,提高了网络集成后所得到第二目标网络的网络处理性能。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种网络集成的训练方法及装置、图像分类方法及装置、图像检测方法及装置、视频处理方法及装置、电子设备和存储介质。
背景技术
将多个深度学习神经网络进行网络集成,可以提高网络总体的处理性能。以图像分类场景为例,图像分类作为计算机视觉的基础,通过网络集成可以提高图像分类的分类性能(如分类准确度)。然而,多个深度学习神经网络各自的处理性能有高有低,彼此间存在差距,尤其是处理性能差距很大的情况下会导致最终网络集成的处理性能与预期需求有很大的偏差。可见,目前网络集成方法并不理想,然而,相关技术中未存在有效的解决方案。
发明内容
本公开提出了一种网络集成的训练处理的技术方案。
根据本公开的一方面,提供了一种网络集成的训练方法,所述方法包括:
获取待训练的第一目标网络,其中所述第一目标网络中包括以桥接方式连接的至少两个待集成网络;
根据所述至少两个待集成网络的各自损失及所述第一目标网络的整体损失所得到的目标损失函数,训练所述第一目标网络,得到训练后的第二目标网络。
采用本公开,由于通过桥接方式集成了至少两个待集成网络,从而可以兼顾各个待集成网络各自的网络性能优势及集成后得到第一目标网络的整体网络性能优势。通过根据待集成网络的各自损失和网络的整体损失得到的目标损失函数训练所述第一目标网络,可以自适应调整第一目标网络的网络参数,从而使得到的第二目标网络的网络处理性能更加优越,改善了网络的处理性能。
可能的实现方式中,所述以桥接方式连接的至少两个待集成网络,包括:
基于一个或多个网络桥接模块连接的所述至少两个待集成网络。
采用本公开,可以通过一个或多个网络桥接模块实现所述桥接方式,模块化的桥接,便于实现网络桥接,可以改善网络处理性能。
可能的实现方式中,所述基于一个或多个网络桥接模块连接所述至少两个待集成网络,包括:
基于一个或多个网络桥接模块,连接的同种网络结构且不同分辨率的至少两个待集成网络;或者,
基于一个或多个网络桥接模块,连接的不同网络结构且相同分辨率的至少两个待集成网络;或者,
基于一个或多个网络桥接模块,连接的不同网络结构且不同分辨率的至少两个待集成网络。
采用本公开,通过网络桥接模块,可以连接多种不同的网络结构及分辨率的网络,可以适用于多种网络的集成训练。
可能的实现方式中,所述获取待训练的第一目标网络之后,所述方法还包括:
根据所述网络桥接模块,对所述至少两个待集成网络分别对应不同尺度的特征进行特征融合,得到特征融合结果。
采用本公开,还可以对所述至少两个待集成网络分别对应不同尺度的特征进行特征融合,将该特征融合结果用于网络训练中,可以改善网络处理性能。
可能的实现方式中,所述根据所述网络桥接模块,对所述至少两个待集成网络分别对应不同尺度的特征进行特征融合,得到特征融合结果,包括:
对所述至少两个待集成网络分别对应不同尺度的特征进行同深度的特征融合,得到特征融合结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911054426.4/2.html,转载请声明来源钻瓜专利网。