[发明专利]网络训练方法及装置、目标识别方法及装置和电子设备在审
申请号: | 202110717549.2 | 申请日: | 2021-06-28 |
公开(公告)号: | CN113344117A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 李建民;辜弘炀 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 训练 方法 装置 目标 识别 电子设备 | ||
1.一种网络训练方法,其特征在于,所述方法包括:
对于目标识别网络的第n轮训练,将训练集中的第一样本图像输入第n-1轮训练的目标识别网络中处理,得到所述第一样本图像的第一识别结果,所述目标识别网络用于对待处理图像进行目标识别,n为正整数;
根据所述第一样本图像的标注结果及所述第一识别结果,通过第n-1轮的多个第一损失函数,分别对所述第n-1轮训练的目标识别网络进行训练,得到多个第n中间状态的目标识别网络;
根据所述多个第n中间状态的目标识别网络,确定第n轮训练的目标识别网络;
根据所述第一损失函数的超参数优化函数及采样分布,更新所述第n-1轮的多个第一损失函数的超参数,得到第n轮的多个第一损失函数;
在满足训练条件的情况下,得到训练后的目标识别网络;
其中,所述第一损失函数包括线性分段函数,所述线性分段函数包括M个分段子区间和M+1个超参数,所述线性分段函数的定义域的范围为-1至1,M为大于1的整数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述采样分布对第一损失函数进行初始化,得到初始的多个第一损失函数;
根据目标识别网络进行随机初始化,得到初始的多个目标识别网络;
其中,在n=1的情况下,第n-1轮训练的目标识别网络包括所述初始的多个目标识别网络,第n-1轮的多个第一损失函数为所述初始的多个第一损失函数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多个第n中间状态的目标识别网络,确定第n轮训练的目标识别网络,包括:
针对所述多个第n中间状态的目标识别网络中的任意一个,将测试集中的第二样本图像输入所述第n中间状态的目标识别网络中处理,得到所述第二样本图像的第二识别结果;
根据所述第二样本图像的标注结果及所述第二识别结果,确定所述第n中间状态的目标识别网络回报信息;
根据所述多个第n中间状态的目标识别网络的回报信息,从所述多个第n中间状态的目标识别网络中,确定出第n轮训练的目标识别网络。
4.根据权利要求3所述的方法,其特征在于,根据所述第一损失函数的超参数优化函数及采样分布,更新所述第n-1轮的多个第一损失函数的超参数,得到第n轮的多个第一损失函数,包括:
根据所述多个第n中间状态的目标识别网络的回报信息以及所述超参数优化函数,更新所述第一损失函数的采样分布的参数;
根据更新后的采样分布,分别更新所述第n-1轮的多个第一损失函数的超参数,得到第n轮的多个第一损失函数。
5.根据权利要求1所述的方法,其特征在于,所述线性分段函数满足第一约束条件,所述第一约束条件包括:所述线性分段函数的一阶导数大于或等于0;所述线性分段函数的一阶导数不是固定值;在自变量为x的情况下,所述线性分段函数的函数值小于或等于自变量x;以及在自变量为1的情况下,所述线性分段函数的函数值大于或等于0;
其中,所述线性分段函数的M+1个超参数满足第二约束条件,所述第二约束条件包括:第j个超参数小于或等于第j+1个超参数,第M+1个超参数大于或等于0并且小于或等于1;以及第j个超参数小于或等于第j个分段子区域的右端点,1≤j≤M。
6.一种目标识别方法,其特征在于,所述方法包括:
将待处理图像输入目标识别网络中处理,得到所述待处理图像的识别结果,所述识别结果包括所述待处理图像中的目标区域,
其中,所述目标识别网络是根据权利要求1-5中任意一项所述的网络训练方法训练得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110717549.2/1.html,转载请声明来源钻瓜专利网。