[发明专利]避障模型的训练方法、装置、电子设备及存储介质在审
申请号: | 202110963071.1 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113780101A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 张宝丰 | 申请(专利权)人: | 京东鲲鹏(江苏)科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 侯军洋 |
地址: | 215500 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种避障模型的训练方法,其特征在于,包括:
根据与待训练避障训练模型相对应的目标损失函数,更新与所述待训练避障模型相对应的可学习配置参数;其中,所述目标损失函数是根据与所述待训练避障模型相对应的惩罚函数和预设损失函数确定的;
根据所述可学习配置参数,更新所述待训练避障模型的主干网各项指标的目标候选值,得到待更新避障训练模型;其中,所述主干网包括卷积层,所述卷积层中包括至少一个卷积,每个卷积中包括至少一项指标;
将训练伪图像输入至所述待更新避障训练模型中,得到与所述训练伪图像相对应的实际输出数据;
如果与所述待更新避障训练模型相对应的目标损失函数收敛,则将所述待更新避障训练模型作为目标避障模型。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取基于激光雷达处理得到的三维点云;
采用预设算法对所述三维点云进行处理,得到用于训练所述待训练避障模型的训练伪图像。
3.根据权利要求1所述的方法,其特征在于,所述根据与待训练避障训练模型相对应的目标损失函数,更新与所述待训练避障模型相对应的可学习配置参数,包括:
根据所述待训练避障模型中主干网中各项指标所使用的候选值,确定与所述待训练避障模型相对应的惩罚函数;
根据所述惩罚函数和所述预设损失函数,确定所述目标损失函数,并根据所述目标损失函数对所述待训练避障模型对前一训练样本的实际输出结果和理论输出结果进行处理,得到所述可学习配置参数,以基于所述可学习配置参数更新所述待训练避障模型中各项指标所对应的目标候选值,得到所述待更新避障训练模型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述可学习配置参数,更新所述待训练避障模型的主干网各项指标的目标候选值,得到待更新避障训练模型,包括:
基于归一化指数函数对所述可学习配置参数进行处理,得到所述待训练避障模型主干网中每项指标所对应的权重矩阵;其中,所述权重矩阵的数量与指标的数量相一致,所述权重矩阵的行数与所述主干网中卷积的数量相对应,列数与每项指标的可选候选值的数量相对应;
基于各项指标的权重矩阵,确定每个卷积所对应的至少一项指标的目标候选值;
基于各目标候选值确定所述待训练避障模型的模型结构,得到所述待更新避障训练模型。
5.根据权利要求4所述的方法,其特征在于,所述基于各项指标的权重矩阵,确定每个卷积所对应的至少一项指标的目标候选值,包括:
针对各指标的权重矩阵,根据与当前指标所对应的权重矩阵的每行权重值,确定卷积层中每个卷积所对应的目标权重值;其中,所述权重值用于表征各可选候选值被选中的概率;
根据各目标权重值所对应的可选候选值,确定所述目标候选值。
6.根据权利要求5所述的方法,其特征在于,所述根据与当前指标所对应的权重矩阵的每行权重值,确定卷积层中每个卷积所对应的目标权重值,包括:
确定当前权重矩阵中每行的最大权重值,并将最大权重值确定为当前指标在各卷积的目标权重值;
相应的,所述根据各目标权重值所对应的可选候选值,确定所述目标候选值,包括:
确定各目标权重值所对应的可选候选值,并将所述可选候选值作为目标候选值。
7.根据权利要求4所述的方法,其特征在于,所述基于各目标候选值确定所述待训练避障模型的模型结构,得到所述待更新避障训练模型,包括:
根据各目标候选值,更新每个卷积中每个指标的已使用目标候选值,得到所述待更新避障训练模型;
其中,所述卷积中的指标包括步长、通道数、卷积核尺寸以及卷积核类型中的至少一项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东鲲鹏(江苏)科技有限公司,未经京东鲲鹏(江苏)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110963071.1/1.html,转载请声明来源钻瓜专利网。