[发明专利]深度及置信度估计系统在审
申请号: | 202011377446.8 | 申请日: | 2020-11-30 |
公开(公告)号: | CN112488104A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 张镇嵩;周一韧;李志豪;许松岑 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N20/00;G06T7/50 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;李稷芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 置信 估计 系统 | ||
1.一种用于深度估计和置信度预测的机器学习模型的训练方法,其特征在于,所述方法包括:
获取带有真实深度标签的训练图像;
将所述训练图像输入到待训练的机器学习模型得到深度估计多类别概率,其中,所述深度估计多类别概率包括所述训练图像的像素点被归为预设多个深度类别的每一个深度类别的概率;
根据所述深度估计多类别概率,分别生成所述训练图像的各个像素点的深度估计值和置信度;
根据损失函数调整所述待训练的机器学习模型的模型参数,直到所述损失函数的输出满足预设优化条件,得到训练好的机器学习模型,
其中,所述损失函数包括第一损失函数和第二损失函数,
其中,所述第一损失函数用于整体上度量所述训练图像的各个像素点的误差,所述训练图像的各个像素点的每一个像素点的误差为该像素点的深度估计值与所述真实深度标签中该像素点的真实深度值的差值,
其中,当所述第二损失函数的输出最小化时,所述训练图像的各个像素点的每一个像素点的置信度和该像素点的误差负相关。
2.根据权利要求1所述的方法,其特征在于,所述第一损失函数是基于加权交叉熵的损失函数,所述基于加权交叉熵的损失函数采用对称的信息增益矩阵作为权重从而增强具有较小的误差的像素点在调整所述模型参数时的影响,所述信息增益矩阵的维度为所述预设多个深度类别的总数。
3.根据权利要求1所述的方法,其特征在于,所述第二损失函数是置信度排序损失函数,所述置信度排序损失函数比较所述训练图像的任意两个像素点各自的误差或者置信度。
4.根据权利要求1所述的方法,其特征在于,所述损失函数还包括第三损失函数,
其中,所述第三损失函数是兴趣区域置信度损失函数,所述训练图像的一部分被选择为所述训练图像的兴趣区域,
其中,与所述损失函数不包括所述第三损失函数的情况相比较,当包括所述第三损失函数的所述损失函数的输出满足所述预设优化条件时,所述兴趣区域内的像素点的置信度的平均值要较高。
5.根据权利要求4所述的方法,其特征在于,所述兴趣区域置信度损失函数根据位于所述兴趣区域内的像素点的总数和位于所述兴趣区域内的像素点的置信度而确定。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括,
选择所述训练图像的一部分为兴趣区域,
提高所述兴趣区域内的像素点的交叉熵损失或者回归损失,并更新所述兴趣区域内的像素点的置信度。
7.根据权利要求3所述的方法,其特征在于,所述置信度排序损失函数比较所述训练图像的任意两个像素点各自的误差,
其中,当所述任意两个像素点各自的误差的差值小于预设阈值时,所述置信度排序损失函数判断所述任意两个像素点各自的误差一致。
8.根据权利要求3所述的方法,其特征在于,所述置信度排序损失函数比较所述训练图像的任意两个像素点各自的置信度,
其中,当所述任意两个像素点各自的置信度的差值小于预设阈值时,所述置信度排序损失函数判断所述任意两个像素点各自的置信度一致。
9.根据权利要求1所述的方法,其特征在于,所述预设多个深度类别与多个离散化深度值一一对应,所述多个离散化深度值在预设区间内均匀分布或者非均匀分布,所述训练图像的各个像素点的每一个像素点的深度估计值根据该像素点在所述深度估计多类别概率中被归为所述预设多个深度类别的每一个深度类别的概率和各自对应的离散化深度值而确定。
10.根据权利要求1-9中任一项所述的方法,其特征在于,所述训练图像的各个像素点的每一个像素点的置信度与该像素点的分类熵负相关,所述像素点的分类熵被定义为所述像素点在所述预设多个深度类别的每一个深度类别的概率与该概率的自然对数乘积之和的相反数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011377446.8/1.html,转载请声明来源钻瓜专利网。