[发明专利]三维目标检测方法及其模型的训练方法及相关装置、设备在审
申请号: | 201911379639.4 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111179247A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 董乐;张宁;陈相蕾;赵磊;黄宁;赵亮;袁璟 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/73 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 三维 目标 检测 方法 及其 模型 训练 相关 装置 设备 | ||
本申请公开了一种三维目标检测方法及其模型的训练方法及相关装置、设备,其中,三维目标检测模型的训练方法包括:获取样本三维图像,其中,样本三维图像标注有三维目标的实际区域的实际位置信息;利用三维目标检测模型对样本三维图像进行目标检测,得到与样本三维图像的一个或多个子图像对应的一个或多个预测区域信息,其中,每个预测区域信息包括预测区域的预测位置信息和预测置信度;利用实际位置信息与一个或多个预测区域信息,确定三维目标检测模型的损失值;利用损失值,调整三维目标检测模型的参数。上述方案,能够直接检测得到三维目标,并降低其检测难度。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种三维目标检测方法及其模型的训练方法及相关装置、设备。
背景技术
随着神经网络、深度学习等人工智能技术的发展,对神经网络模型进行训练,并利用经训练的神经网络模型完成目标检测等任务的方式,逐渐受到人们的青睐。
然而,现有的神经网络模型一般都是以二维图像作为检测对象而设计的,对于诸如MRI(Magnetic Resonance Imaging,核磁共振成像)图像等三维图像,往往需要将其拆分为二维平面图像后进行处理,从而失去图像空间信息和结构信息,因此,难以直接检测得到三维图像中的三维目标。有鉴于此,如何检测得到三维目标,并降低其检测难度成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种三维目标检测方法及其模型的训练方法及相关装置、设备,能够直接检测得到三维目标,并降低其检测难度。
为了解决上述问题,本申请第一方面提供了一种三维目标检测模型的训练方法,包括:获取样本三维图像,其中,样本三维图像标注有三维目标的实际区域的实际位置信息;利用三维目标检测模型对样本三维图像进行目标检测,得到与样本三维图像的一个或多个子图像对应的一个或多个预测区域信息,其中,每个预测区域信息包括预测区域的预测位置信息和预测置信度;利用实际位置信息与一个或多个预测区域信息,确定三维目标检测模型的损失值;利用损失值,调整三维目标检测模型的参数。
因此,能够训练得到对三维图像进行三维目标检测的模型,而无需将三维图像处理为二维平面图像后再进行目标检测,故此,能够有效保留三维目标的空间信息和结构信息,从而能够直接检测得到三维目标。由于三维目标检测模型进行目标检测时,能够得到三维图像一个或多个子图像的预测区域信息,从而能够在三维图像的一个或多个子图像中进行三维目标检测,有助于降低三维目标检测的难度。
其中,预测区域信息的数量为预设数量个,预设数量与三维目标检测模型的输出尺寸相匹配,利用实际位置信息与一个或多个预测区域信息,确定三维目标检测模型的损失值,包括:利用实际位置信息,生成分别与预设数量个子图像对应的预设数量个实际区域信息,其中,每个实际区域信息包括实际位置信息和实际置信度,实际区域的预设点所在的子图像对应的实际置信度为第一值,其余子图像对应的实际置信度为小于第一值的第二值;利用与预设数量个子图像中对应的实际位置信息和预测位置信息,得到位置损失值;利用与预设数量个子图像中对应的实际置信度和预测置信度,得到置信度损失值;基于位置损失值和置信度损失值,得到三维目标检测模型的损失值。
因此,通过实际位置信息生成与预设数量个子图像对应的预设数量个实际区域信息,从而能够在预设数量个实际区域信息和与其对应的预测区域信息的基础上进行损失计算,进而能够降低损失计算的复杂度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911379639.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:纸张轮廓的歪斜纠偏方法
- 下一篇:一种动态多级缓存的方法和设备