[发明专利]目标对象检测方法、训练方法、装置以及电子设备有效
申请号: | 202310113169.7 | 申请日: | 2023-02-15 |
公开(公告)号: | CN115861400B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 邹智康;叶晓青 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06T7/50 | 分类号: | G06T7/50;G06V20/62;G06V20/58;G06N3/04;G06N3/084 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李世阳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 对象 检测 方法 训练 装置 以及 电子设备 | ||
本申请提供了目标对象检测方法、训练方法、装置以及电子设备,涉及计算机视觉、图像处理、深度学习等人工智能技术领域,可应用于自动驾驶、智慧城市等场景。具体实现方案为:对待检测图像中的目标对象进行深度信息预测,得到目标对象的关键点的初始关键点深度,以及与初始关键点深度对应的深度信息置信度;根据深度信息置信度和初始关键点深度,确定目标对象的目标预测深度;以及根据目标预测深度,检测待检测图像中的目标对象。
技术领域
本申请涉及计算机视觉、图像处理、深度学习等人工智能技术领域,可应用于自动驾驶、智慧城市等场景。
背景技术
在自动驾驶、智能交通等应用场景中,可以通过对待检测的空间进行图像采集,并根据采集到的图像对空间中的车辆、交通标识牌等目标对象进行检测,进而可以根据针对目标对象的检测结果来实现车辆自动驾驶、异常交通情况识别等智能化功能。
发明内容
本申请提供了一种目标对象检测方法、深度学习模型的训练方法、装置、电子设备、存储介质以及程序产品。
根据本申请的一方面,提供了一种目标对象检测方法,包括:对待检测图像中的目标对象进行深度信息预测,得到所述目标对象的关键点的初始关键点深度,以及与所述初始关键点深度对应的深度信息置信度;根据所述深度信息置信度和所述初始关键点深度,确定所述目标对象的目标预测深度;以及根据所述目标预测深度,检测所述待检测图像中的目标对象。
根据本申请的另一方面,提供了一种深度学习模型的训练方法,包括:将待检测的样本图像输入至初始深度学习模型,输出所述样本图像中,样本目标对象的样本关键点的样本初始关键点深度,以及与所述样本初始关键点深度对应的样本深度信息置信度;根据所述样本初始关键点深度和所述样本目标对象的样本二维属性,确定所述样本目标对象的预测三维检测框;利用与所述样本目标对象对应的标签三维检测框、所述预测三维检测框和所述样本深度信息置信度,训练所述初始深度学习模型,得到训练后的深度学习模型。
根据本申请的另一方面,提供了一种目标对象检测装置,包括:预测模块,用于对待检测图像中的目标对象进行深度信息预测,得到所述目标对象的关键点的初始关键点深度,以及与所述初始关键点深度对应的深度信息置信度;目标预测深度确定模块,用于根据所述深度信息置信度和所述初始关键点深度,确定所述目标对象的目标预测深度;以及检测模块,用于根据所述目标预测深度,检测所述待检测图像中的目标对象。
根据本申请的另一方面,提供了一种深度学习模型的训练装置,包括:样本图像处理模块,用于将待检测的样本图像输入至初始深度学习模型,输出所述样本图像中,样本目标对象的样本关键点的样本初始关键点深度,以及与所述样本初始关键点深度对应的样本深度信息置信度;预测三维检测框确定模块,用于根据所述样本初始关键点深度和所述样本目标对象的样本二维属性,确定所述样本目标对象的预测三维检测框;训练模块,用于利用与所述样本目标对象对应的标签三维检测框、所述预测三维检测框和所述样本深度信息置信度,训练所述初始深度学习模型,得到训练后的深度学习模型。
根据本申请的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方法。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310113169.7/2.html,转载请声明来源钻瓜专利网。