[发明专利]一种目标对象定位的方法、系统、装置、设备及介质在审
申请号: | 202310460973.2 | 申请日: | 2023-04-25 |
公开(公告)号: | CN116486065A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 刘海莹;何必仕 | 申请(专利权)人: | 创新奇智(上海)科技有限公司 |
主分类号: | G06V10/24 | 分类号: | G06V10/24;G06V10/80 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 史一 |
地址: | 201900 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 对象 定位 方法 系统 装置 设备 介质 | ||
1.一种目标对象定位的方法,其特征在于,所述方法包括:
将待识别图像输入到下采样模块中进行下采样操作,获得所述待识别图像的下采样特征,其中,所述下采样模块中包括残差组件,所述残差组件中包括多个卷积核,所述残差组件至少用于将所述多个卷积核输出的特征进行融合;
将所述下采样特征输入到特征提取模块,获得所述待识别图像的目标特征;
将所述目标特征输入到定位识别模块中,获得目标对象的定位坐标,其中,所述待识别图像中包括所述目标对象。
2.根据权利要求1所述的方法,其特征在于,所述多个卷积核中包括第一卷积核,所述第一卷积核包括M个子卷积核,所述残差组件用于将所述M个子卷积核输出的特征进行融合,其中,M为大于或等于2的整数。
3.根据权利要求2所述的方法,其特征在于,所述M个子卷积核包括:n×n子卷积核、n×1子卷积核以及1×n子卷积核;所述残差组件用于将所述n×n子卷积核、n×1子卷积核以及1×n子卷积核输出的特征进行融合,n为大于或等于2的整数。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述待识别图像为待识别单通道图像,其中,所述待识别单通道图像中的各像素点对应一个像素值;
所述将待识别图像输入到下采样模块中进行下采样操作,获得所述待识别图像的下采样特征,包括:
将所述待识别单通道图像输入到所述下采样模块中进行下采样操作,获得所述待识别单通道图像的下采样特征。
5.根据权利要求1-3任一项所述的方法,其特征在于,在所述将待识别图像输入到下采样模块中进行下采样操作,获得所述待识别图像的下采样特征之前,所述方法还包括:
获取原始图像;
将所述原始图像进行图像滤波操作和二值化操作,获得所述待识别图像。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述目标特征输入到定位识别模块中,获得目标对象的定位坐标,包括:
将所述目标特征输入到定位识别模块中,对所述目标对象进行定位操作和识别操作,获得所述目标对象的定位坐标和类型。
7.一种目标对象定位的装置,其特征在于,所述装置包括:
下采样模块,被配置为将待识别图像输入到下采样模块中进行下采样操作,获得所述待识别图像的下采样特征,其中,所述下采样模块中包括残差组件,所述残差组件中包括多个卷积核,所述残差组件至少用于将所述多个卷积核输出的特征进行融合;
特征提取模块,被配置为将所述下采样特征输入到特征提取模块,获得所述待识别图像的目标特征;
定位识别模块,被配置为将所述目标特征输入到定位识别模块中,获得目标对象的定位坐标,其中,所述待识别图像中包括所述目标对象。
8.一种目标对象定位的系统,其特征在于,所述系统包括:
拍摄设备,用于对目标对象进行拍摄获得待识别图像,并且发送所述待识别图像;
服务器,用于获取所述待识别图像,并且根据所述待识别图像执行如权利要求1-6任一项所述的方法,获得所述目标对象的定位坐标。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线;
所述处理器通过所述总线与所述存储器相连,所述存储器存储有计算机程序,所述计算机程序由所述处理器执行时可实现如权利要求1-6任一项所述方法。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被执行时可实现如权利要求1-6任一项所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(上海)科技有限公司,未经创新奇智(上海)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310460973.2/1.html,转载请声明来源钻瓜专利网。