[发明专利]目标检测、轨迹跟踪方法、模型及其电子设备有效
申请号: | 202110622443.4 | 申请日: | 2021-06-04 |
公开(公告)号: | CN113096159B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 李圣权;毛云青;盛小娟;张香伟;王国梁 | 申请(专利权)人: | 城云科技(中国)有限公司 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 无锡市汇诚永信专利代理事务所(普通合伙) 32260 | 代理人: | 倪杨 |
地址: | 310052 浙江省杭州市滨江区长*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 轨迹 跟踪 方法 模型 及其 电子设备 | ||
1.一种目标检测方法,其特征在于,包括以下步骤:
获取待处理视频帧,提取所述待处理视频帧的第一特征图;
所述第一特征图作为空洞编码模块中的输入,通过所述空洞编码模块的投影层进行卷积处理获得第二特征图, 所述投影层对所述第一特征图进行降维后再卷积,提取所述第一特征图的上下语义信息,其中所述第二特征图的特征通道数被降低;
将所述第二特征图通过堆叠所述空洞编码模块的不同扩张因子的多个残差块生成具有多感受野的第三特征图,其中每一所述残差块包括一个用于减少特征通道的1*1卷积核、一个用于增大感受野的3*3空洞卷积核和一个用于扩充特征通道数的1*1卷积核,经每个所述残差块处理后的特征通道数不变,且每一所述残差块中的3*3空洞卷积核的空洞率不同;
所述第三特征图作为对应的预测网络的输入,输出预测结果。
2.根据权利要求1所述的目标检测方法,其特征在于,“将所述第一特征图通过投影层进行卷积处理获得第二特征图”中,所述投影层包括依次相连的1*1卷积和3*3卷积。
3.根据权利要求1所述的目标检测方法,其特征在于,“将所述第二特征图通过堆叠所述空洞编码模块的不同扩张因子的多个残差块生成具有多感受野的第三特征图,”中,不同扩张因子的多个所述残差块依次堆叠,且所述残差块的空洞卷积的空洞率依次序增加。
4.根据权利要求1所述的目标检测方法,其特征在于,“所述第三特征图作为对应的预测网络的输入,输出预测结果”中,所述预测网络包括分类子网络和回归子网络,所述回归子网络生成目标框及目标性预测得分,所述目标性预测得分乘以所述分类子网络的输出得到所述目标框的分类得分。
5.根据权利要求1所述的目标检测方法,其特征在于,包括多层空洞编码模块和预测网络,位于上层的空洞编码模块输出的输出特征图作为位于神经网络下层的空洞编码模块的输入特征图,对应每层的预测网络输出对应的预测结果,所述预测结果包括至少一目标框,多层预测网络的预测结果通过非极大值抑制选出和标签损失最小的目标框。
6.根据权利要求5所述的目标检测方法,其特征在于,“多层预测网络的预测结果通过非极大值抑制选出和标签损失最小的目标框”包括:根据不同尺寸的目标在每层所述预测网络的所述第三特征图上进行单元格划分,根据当前数据聚类结果进行候选框的分配,如果所述当前数据聚类结果显示大尺寸的目标数据多,在所述第三特征图上分配大于标准数量的所述候选框,在所述第三特征图上逐所述单元格去遍历所述第三特征图,最终得到所述目标框。
7.一种目标轨迹跟踪方法,其特征在于,包括以下步骤:
获取待处理视频帧,提取所述待处理视频帧的第一特征图;
所述第一特征图作为空洞编码模块中的输入,通过所述空洞编码模块的投影层进行卷积处理获得第二特征图,所述投影层对所述第一特征图进行降维后再卷积,提取所述第一特征图的上下语义信息,其中所述第二特征图的特征通道数被降低;
将所述第二特征图通过堆叠所述空洞编码模块的不同扩张因子的多个残差块生成具有多感受野的第三特征图,其中每一所述残差块包括一个用于减少特征通道的1*1卷积核、一个用于增大感受野的3*3空洞卷积核和一个用于扩充特征通道数的1*1卷积核,经每个残差块处理后的特征通道数,且每一所述残差块中的3*3空洞卷积核的空洞率不同;
将所述第三特征图输入LSTM模块中,标记跟踪目标得到对应的第四特征图;
将所述第四特征图输入预测网络中输出预测结果,其中所述预测结果至少包括目标运动轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于城云科技(中国)有限公司,未经城云科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110622443.4/1.html,转载请声明来源钻瓜专利网。