[发明专利]一种轻量化的物流包裹目标检测模型在审
申请号: | 202210952157.9 | 申请日: | 2022-08-09 |
公开(公告)号: | CN115375937A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 张国伟;孔洋洋;王力;刘智超 | 申请(专利权)人: | 厦门理工学院 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06V10/25;G06V10/40;G06N3/04;G06N3/08;G06Q10/08 |
代理公司: | 哈尔滨龙科专利代理有限公司 23206 | 代理人: | 李智慧 |
地址: | 361024 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 量化 物流 包裹 目标 检测 模型 | ||
1.一种轻量化的物流包裹目标检测模型,其特征在于所述模型由input模块、backbone模块、neck模块和prediction模块四部分构成,其中:
所述input模块是图像数据的输入端,用于将物流运输线上采集的尺寸为752×480的3通道图像数据处理成640×640×3的图像数据;
所述backbone模块用于提取input模块输出的图像数据的物流包裹特征;
所述neck模块用于对backbone模块提取的物流包裹特征进行混合和组合;
所述prediction模块用于处理neck模块获取的图像特征,并对目标类别和边界框进行预测并输出。
2.根据权利要求1所述的轻量化的物流包裹目标检测模型,其特征在于所述backbone模块由第0层~第6层构成,neck模块由第7层~第18层构成,第15层和第18层分别作为prediction模块的中目标检测层和大目标检测层;
所述第0层为CBRM层,input模块输出的640×640×3图像数据作为第0层的输入,第0层输出的160×160×8图像数据作为第1层的输入;
所述第1层为Shuffle-Block层,步长s=2,第1层的输入图像数据大小为160×160×8,第1层输出的80×80×64图像数据作为第2层的输入;
所述第2层为C3-Lite层,使用了3个Bottleneck结构,C3-Lite层的步长s=1,第2层的输入图像数据大小为80×80×64,第2层输出的80×80×64图像数据同时作为第3层和第13层的输入;
所述第3层为Shuffle-Block层,步长s=2,第3层输入的图像数据大小为80×80×64,第3层输出的40×40×128图像数据作为第4层的输入;
所述第4层为C3-Lite层,使用了7个Bottleneck结构,C3-Lite层的步长s=1,第4层的输入图像数据大小为40×40×128,第4层输出的40×40×128图像数据同时作为第5层和第9层的输入;
所述第5层为Shuffle-Block层,步长s=2,第5层的输入图像数据大小为40×40×128,第5层输出的20×20×256图像数据作为第6层的输入;
所述第6层为C3-Lite层,使用了3个Bottleneck结构,C3-Lite层的步长s=1,第6层的输入图像数据大小为20×20×256,第6层输出的20×20×256图像数据作为第7层的输入;
所述第7层为Conv层,第7层的输入图像数据大小为20×20×256,第7层输出的20×20×128图像数据同时作为第8层和第17层的输入;
所述第8层为上采样,第8层的输入图像数据大小为20×20×128,第8层输出的40×40×128图像数据作为第9层的输入;
所述第9层为Concat层,第9层的输入图像大小为40×40×128+40×40×128,第9层输出的40×40×256图像数据作为第10层的输入;
所述第10层为C3层,第10层的输入图像大小为40×40×256,第10层输出的40×40×128图像数据作为第11层输入;
所述第11层为Conv层,第11层的输入图像大小为40×40×128,第11层输出的40×40×64图像数据作为第12层的输入;
所述第12层为上采样层,第12层的输入图像大小为40×40×64,第12层输出的80×80×64图像数据作为第13层的输入;
所述第13层为Concat层,第13层的输入图像大小为80×80×64+80×80×64,第13层输出的80×80×128图像数据作为第14层的输入;
所述第14层为Focus层,第14层的输入图像大小为80×80×128,第14层输出的40×40×128图像数据作为第15层的输入;
所述第15层为C3层,第15层的输入图像大小为40×40×128,第15层输出的40×40×64图像数据作为第16层的输入,第15层即为prediction模块的中目标检测层;
所述第16层为Focus层,第16层的输入图像大小为40×40×64,第16层输出的20×20×64图像数据作为第17层的输入;
所述第17层为Concat层,第17层的输入图像大小为20×20×64+20×20×128,第17层输出的20×20×192图像数据作为第18层的输入;
所述第18层为C3层,第18层的输入图像大小为20×20×192,第18层输出为20×20×64,第18层即为prediction模块的大目标检测层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门理工学院,未经厦门理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210952157.9/1.html,转载请声明来源钻瓜专利网。