[发明专利]一种轻量化的物流包裹目标检测模型在审

专利信息
申请号: 202210952157.9 申请日: 2022-08-09
公开(公告)号: CN115375937A 公开(公告)日: 2022-11-22
发明(设计)人: 张国伟;孔洋洋;王力;刘智超 申请(专利权)人: 厦门理工学院
主分类号: G06V10/764 分类号: G06V10/764;G06V10/82;G06V10/25;G06V10/40;G06N3/04;G06N3/08;G06Q10/08
代理公司: 哈尔滨龙科专利代理有限公司 23206 代理人: 李智慧
地址: 361024 福*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 量化 物流 包裹 目标 检测 模型
【权利要求书】:

1.一种轻量化的物流包裹目标检测模型,其特征在于所述模型由input模块、backbone模块、neck模块和prediction模块四部分构成,其中:

所述input模块是图像数据的输入端,用于将物流运输线上采集的尺寸为752×480的3通道图像数据处理成640×640×3的图像数据;

所述backbone模块用于提取input模块输出的图像数据的物流包裹特征;

所述neck模块用于对backbone模块提取的物流包裹特征进行混合和组合;

所述prediction模块用于处理neck模块获取的图像特征,并对目标类别和边界框进行预测并输出。

2.根据权利要求1所述的轻量化的物流包裹目标检测模型,其特征在于所述backbone模块由第0层~第6层构成,neck模块由第7层~第18层构成,第15层和第18层分别作为prediction模块的中目标检测层和大目标检测层;

所述第0层为CBRM层,input模块输出的640×640×3图像数据作为第0层的输入,第0层输出的160×160×8图像数据作为第1层的输入;

所述第1层为Shuffle-Block层,步长s=2,第1层的输入图像数据大小为160×160×8,第1层输出的80×80×64图像数据作为第2层的输入;

所述第2层为C3-Lite层,使用了3个Bottleneck结构,C3-Lite层的步长s=1,第2层的输入图像数据大小为80×80×64,第2层输出的80×80×64图像数据同时作为第3层和第13层的输入;

所述第3层为Shuffle-Block层,步长s=2,第3层输入的图像数据大小为80×80×64,第3层输出的40×40×128图像数据作为第4层的输入;

所述第4层为C3-Lite层,使用了7个Bottleneck结构,C3-Lite层的步长s=1,第4层的输入图像数据大小为40×40×128,第4层输出的40×40×128图像数据同时作为第5层和第9层的输入;

所述第5层为Shuffle-Block层,步长s=2,第5层的输入图像数据大小为40×40×128,第5层输出的20×20×256图像数据作为第6层的输入;

所述第6层为C3-Lite层,使用了3个Bottleneck结构,C3-Lite层的步长s=1,第6层的输入图像数据大小为20×20×256,第6层输出的20×20×256图像数据作为第7层的输入;

所述第7层为Conv层,第7层的输入图像数据大小为20×20×256,第7层输出的20×20×128图像数据同时作为第8层和第17层的输入;

所述第8层为上采样,第8层的输入图像数据大小为20×20×128,第8层输出的40×40×128图像数据作为第9层的输入;

所述第9层为Concat层,第9层的输入图像大小为40×40×128+40×40×128,第9层输出的40×40×256图像数据作为第10层的输入;

所述第10层为C3层,第10层的输入图像大小为40×40×256,第10层输出的40×40×128图像数据作为第11层输入;

所述第11层为Conv层,第11层的输入图像大小为40×40×128,第11层输出的40×40×64图像数据作为第12层的输入;

所述第12层为上采样层,第12层的输入图像大小为40×40×64,第12层输出的80×80×64图像数据作为第13层的输入;

所述第13层为Concat层,第13层的输入图像大小为80×80×64+80×80×64,第13层输出的80×80×128图像数据作为第14层的输入;

所述第14层为Focus层,第14层的输入图像大小为80×80×128,第14层输出的40×40×128图像数据作为第15层的输入;

所述第15层为C3层,第15层的输入图像大小为40×40×128,第15层输出的40×40×64图像数据作为第16层的输入,第15层即为prediction模块的中目标检测层;

所述第16层为Focus层,第16层的输入图像大小为40×40×64,第16层输出的20×20×64图像数据作为第17层的输入;

所述第17层为Concat层,第17层的输入图像大小为20×20×64+20×20×128,第17层输出的20×20×192图像数据作为第18层的输入;

所述第18层为C3层,第18层的输入图像大小为20×20×192,第18层输出为20×20×64,第18层即为prediction模块的大目标检测层。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门理工学院,未经厦门理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210952157.9/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top