[发明专利]基于多任务学习的开关面板目标识别与一米线分割的方法在审
申请号: | 202211720106.X | 申请日: | 2022-12-30 |
公开(公告)号: | CN116206294A | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 包妍;由金龙;秦笠洋;孙凤波;白皓然;南麟飞;张晓;隋明良 | 申请(专利权)人: | 中建中新建设工程有限公司;青岛农业大学 |
主分类号: | G06V20/60 | 分类号: | G06V20/60;G06V10/26;G06V10/774;G06V10/778;G06V10/82;G06F30/20;G06N3/0455;G06N3/0464;G06N3/082 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 李玉宾 |
地址: | 266000 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任务 学习 开关 面板 目标 识别 一米线 分割 方法 | ||
1.基于多任务学习的开关面板目标识别与一米线分割的方法,其特征为:包括如下步骤:
步骤1、建立开关面板与建筑一米线像素级数据集;
步骤2、对图像数据集进行扩增,增强网络的泛化能力;
步骤3、构建一种建筑开关面板目标识别与建筑一米线分割相结合的轻量级多任务深度学习模型;
步骤4、利用步骤2中扩增后的图像数据集在设计的深度学习模型上进行训练;
步骤5、用训练好的模型进行目标识别与图像分割,并输出结果。
2.如权利要求1所述的基于多任务学习的开关面板目标识别与一米线分割的方法,其特征为:所述步骤2是基于几何变换和图像操作的数据增强方法,并使用随机概率和适当组合的策略对数据集进行离线数据增强,同时使用图形学技术制造仿真图像提升数据量,使用persistence of vision raytracer技术渲染大量仿真图像,保持泛化能力。
3.如权利要求2所述的基于多任务学习的开关面板目标识别与一米线分割的方法,其特征为:所述步骤2中,使用仿真图像进行数据增强的方法为:使用真实数据集中2000幅没有一米线和开关的可见光图像作为背景,在此基础上基于开关在墙面上的位置比例产生像分类标签,并且产生对应的像素分类标签,仿真过程中,使用16倍超采样抗锯齿保证仿真开关面板及一米线与真实开关面板及一米线的相似性,并增加仿真开关面板的锯齿感,降低一米线的锯齿感。
4.如权利要求3所述的基于多任务学习的开关面板目标识别与一米线分割的方法,其特征为:所述的步骤2中,使用仿真图像进行数据增强的具体方法包括:创建一个16倍边长的缓冲区,在此缓冲区中随机添加0~6个16倍的开关面板和0~1条16倍的一米线,对缓冲区高斯模糊后,选取每个16×16区域中的256个像素混合成一个像素,使得整个仿真图像中的开关面板色彩及一米线过渡趋于平滑,调整亮度并且获得对应的标签后,叠加到选取的背景图像上,就生成一幅增强图像。
5.如权利要求4所述的基于多任务学习的开关面板目标识别与一米线分割的方法,其特征为:所述步骤3设计一种建筑开关面板目标识别与建筑一米线分割相结合的轻量级多任务深度学习模型时,遵循轻量化原则,采用改进的Yolov5s网络全局共用一个编码器,该编码器由一个Backbone网络和一个Neck网络组成;输入端,采用Mosaic数据增强、自适应锚框计算,Backbone网络采用Focus结构和CSP结构,Neck网络采用FPN+SPPF结构,Prediction损失函数采用GIOU_Loss计算;解码器分为两个分支,分别为目标检测分支和分割分支,目标检测分支采用CIOU_Loss做Bounding box的损失函数,在目标检测的后处理过程中,针对很多目标框的筛选,进行nms操作,选取最合适的目标边界框;分割分支,图像分割头采用与上述检测头相同的网络结构;将FPN的底层给到分割分支,其大小为(W/8,H/8,256);经过三次上采样后输出特征图,其大小为(W,H,2),同时,上采样层使用最近插值法来减少计算成本。在具有高推理速度的同时获得高精度的输出。
6.如权利要求5所述的基于多任务学习的开关面板目标识别与一米线分割的方法,其特征为:所述的步骤3中,采用参数硬共享机制,深度学习模型由编码器结构和解码器结构组成,子任务共享编码器结构参数,解码器包含建筑开关面板识别子任务、一米线分割子任务,子任务拥有各自的参数;利用编码器网络完成对建筑开关面板位置信息和一米线边缘信息的特征提取,解码器网络完成建筑开关面板位置信息和一米线边缘信息输出。
7.如权利要求6所述的基于多任务学习的开关面板目标识别与一米线分割的方法,其特征为:所述的步骤4中,利用步骤2中扩增后的图像数据集在设计的深度学习模型上进行训练,所述的深度学习模型最大迭代步数为100000步,选用RMSProp,学习速率选用0.01,以指数形式衰减。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中建中新建设工程有限公司;青岛农业大学,未经中建中新建设工程有限公司;青岛农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211720106.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种围术期智能麻醉不良事件管理系统
- 下一篇:不锈钢管生产流水线