[发明专利]一种基于深度学习的工件目标识别方法在审
申请号: | 202111611355.0 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114445617A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 朱江英;汪仕宇;陆东超;王桥会 | 申请(专利权)人: | 宁波韵升智能技术有限公司;宁波韵升智能软件有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 方小惠 |
地址: | 315040 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 工件 目标 识别 方法 | ||
本发明公开了一种基于深度学习的工件目标识别方法,通过在mask R‑CNN基础上改进而得到Mobile‑Mask R‑CNN进行目标识别,具有三个改进点:一、mask R‑CNN的ResNet网络被MobileNetV3子网络替换,MobileNetV3子网络通过MobileNetV3的瓶颈层来构建;二、对Mask R‑CNN的RPN网络中用于生成大小为7×7的提议框的ROIAlign运算进行修改,使其用于生成大小为9×9的提议框;三、ROIAlign运算生成的提议框区域的特征图不直接输入mask R‑CNN的全连接层进行分类和回归,而是先进行空洞卷积后再输入mask R‑CNN的全连接层进行分类和回归;优点是识别速度和识别精度均较高,鲁棒性较强。
技术领域
本发明涉及一种工件目标识别方法,尤其是涉及一种基于深度学习的工件目标识别方法。
背景技术
随着“中国制造2025”的不断推进,智能化工业机器人的应用场合变得更加广泛。例如,越来越多的企业将以往工厂中通过员工手动完成的分拣任务交给机器人去完成,大大节约了企业的劳动成本,提高了产品的生产效率,从而提高公司的经济效益。而其中,视觉识别检测系统与机器人技术相结合作为机器人智能化主要手段之一,也是实现机器人智能分拣抓取的核心技术。
在实际生产工况中,物体除了被置于各种背景下,还会受到各种其他的诸如环境的影响。视觉识别检测系统采用深度学习的方式识别图像,需要具有良好的鲁棒性,以实现能够在遮挡下以及较多噪声下都能准确识别的目的。目前已出现了多种图像识别方法,比如,肖武艺采用轻量级的卷积神经网络MobileNetV2这一轻量化网络应用在移动端或嵌入式的设备中,该网络具有结构简单,需求计算力小的特点,资源消耗低,小尺寸,推理速度较快等优势,因此能很好的平衡准确度和模型大小的问题,但是对于无遮挡和小面积遮挡(30%以下)的准确率分别不足90%和85%,且不能分别识别出有多个目标工件的图像,鲁棒性不强。在对其他特定物体的目标识别上,虞晓霞等人改进LeNet-5模型对禁飞区的无人机进行目标识别,较传统的LeNet-5网络有提升。然而对于遮挡下以及小目标的情况下并未进行研究。孟欣欣采用ResNet152+FPN+Classier的Mask R-CNN对香梨进行识别,能有效对遮挡下的物体识别,然而存在的问题是识别的时间过长。
现有的对于图像中物体识别的研究基本都存在识别速度慢,对遮挡下的物体识别准确率不高以及鲁棒性不强的问题。而对于工件识别而言,识别速度和识别精度的提高和较强的鲁棒性有利于保障生产中的效率,都是在机器设备中所要满足的要求。
鉴此,设计一种识别速度和识别精度均较高,鲁棒性较强的基于深度学习的工件目标识别方法,对于提高工件检测效率和检测精度具有重要意义。
发明内容
本发明所要解决的技术问题是提供一种识别速度和识别精度均较高,鲁棒性较强的基于深度学习的工件目标识别方法。
本发明解决上述技术问题所采用的技术方案为:一种基于深度学习的工件目标识别方法,通过构建工件的图片数据集对神经网络模型进行训练,然后采用神经网络模型对待识别的工件图片进行推理,得出标出工件位置和预测类别的工件图片输出,将所述的神经网络模型称为Mobile-Mask R-CNN,所述的Mobile-Mask R-CNN通过在mask R-CNN基础上进行改进而得到,所述的Mobile-Mask R-CNN相对于所述的mask R-CNN,除了以下三个改进点之外,其他结构保持不变,三个改进点具体为:一、mask R-CNN的ResNet网络被MobileNetV3子网络替换,即通过MobileNetV3子网络将待识别工件的原始图片转换为相应的特征图后作为FPN网络的输入,MobileNetV3子网络通过MobileNetV3的瓶颈层来构建;二、对Mask R-CNN的RPN网络中用于生成大小为7×7的提议框的ROIAlign运算进行修改,使其用于生成大小为9×9的提议框;三、ROIAlign运算生成的提议框区域的特征图不直接输入mask R-CNN的全连接层进行分类和回归,而是先进行空洞卷积后再输入mask R-CNN的全连接层进行分类和回归。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波韵升智能技术有限公司;宁波韵升智能软件有限公司,未经宁波韵升智能技术有限公司;宁波韵升智能软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111611355.0/2.html,转载请声明来源钻瓜专利网。