[发明专利]基于深度学习的标记识别方法和训练方法及其系统和电子设备在审
申请号: | 202010022240.7 | 申请日: | 2020-01-09 |
公开(公告)号: | CN113095347A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 孙俊;蒋坤君;胡增新 | 申请(专利权)人: | 舜宇光学(浙江)研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T7/11;G06T7/13;G06T7/70;G06T7/80 |
代理公司: | 宁波理文知识产权代理事务所(特殊普通合伙) 33244 | 代理人: | 罗京;孟湘明 |
地址: | 310052 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 标记 识别 方法 训练 及其 系统 电子设备 | ||
1.基于深度学习的标记识别方法,其特征在于,包括步骤:
获取一原始标记图像,其中该原始标记图像是经由图像采集设备拍摄标记而获得的图像;和
将该原始标记图像输入至预先训练好的且基于多任务级联卷积网络构建的标记识别模型中进行标记识别,以输出该标记的边框和关键点在该原始标记图像上的位置,从而实现该标记的识别。
2.如权利要求1所述的基于深度学习的标记识别方法,其中,所述获取一原始标记图像,其中该原始标记图像是经由图像采集设备拍摄标记而获得的图像的步骤,包括步骤:
预处理该原始标记图像,以生成图像金字塔,其中该图像金字塔包括不同尺寸的预处理图像;
将该图像金字塔中的该预处理图像逐个输入至该标记识别模型的推荐网络,以生成该标记的该边框在该原始标记图像上的多个候选区域;
将该候选区域和该原始标记图像输入至该标记识别模型的优化网络,以生成该标记的该边框在该原始标记图像上的优化区域;以及
将该优选区域和该原始标记图像输入至该标记识别模型的输出网络,以输出该标记的边框坐标和关键点坐标。
3.如权利要求2所述的基于深度学习的标记识别方法,其中,所述将该候选区域和该原始标记图像输入至该标记识别模型的优化网络,以生成该标记的该边框在该原始标记图像上的优化区域的步骤,包括步骤:
根据该候选区域,对该原始标记图像进行裁剪并调整至第一预定尺寸,以得到相应的候选图像;和
通过该优化网络,对该候选图像进行优化处理,以在过滤并调整该候选区域后,获得该优化区域。
4.如权利要求3所述的基于深度学习的标记识别方法,其中,所述将该优选区域和该原始标记图像输入至该标记识别模型的输出网络,以输出该标记的边框坐标和关键点坐标的步骤,包括步骤:
根据该优化区域,对该原始标记图像进行裁剪并调整至第二预定尺寸,以得到相应的优化图像;和
通过该优化网络,对该优化图像进行边框回归和关键点定位处理,以确定该标记的该边框和该关键点分别在该原始标记图像上的真实位置。
5.如权利要求4所述的基于深度学习的标记识别方法,其中,所述第一预定尺寸为24*24;并且所述第二预定尺寸为48*48。
6.如权利要求1至5中任一所述的基于深度学习的标记识别方法,其中,该图像采集设备是选自相机、机器视觉设备以及AR设备中的一种。
7.标记识别模型的训练方法,其特征在于,包括步骤:
获取多个标记图像的标注样本;和
基于该标记图像的标注样本,训练一标记识别模型中的推荐网络、优化网络以及输出网络。
8.如权利要求7所述的标记识别模型的训练方法,其中,所述基于该标记图像的标注样本,训练一标记识别模型中的推荐网络、优化网络以及输出网络的步骤,包括步骤:
对原始标记图像进行图像增强处理,以得到多个该标记图像;和
将该标记图像融合至目标检测样本的检测框内,以生成大量的该标注样本。
9.基于深度学习的标记识别系统,用于识别原始标记图像中的标记,其特征在于,其中所述基于深度学习的标记识别系统包括相互可通信地连接的:
一获取模块,用于获取该原始标记图像,其中该原始标记图像是经由图像采集设备拍摄标记而获得的图像;和
一标记识别模块,用于将该原始标记图像输入至预先训练好的且基于多任务级联卷积网络构建的标记识别模型中进行标记识别,以输出该标记的边框和关键点在该原始标记图像上的位置,从而实现该标记的识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于舜宇光学(浙江)研究院有限公司,未经舜宇光学(浙江)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010022240.7/1.html,转载请声明来源钻瓜专利网。