[发明专利]目标对象识别方法、装置、系统和计算机可读介质在审
申请号: | 201710898022.8 | 申请日: | 2017-09-28 |
公开(公告)号: | CN108875486A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 林浩彬 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟;卜璐璐 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标对象识别 计算机可读介质 模糊图像 模糊神经网络 目标对象 特征提取 图像 模糊处理 准确率 模糊 清晰 | ||
1.一种目标对象识别方法,其特征在于,所述目标对象识别方法包括:
获取待识别图像;
利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像;以及
基于所述去模糊图像进行目标对象的特征提取和识别。
2.根据权利要求1所述的目标对象识别方法,其特征在于,所述利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像包括:
利用所述去模糊神经网络得到所述待识别图像的重建残差,并将所述重建残差与所述待识别图像相加以得到所述去模糊图像。
3.根据权利要求2所述的目标对象识别方法,其特征在于,所述去模糊神经网络包括依次连接的输入层、第一卷积层、至少一层卷积池化层、至少一层反池化卷积层以及第四卷积层,其中:
所述第一卷积层输出与原始输入图像尺寸相同的第一特征层;
所述卷积池化层包括依次连接的第二卷积层和池化层,所述卷积池化层输出与所述原始输入图像相比尺寸按比例缩小的第二特征层;
所述反池化卷积层包括依次连接的反池化层和第三卷积层,所述反池化卷积层输出按比例增大的第三特征层,所述至少一层反池化卷积层中的最后一层反池化卷积层输出的第三特征层的尺寸与所述原始输入图像的尺寸相同;以及
所述第四卷积层输出重建残差,所述重建残差与原始输入图像相加的结果为重建的去模糊图像。
4.根据权利要求3所述的目标对象识别方法,其特征在于,所述卷积池化层与所述反池化卷积层的数目相等。
5.根据权利要求3所述的目标对象识别方法,其特征在于,所述去模糊神经网络还包括跳跃连接,所述跳跃连接用于将相同尺寸的特征层拼接在一起。
6.根据权利要求5所述的目标对象识别方法,其特征在于,所述去模糊神经网络还包括第五卷积层,所述第五卷积层所述反池化卷积层连接,用于减少因所述特征层的拼接而导致增加的通道数。
7.根据权利要求1-6中的任一项所述的目标对象识别方法,其特征在于,所述去模糊神经网络的训练所基于的样本是模糊图像集,所述模糊图像集中的模糊图像是通过对包括目标对象的清晰图像实施图像模糊算法而得到的。
8.根据权利要求1-6中的任一项所述的目标对象识别方法,其特征在于,所述基于所述去模糊图像进行目标对象的特征提取和识别,包括:
基于所述去模糊图像和特征提取网络进行所述目标对象的特征提取和识别。
9.根据权利要求8所述的目标对象识别方法,其特征在于,所述训练好的去模糊神经网络与所述特征提取网络连在一起,所述去模糊神经网络与所述特征提取网络被进行共同调优训练,以用于所述目标对象的识别。
10.根据权利要求1-6中的任一项所述的目标对象识别方法,其特征在于,所述目标对象为人脸。
11.一种目标对象识别装置,其特征在于,所述目标对象识别装置包括:
获取模块,用于获取待识别图像;
去模糊模块,用于利用训练好的去模糊神经网络对所述获取模块获取到的所述待识别图像进行去模糊操作以生成去模糊图像;以及
识别模块,用于基于所述去模糊模块生成的所述去模糊图像进行目标对象的特征提取和识别。
12.根据权利要求11所述的目标对象识别装置,其特征在于,所述去模糊模块进一步用于:
利用所述去模糊神经网络得到所述获取模块获取到的所述待识别图像的重建残差,并将所述重建残差与所述待识别图像相加以得到所述去模糊图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710898022.8/1.html,转载请声明来源钻瓜专利网。