[发明专利]基于隐式欧拉跳跃连接的残差神经网络的图像识别方法有效
申请号: | 202010133492.7 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111401155B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 林宙辰;李明杰;何翎申 | 申请(专利权)人: | 北京大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/56;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐式欧拉 跳跃 连接 神经网络 图像 识别 方法 | ||
本发明公布了一种基于隐式欧拉跳跃连接的残差神经网络的图像识别方法,将隐式欧拉数值方法与残差网络模型中的跳跃连接相结合,建立具有更强鲁棒性的改进模型:含有隐式欧拉跳跃连接的残差神经网络,该改进模型的输入为图像数据及所对应的标签,输出为图像的预测分类,由此实现更加稳定的图像识别。本发明提出的基于含有隐式欧拉跳跃连接的残差神经网络的图像识别方法,具有更强的鲁棒性和可信性,可提高图像识别的准确性和有效性,可应用在如人脸识别、文字识别等多种图像识别场景。
技术领域
本发明涉及深度神经网络结构设计技术和图像识别技术领域,尤其涉及一种基于含有隐式欧拉跳跃连接(IE-Skips,即Implicit Euler Skip Connections)的残差神经网络模型进行图像识别的方法,可以应用在如人脸识别、文字识别等多种图像识别场景。
背景技术
随着近年来图像处理器(GPU)计算能力的飞速发展,以及人们能获得的数据量越来越大,深度神经网络在计算机视觉、图像处理和自然语言处理等领域获得了广泛应用。自从2012年深度神经网络在ImageNet分类任务上取得了突破性进展之后,研究者提出了多种不同网络,并且其结构不局限于经典的前馈神经网络结构。在前馈网络结构中,每个神经元只和其后的神经元相连。其中最典型的例子就是文献[1](He,K.,Zhang,X.,Ren,S.,andSun,J.Deep residual learning for image recognition.In CVPR,2015)记载的ResNet(即残差神经网络),残差神经网络在传统的前馈网络结构上增加了旁支,显著提高了神经网络的性能。
基于此网络模型的图像识别方法也在图像识别的相关领域取得了显著的成果,比如在自动驾驶、人脸识别、图像识别、检测等等。与过去的传统方法相比,基于此网络模型的图像识别方法有着很大的优势。但是这一网络结构在鲁棒性上存在较大问题,其预测结果极易被对抗攻击所干扰。而在实际应用,由于相机、传感器等条件的限制,需要处理的图像常常受到“污染”(即存在某些数值扰动或者数值噪声),因此神经网络在安全相关的领域的应用发展也因此受到了限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010133492.7/2.html,转载请声明来源钻瓜专利网。