[发明专利]一种图像识别方法和装置在审
申请号: | 202010306076.2 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111488944A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 刘文川 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 | ||
本发明公开了一种图像识别方法和装置,该方法包括:使用图像训练集训练网络模型,以获得卷积核权重和偏置值;采集待识别图像以执行针对网络模型的预处理,获得输入特征;根据卷积核权重构建多种卷积算子,并执行多次循环卷积,在每一次循环中分别根据当次循环的卷积核大小来选择对应的卷积算子对输入特征执行基于偏置值的卷积,并执行数据归一化和非线性映射以更新输入特征和卷积核大小,以在多次循环卷积执行完毕后最终提取输出特征;使用全连接权值矩阵处理输出特征获得预测值;基于预测值识别待识别图像。本发明能够提高计算大卷积核卷积的效率,以提高整体处理速度。
技术领域
本发明涉及神经网络领域,更具体地,特别是指一种图像识别方法和装置。
背景技术
深度学习技术在越来越多的领域中取得了突破性成果,最典型的应用是图像识别。图像识别是将目前数据集中已有的信息与输入信息进行比较,通过计算机对输入的图像进行处理分析,以识别各种不同目标。由于嵌入式的图像处理系统成本低,准确率高,已经在无人驾驶、智慧城市和人工智能等各个领域。目前被广泛使用的基于卷积神经网络的图像识别算法简单,且速度快,能够学习到更加高级的图像特征,从而提升图像识别的准确率。然而随着深度学习网络的不断加深,卷积核大导致卷积算子的计算量更大,参数更多,影响网络的训练和推理的速度,导致性能不佳。
针对现有技术中卷积神经网络中针对大卷积核的图像识别计算量大、训练和推理速度低的问题,目前尚无有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种图像识别方法和装置,能够提高计算大卷积核卷积的效率,以提高整体处理速度。
基于上述目的,本发明实施例的第一方面提供了一种图像识别方法,包括执行以下步骤:
使用图像训练集训练网络模型,以获得卷积核权重和偏置值;
采集待识别图像以执行针对网络模型的预处理,获得输入特征;
根据卷积核权重构建多种卷积算子,并执行多次循环卷积,在每一次循环中分别根据当次循环的卷积核大小来选择对应的卷积算子对输入特征执行基于偏置值的卷积,并执行数据归一化和非线性映射以更新输入特征和卷积核大小,以在多次循环卷积执行完毕后最终提取输出特征;
使用全连接权值矩阵处理输出特征获得预测值;
基于预测值识别待识别图像。
在一些实施方式中,分别根据当次循环的卷积核大小来选择对应的卷积算子对输入特征执行卷积包括:
获取当次循环的卷积核大小;
响应于卷积核大小大于等于特定阈值,而使用快速傅里叶变换加速卷积算子对输入特征执行卷积,并向卷积结果叠加偏置值;
响应于卷积核大小小于特定阈值,而将输入特征拆解为多个分段,使用Winograd卷积算子对每个分段分别执行卷积,并将卷积后的分段重新拼合。
在一些实施方式中,使用快速傅里叶变换加速卷积算子对输入特征执行卷积,并向卷积结果叠加偏置值包括:
对输入特征和偏置值进行填充以扩大其通道尺寸;
对输入特征和偏置值分别执行快速傅里叶变换;
将输入特征和偏置值在对应的通道上相乘,并将每个通道的对应位相加获得横加结果;
对横加结果执行快速傅里叶反变换;
基于步长对横加结果执行后处理并作为卷积输出。
在一些实施方式中,针对网络模型的预处理在网络模型的输入层执行;多次循环卷积分别在网络模型的多个卷积层执行;处理输出特征获得预测值在网络模型的全连接层执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010306076.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序