[发明专利]模式识别方法及装置有效
申请号: | 201510245631.4 | 申请日: | 2015-05-14 |
公开(公告)号: | CN104794501B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 胡晓林;梁鸣 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京展翅星辰知识产权代理有限公司 11693 | 代理人: | 王文生 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式识别 方法 装置 | ||
本发明提供了一种模式识别方法及装置,其中模式识别方法包括:接收待识别数据;利用基于具有递归卷积层的卷积神经网络训练得到的模式识别模型对所述待识别数据进行模式识别;其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络。本申请中使用的具有递归卷积层的卷积神经网络其能够充分融入上下文信息,并在保持参数数量不变的情况下增加网络的深度,因此本申请有效提高了模式识别的准确性。
技术领域
本发明涉及计算机领域,尤其涉及一种模式识别方法及装置。
背景技术
模式识别是用于对输入的模式进行识别,输出该模式的类别。例如包括但不限于:人脸识别,手势识别,交通标志识别,语音识别等。
现有技术的模式识别方法是基于神经网络进行训练,得到模式识别模型,利用训练得到的模式识别模型来识别模式的类别。其中,利用卷积神经网络(CNN,ConvolutionalNeural Network)训练模式识别模型是比较常见的一种训练方法。但是,发明人发现利用已有的卷积神经网络进行模式识别模型的训练至少存在如下问题:
首先,由于卷积神经网络是纯前馈结构,在识别时无法充分融入上下文信息,而上下文信息则对识别效果有重要的影响。
另外,网络深度大小对识别性能影响较大,识别准确率会随深度增加而增加,而卷积神经网络的卷积层深度固定为1,要想增加网络深度,只能增加卷积层的个数,但这样做会增加模型的参数数量,可能导致过拟合,因此,受网络深度影响基于目前的卷积神经网络训练得到的模式识别模型的识别准确率难以保证。
因此,利用基于已有的卷积神经网络训练得到的模式识别模型进行模式识别的准确率较低。
发明内容
本发明解决的技术问题之一是提供一种模式识别方法及装置,有效提高模式识别准确率。
根据本发明一方面的一个实施例,提供了一种模式识别方法,包括:
接收待识别数据;
利用基于具有递归卷积层的卷积神经网络训练得到的模式识别模型对所述待识别数据进行模式识别;
其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络。
根据本发明另一方面的一个实施例,提供了一种模式识别装置,包括:
接收单元,用于接收待识别数据;
模式识别单元,用于利用基于具有递归卷积层的卷积神经网络训练得到的模式识别模型对所述待识别数据进行模式识别;
其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络。
本申请实施例的模式识别方法由于使用基于具有递归卷积层的卷积神经网络训练得到的模式识别模型进行模式识别,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络,该具有递归卷积层的卷积神经网络其能够充分融入上下文信息,并在保持参数数量不变的情况下增加网络的深度,有效提高了模式识别的准确性。
本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本发明并不仅限于这些实施例。而是,本发明的范围是广泛的,且意在仅通过后附的权利要求限定本发明的范围。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是根据本发明一个实施例的利用层内递归卷积神经网络训练模型示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510245631.4/2.html,转载请声明来源钻瓜专利网。