[发明专利]模式识别方法及装置有效
申请号: | 201510245631.4 | 申请日: | 2015-05-14 |
公开(公告)号: | CN104794501B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 胡晓林;梁鸣 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京展翅星辰知识产权代理有限公司 11693 | 代理人: | 王文生 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模式识别 方法 装置 | ||
1.一种模式识别方法,其特征在于,包括:
接收待识别数据,所述待识别数据为一张图片;
利用具有递归卷积层的卷积神经网络训练得到的模式识别模型对所述待识别数据进行模式识别;
其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合卷积层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络,
所述前馈输入具体表示为:
其中,u(i,j)表示向量化的前一层特征图上以(i,j)为中心的局部单元的响应,表示向量化的前馈输入的权值;
所述卷积层内递归输入具体表示为:
其中,x(i,j)(t-1)表示上一时间步当前层特征图上以(i,j)为中心的局部单元的响应,表示向量化的层内递归输入的权值,T表示转置,t表示时间值,且t≤N,其中N表示总时间步数;
所述模式识别包括以下任一项:
人脸识别、手势识别、交通标志识别。
2.如权利要求1所述的方法,其特征在于,所述总输入用公式表示为:
其中,zijk(t)表示总输入,bk为偏差值。
3.如权利要求2所述的方法,其特征在于,对所述总输入进行非线性激发用公式表示为:
xijk(t)=f(zijk)(t),其中,xijk(t)表示当前时间步单元的响应,f为非线性激发函数。
4.一种模式识别装置,其特征在于,包括:
接收单元,用于接收待识别数据,所述待识别数据为一张图片;
模式识别单元,用于利用具有递归卷积层的卷积神经网络训练得到的模式识别模型对所述待识别数据进行模式识别;
其中,所述具有递归卷积层的卷积神经网络为在前馈输入基础上结合卷积层内递归输入,得到总输入,并对所述总输入进行非线性激发的神经网络,
所述前馈输入具体表示为:
其中,u(i,j)表示向量化的前一层特征图上以(i,j)为中心的局部单元的响应,表示向量化的前馈输入的权值;
所述卷积层内递归输入具体表示为:
其中,x(i,j)(t-1)表示上一时间步当前层特征图上以(i,j)为中心的局部单元的响应,表示向量化的层内递归输入的权值,T表示转置,t表示时间值,且t≤N,其中N表示总时间步数;
所述模式识别包括以下任一项:
人脸识别、手势识别、交通标志识别。
5.如权利要求4所述的装置,其特征在于,所述总输入用公式表示为:
其中,zijk(t)表示总输入,bk为偏差值。
6.如权利要求5所述的装置,其特征在于,所述对所述总输入进行非线性激发用公式表示为:
xijk(t)=f(zijk)(t),其中,xijk(t)表示当前时间步单元的响应,f为非线性激发函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510245631.4/1.html,转载请声明来源钻瓜专利网。