[发明专利]循环神经网络的学习方法及用于该学习方法的计算机程序、和声音识别装置有效
申请号: | 201680027062.9 | 申请日: | 2016-05-10 |
公开(公告)号: | CN107615308B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 神田直之 | 申请(专利权)人: | 国立研究开发法人情报通信研究机构 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G10L15/06;G10L15/16 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 高颖 |
地址: | 日本国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 循环 神经网络 学习方法 用于 计算机 程序 声音 识别 装置 | ||
1.一种用于声音识别的循环神经网络RNN的学习方法,是使用预先准备的连续的时间序列的声音数据的学习数据由计算机进行的RNN的学习方法,
所述学习数据包含各自由学习对象数据的特征量和参考值构成的矢量的序列,
所述学习方法包含:
将所述RNN初始化的步骤;
第1指定步骤,将所述矢量的序列内的某矢量指定为学习开始位置;和
学习步骤,将所述RNN的各参数最佳化,以使得针对所述学习数据计算的给定的误差函数最小化,由此进行所述RNN的学习,
所述学习步骤包含:
更新步骤,使用所述矢量的序列当中的以被指定的矢量为末尾的连续的N个矢量和被指定的所述矢量的N步前的所述RNN的隐含层的输出,通过将针对所述末尾的矢量的输出的参考值设为正解标签的Truncated BPTT来进行所述RNN的参数的更新,其中,N是3以上的整数;和
第1重复步骤,直到预先确定的结束条件成立为止,都重复以下处理,即,从所述矢量的序列中新指定相对于所述更新步骤中使用的所述N个矢量的末尾的矢量处于满足给定的关系的位置的矢量来执行所述学习步骤的处理,
处于满足所述给定的关系的位置的矢量是从所述第1指定步骤中的所述被指定的矢量起在所述矢量的序列中至少2个以上后的矢量,
所述RNN的学习方法还包含:
第2重复步骤,响应于所述第1重复步骤中判定为所述结束条件成立这一情况,一边将从所述某矢量起1个接1个后的矢量指定为新的学习开始位置,一边重复执行所述学习步骤,直到指定了从所述某矢量起N-1个后的矢量的处理结束为止。
2.根据权利要求1所述的RNN的学习方法,其中,
处于满足所述给定的关系的位置的矢量是在所述矢量的序列中从所述N个矢量的末尾的矢量起处于N个后的位置的矢量。
3.根据权利要求1或2所述的RNN的学习方法,其中,
所述RNN的学习方法还包含:
第2指定步骤,响应于所述第1重复步骤中判定为所述结束条件成立这一情况,将从所述第1指定步骤中指定的所述矢量起比所述N小的数目后的矢量新指定为下一次学习的开始位置;和
执行所述学习步骤直到所述结束条件成立为止的步骤。
4.一种记录介质,记录有计算机程序,该计算机程序使计算机执行权利要求1~3中任一项所述的RNN的学习方法的全部步骤。
5.一种声音识别装置,包含:
帧化处理单元,对所输入的声音信号以给定移位量以及给定帧长进行帧化;
特征量提取单元,从所述帧化处理单元输出的各帧的声音信号中提取给定的声音特征量,并将特征量矢量输出;
声学模型,由RNN构成,将由所述特征量提取单元输出的特征量矢量的序列作为输入,每当被输入特征量矢量时,就通过权利要求1~3中任一项所述的学习方法进行学习,以便输出以与该特征量矢量对应的帧的声音是所设想的音素的集合的各要素的概率作为要素的矢量;和
声音识别解码器,通过使用了所述声学模型输出的矢量的序列和统计语言模型的概率性的处理来输出生成所述声音信号的似然性最高的单词串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国立研究开发法人情报通信研究机构,未经国立研究开发法人情报通信研究机构许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680027062.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:神经形态处理设备
- 下一篇:用于实时预订停车位的系统和方法