[发明专利]一种用于语音命令词识别的深度神经网络构建方法和识别方法及装置有效
申请号: | 201911195308.5 | 申请日: | 2019-11-28 |
公开(公告)号: | CN111210815B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 赵铭;胡伟;蔡一茂 | 申请(专利权)人: | 赵铭;胡伟;蔡一茂 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L15/02;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100871 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 语音 命令 识别 深度 神经网络 构建 方法 装置 | ||
1.一种用于语音命令词识别的深度神经网络构建方法,其特征在于,包括以下步骤:
由语音命令集和干扰语音集构成训练数据,对训练数据中的每条语音进行分帧,对每帧语音提取特征参数,得到多通道的一维特征向量;
将所有多通道的一维特征向量输入CNN网络进行训练,CNN网络中部分或者全部卷积层使用一维卷积内核进行卷积操作,最终得到训练完成的用于语音命令词识别的CNN网络;
所述的对训练数据中的每条语音进行分帧,对每帧语音提取特征参数,得到多通道的一维特征向量,包括:
将一段语音分成N个语音帧,每个语音帧提取出K个特征参数,从而得到N*K个语音特征,将N*K个语音特征作为K个通道的一维特征向量,每个通道的一维向量含有N个数据。
2.根据权利要求1所述的方法,其特征在于,所述CNN网络中部分或者全部卷积层使用一维卷积内核进行卷积操作,以及激活、池化操作,生成新的多通道的一维特征向量,输入给下一层。
3.根据权利要求1所述的方法,其特征在于,所述一维卷积内核采用的一维卷积公式为:
其中,是l层的输出特征向量组Zl的第k个通道的一维特征向量,k∈[0,Kl-1],Kl是Zl的通道数目;是Zl的第k个通道的一维特征向量的第i个值;是l+1层的卷积结果Tl+1的第j个通道的一维特征向量,j∈[0,Kl+1-1],Kl+1是Tl+1的通道数目;是一维卷积内核Wl+1的系数,对应第l+1层第k个输入通道,第j个输出通道;b是偏移值;x∈[-x0,x1],x0,x1决定卷积操作的范围,对于输入的卷积操作的范围是从位置(i-x0)到位置(i+x1)。
4.根据权利要求1所述的方法,其特征在于,通过梯度下降法和反向传播方式更新CNN网络的网络参数,多次迭代以后得到最终的网络参数。
5.根据权利要求1所述的方法,其特征在于,定义识别集合={{语音命令集},“干扰语音”,“无声”},所述CNN网络的识别结果对应所述识别集合中“无声”、“干扰语音”、或者某个语音命令之一。
6.一种用于语音命令词识别的深度神经网络构建装置,其特征在于,包括:
特征提取模块,负责对由语音命令集和干扰语音集构成的训练数据中的每条语音进行分帧,对每帧语音提取特征参数,得到多通道的一维特征向量;所述对由语音命令集和干扰语音集构成的训练数据中的每条语音进行分帧,对每帧语音提取特征参数,得到多通道的一维特征向量,包括:将一段语音分成N个语音帧,每个语音帧提取出K个特征参数,从而得到N*K个语音特征,将N*K个语音特征作为K个通道的一维特征向量,每个通道的一维向量含有N个数据;
网络训练模块,负责将所有多通道的一维特征向量输入CNN网络进行训练,CNN网络中部分或者全部卷积层使用一维卷积内核进行卷积操作,最终得到训练完成的用于语音命令词识别的CNN网络。
7.一种语音命令识别方法,其特征在于,包括以下步骤:
将待识别的语音分成N个语音帧,每个语音帧提取出K个特征参数,从而得到N*K个语音特征;
将提取的N*K个语音特征输入至权利要求1~5中任一权利要求所述方法构建的CNN网络,得到语音命令词识别标签。
8.一种语音命令识别装置,其特征在于,包括:
特征提取模块,负责将待识别的语音分成N个语音帧,每个语音帧提取出K个特征参数,从而得到N*K个语音特征;
识别模块,负责将提取的N*K个语音特征输入至权利要求1~5中任一权利要求所述方法构建的CNN网络,得到语音命令词识别标签。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1~5、7中任一项所述方法的指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赵铭;胡伟;蔡一茂,未经赵铭;胡伟;蔡一茂许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911195308.5/1.html,转载请声明来源钻瓜专利网。