[发明专利]一种改进的延时神经网络声学模型有效
申请号: | 201811090966.3 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109147774B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 陈凯斌;张伟彬;徐向民 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L15/16 | 分类号: | G10L15/16 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 林梅繁 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于语音识别技术领域,涉及一种改进的延时神经网络声学模型,包括:搭建基础TDNN网络;在相邻的两层隐藏层中间添加注意力模块,得到改进后的TDNN网络;针对改进后的TDNN网络进行训练,得到最终的声学模型。注意力模块由一个仿射变换和一个加权函数组成,以前一隐藏层的输出作为输入,提取对输入的特征权重值,用提取到的权重值为原输入特征加权,得到加权后的特征。本发明在考虑模型建模能力、对上下文信息提取能力及模型的大小等方面的因素下,通过多层次地为神经网络隐藏层特征加权,有效对层间特征的相对重要性进行显式建模,提高了TDNN声学模型的性能,从而提高了语音识别系统整体性能。 | ||
搜索关键词: | 一种 改进 延时 神经网络 声学 模型 | ||
【主权项】:
1.一种改进的延时神经网络声学模型,其特征在于,包括:a、搭建基础TDNN网络;基础TDNN网络包含:输入层、隐藏层和输出层,其中隐藏层设有若干层,并且在隐藏层实行同层参数共享和跳帧采样;b、在相邻的两层隐藏层中间添加注意力模块,得到改进后的TDNN网络;c、针对改进后的TDNN网络进行训练,得到最终的声学模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811090966.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别装置和方法
- 下一篇:一种基于神经网络的语音识别方法及装置