[发明专利]一种基于TANN的语音识别技术在审

申请号：	202110981808.2	申请日：	2021-08-25
公开（公告）号：	CN113689845A	公开（公告）日：	2021-11-23
发明（设计）人：	薄伟	申请（专利权）人：	上海颂艺信息科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/26
代理公司：	天津铂茂专利代理事务所(普通合伙) 12241	代理人：	陈晓蕾
地址：	201800 上海市嘉定区***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 tann 语音识别技术
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于TANN的语音识别技术，包括以下步骤：S1：对一段语音进行预处理和特征提取，形成在时间轴上依次排开的特征帧序列S2：为输入语音的特征序列，给定一个时延长度L,在t时刻,时延结果为时延矩阵XT。本发明中，将一段语音进行预处理和特征提取形成在时间轴上依次排开的特征序列，并通过时间集成和帧间集成两个步骤处理特征帧序列形成新的帧特征矩阵，每个帧特征矩阵包含了当前时刻往前的一定时间段内的特征信息，解决经典神经网络无法顾及的特征在时间上的联系问题，同时又降低了数据的噪声及冗余度，减小后端网络负担，提高网络自适应能力。

技术领域

本发明涉及语音识别技术领域，尤其涉及一种基于TANN的语音识别技术。

背景技术

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术，语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。

由于一个语音事件从发生到结束在时间上是连续的，所以在处理语音的特征时需要考虑它们在时间上的关系，经典的神经网络对于时序信号处理时并没有考虑信号在一定时间长度上的联系，即没有“记忆功能”，受此诟病。

发明内容

本发明的目的在于提供一种基于TANN的语音识别技术，解决经典神经网络无法顾及的特征在时间上的联系问题，同时又降低了数据的噪声及冗余度，减小后端网络负担，提高网络自适应能力。

为了实现上述目的，本发明采用了如下技术方案：一种基于TANN的语音识别技术，包括以下步骤：

S1：对一段语音进行预处理和特征提取，形成在时间轴上依次排开的特征帧序列

S2：为输入语音的特征序列，给定一个时延长度L,在t时刻,时延结果为时延矩阵XT[x(t),x(t-1),x(t-2),…,x(t-L+1)]；

S3：时间集成处理，采用时间集成函数对时延矩阵XT进行累计迭加处理，实现在每一时刻上生成新的长度为M的特征矩阵，在时间上形成一个矩阵序列xT(t)；

S4：帧间集成处理，将矩阵序列xT(t)采用帧间集成函数进行帧间集成处理获取特征序列xF(t)；