[发明专利]一种年龄增强的语音识别增强方法和装置在审

专利信息
申请号: 201910955160.4 申请日: 2019-10-09
公开(公告)号: CN110534098A 公开(公告)日: 2019-12-03
发明(设计)人: 刘旭生;马永波;张晓慧;李子乾;张才俊;申蕾;王笑一;王秀春;何学东;朱龙珠;杨华;安业腾 申请(专利权)人: 国家电网有限公司客户服务中心
主分类号: G10L15/06 分类号: G10L15/06
代理公司: 11368 北京世誉鑫诚专利代理事务所(普通合伙) 代理人: 孙国栋<国际申请>=<国际公布>=<进入
地址: 300300 天*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音识别 语音识别系统 语音识别引擎 方法和装置 训练模块 年龄段 向量 类别标记 分帧 编码向量 模型训练 任务协同 训练数据 语音基础 大数据 识别率 预设 发音 语音 共享 人群 优化 学习
【说明书】:

发明公开了一种语音识别方法和装置,特别公开了一种年龄增强的语音识别增强方法和装置。该一种年龄增强的语音识别增强方法和装置,本装置主要由语音分帧模块、类别标记模块、年龄段编码向量模块和语音识别系统训练模块构成;本装置需预设对训练数据分帧进行发音类别标记,标记对应的年龄段,然后将获取的年龄端编码为向量加入到语音识别系统训练模块中去,获取语音识别引擎;在语音识别系统训练模块获取了年龄向量后,即可进行语音识别引擎训练。其益效果是:通过多任务协同学习的方法,将年龄作为一个向量加入到语音识别模型训练中去,既能共享大数据中语音基础信息,又能对不同年龄段的人群进行针对性优化,从而提高语音识别引擎整体的识别率。

技术领域

本发明公开了一种语音识别方法和装置,特别公开了一种年龄增强的语音识别增强方法和装置。

背景技术

现有技术中,随着大规模连续语音识别技术的发展,语音识别被应用在越来越多的应用场景上。伴随着应用场景的增多,覆盖人群的年龄段越来越广,语音识别对不同年龄段的识别率要求越来越高,因此,语音识别对不同年龄段的覆盖显的尤为重要。

目前常用的识别方法有两种,一是收集覆盖所有年龄段的语音数据,进行大规模语音识别模型训练,但是这种方法收集的年龄段语音数据一般是不均匀的,在训练的时候往往会把一些年龄段的数据淹没掉;二是把人群分为老人、成人和儿童,分别训练不同人群的模型,但是这种模型无法共享大规模数据的通用信息,导致一些人群的数据量有限,识别率无法提高。

发明内容

本发明的目的在于提供一种年龄增强的语音识别增强方法和装置,本发明采用的技术方案是:

本发明一种年龄增强的语音识别增强方法和装置,其特征在于:本装置主要由语音分帧模块、类别标记模块、年龄段编码向量模块和语音识别系统训练模块构成;本装置需预设对训练数据分帧进行发音类别标记,标记对应的年龄段,然后将获取的年龄端编码为向量加入到语音识别系统训练模块中去,获取语音识别引擎;在语音识别系统训练模块获取了年龄向量后,即可进行语音识别引擎训练,具体流程如下:

输入向量:输入向量分为语音特征向量和年龄向量;语音特征向量为40维的Fbank特征,考虑到上下文相关,使用11帧的对称窗口,并做LDA降维至200维,年龄向量即为年龄段编码向量模块中获取的向量;

网络结构:4层隐含层,每层1200个结点,输出层对应GMM的个数,为7552个结点;

模型训练:交叉熵作为训练的评判标准,训练中采用随机梯度下降法。

具体的,所述语音分帧模块主要将整段的语音进行切分一帧帧语音,现成一个序列,用s表示s={s1,s2,….,sN},其中s表示一段语音,s1表示一帧语音,N为总帧数。

具体的,所述类别标记模块主要将上一模块的切分的语音帧进行标记,现成待标记的语音片段,用l表示,l_s表示对语音端s进行标记,l_s={l_s_1,l_s_2,…,l_s_N},其中l_s_1表示对语音帧s1进行标记。L_s_n的值为年龄段,举例,如年龄段为3-7岁,8-12岁,14-18岁,19-30岁等,则l_s_n的值为其中一个。

具体的,所述年龄段编码向量模块主要是将年龄段进行编码,从而形成年龄向量方便神经网络输入,具体编码流程如下:

年龄段编码映射,将年龄段分为M端,则形成一个M维的向量来表示年龄向量,即:E1={1,0,0,0….},E2={0,1,0,0,..},E_M={0,0,…,0,1},采取0-1编码的方式;

获取语音帧年龄向量,将年龄段编码向量模块中的语音年龄段标注与年龄向量映射,即可获取每个语音帧对应的向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司客户服务中心,未经国家电网有限公司客户服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910955160.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top