[发明专利]一种年龄增强的语音识别增强方法和装置在审
申请号: | 201910955160.4 | 申请日: | 2019-10-09 |
公开(公告)号: | CN110534098A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 刘旭生;马永波;张晓慧;李子乾;张才俊;申蕾;王笑一;王秀春;何学东;朱龙珠;杨华;安业腾 | 申请(专利权)人: | 国家电网有限公司客户服务中心 |
主分类号: | G10L15/06 | 分类号: | G10L15/06 |
代理公司: | 11368 北京世誉鑫诚专利代理事务所(普通合伙) | 代理人: | 孙国栋<国际申请>=<国际公布>=<进入 |
地址: | 300300 天*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种语音识别方法和装置,特别公开了一种年龄增强的语音识别增强方法和装置。该一种年龄增强的语音识别增强方法和装置,本装置主要由语音分帧模块、类别标记模块、年龄段编码向量模块和语音识别系统训练模块构成;本装置需预设对训练数据分帧进行发音类别标记,标记对应的年龄段,然后将获取的年龄端编码为向量加入到语音识别系统训练模块中去,获取语音识别引擎;在语音识别系统训练模块获取了年龄向量后,即可进行语音识别引擎训练。其益效果是:通过多任务协同学习的方法,将年龄作为一个向量加入到语音识别模型训练中去,既能共享大数据中语音基础信息,又能对不同年龄段的人群进行针对性优化,从而提高语音识别引擎整体的识别率。 | ||
搜索关键词: | 语音识别 语音识别系统 语音识别引擎 方法和装置 训练模块 年龄段 向量 类别标记 分帧 编码向量 模型训练 任务协同 训练数据 语音基础 大数据 识别率 预设 发音 语音 共享 人群 优化 学习 | ||
【主权项】:
1.一种年龄增强的语音识别增强方法和装置,其特征在于:本装置主要由语音分帧模块、类别标记模块、年龄段编码向量模块和语音识别系统训练模块构成;本装置需预设对训练数据分帧进行发音类别标记,标记对应的年龄段,然后将获取的年龄端编码为向量加入到语音识别系统训练模块中去,获取语音识别引擎;在语音识别系统训练模块获取了年龄向量后,即可进行语音识别引擎训练,具体流程如下:/n输入向量:输入向量分为语音特征向量和年龄向量;语音特征向量为40维的Fbank特征,考虑到上下文相关,使用11帧的对称窗口,并做LDA降维至200维,年龄向量即为年龄段编码向量模块中获取的向量;/n网络结构:4层隐含层,每层1200个结点,输出层对应GMM的个数,为7552个结点;/n模型训练:交叉熵作为训练的评判标准,训练中采用随机梯度下降法。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司客户服务中心,未经国家电网有限公司客户服务中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910955160.4/,转载请声明来源钻瓜专利网。
- 上一篇:语音控制方法及装置
- 下一篇:语音唤醒处理方法、装置、存储介质及电子设备