[发明专利]一种地域性的离线口音语音识别系统的生成方法和装置有效
申请号: | 202110142560.0 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112908295B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 兰泽华;林昱;陈少伟 | 申请(专利权)人: | 睿云联(厦门)网络通讯技术有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/16;G10L17/00;G10L17/18 |
代理公司: | 厦门原创专利事务所(普通合伙) 35101 | 代理人: | 王桂婷 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种地域性的离线口音语音识别系统的生成方法,所述方法包括:导入不同地域的语音音频数据;将所述语音音频数据转化为语音识别的语音特征;通过所述语音特征训练包含具有不同地域发音特征的Xvector模型后,提取所述Xvector模型中不同地域的多维度的Xvector特征;利用前置神经网络进一步提取所述语音特征中的第一Xvector特征,并通过所述Xvector模型中Xvector特征所对应的真实标签用于指导所述第一Xvector特征进行第一模型的训练;基于所述第一Xvector特征提取第一语音识别特征进行第二模型的训练后,利用所述第一模型与所述第二模型进行反向更新所述前置神经网络的权重值,得到口音语音识别模型。本方案能够提升离线语音识别系统在同种语音下不同口音的识别性能。 | ||
搜索关键词: | 一种 地域性 离线 口音 语音 识别 系统 生成 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于睿云联(厦门)网络通讯技术有限公司,未经睿云联(厦门)网络通讯技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110142560.0/,转载请声明来源钻瓜专利网。