[发明专利]多方言口音普通话语音识别模型训练方法、装置及设备有效

专利信息
申请号: 202011433866.3 申请日: 2020-12-10
公开(公告)号: CN112233653B 公开(公告)日: 2021-03-12
发明(设计)人: 胡广宇 申请(专利权)人: 北京远鉴信息技术有限公司
主分类号: G10L15/00 分类号: G10L15/00;G10L15/06;G10L15/26;G10L15/16;G10L15/14
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 荣颖佳
地址: 100000 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 多方 口音 普通话 语音 识别 模型 训练 方法 装置 设备
【说明书】:

本申请提供一种多方言口音普通话语音识别模型训练方法、装置及设备,涉及语言识别技术领域。该方法包括:获取训练样本;使用带标注的标准普通话语音数据训练得到初始声学模型,使用文本数据训练得到初始语言模型;基于未标注的方言口音普通话语音数据迭代训练初始声学模型,得到目标声学模型;使用由目标声学模型和初始语言模型识别得到的待训练文本,训练得到临时语言模型,将临时语言模型与初始语言模型合并得到目标语言模型;将目标声学模型以及目标语言模型组合为多方言口音普通话语音识别模型。利用大量未标注的方言口音普通话语音数据,进行迭代训练,得到多方言口音普通话语音识别模型,提升了对方言口音普通话语音识别准确率。

技术领域

发明涉及语音识别技术领域,具体而言,涉及一种多方言口音普通话语音识别模型训练方法、装置及设备。

背景技术

随着互联网和其他移动终端性能的提升,基于语音识别技术的智能产品,越来越受到工业生产和日常生活的青睐,如语音对话机器人、语音助手、互动工具等。但是,我国是一个包含多方言地区国家,生活在各地区的人们,在用普通话进行表达时会存在很大程度的口音现象,进而造成与标准普通话模型不匹配,导致语音识别的准确率低。

目前,可以基于时序神经网络进行多模型研究,实现对方言口音普通话的识别。其中,基于多模型识别方法,针对不同区域总结不同发音词典、训练数据;然后,直接训练多个模型,或者微调通用普通话语音识别模型。

但是,目前所采用的多模型识别方法,需要耗费大量的时间和人力进行数据收集和样本标注,导致优化的难度增大。

发明内容

本发明的目的在于,针对上述现有技术中的不足,提供一种多方言口音普通话语音识别模型训练方法、装置及设备,以便充分利用无标注的语音数据来加强模型的训练,避免了在实际应用中由于缺少标注训练样本数据的限制,而导致最终识别精度不高的情况。

为实现上述目的,本申请实施例采用的技术方案如下:

第一方面,本申请实施例提供了一种多方言口音普通话语音识别模型训练方法,包括:

获取训练样本,所述训练样本包括:带标注的标准普通话语音数据、未标注的方言口音普通话语音数据、以及文本数据;

使用所述带标注的标准普通话语音数据训练得到初始声学模型,并使用所述文本数据训练得到初始语言模型;

基于所述未标注的方言口音普通话语音数据,迭代训练所述初始声学模型,得到目标声学模型,所述目标声学模型用于识别预设种类的方言口音普通话语音数据,每种方言口音普通话语音数据分别对应一类方言口音普通话;

使用由所述目标声学模型和所述初始语言模型识别得到的待训练文本,训练得到临时语言模型,将所述临时语言模型与所述初始语言模型进行合并,得到目标语言模型;

将所述目标声学模型以及所述目标语言模型组合为多方言口音普通话语音识别模型。

可选地,所述基于所述未标注的方言口音普通话语音数据,迭代训练所述初始声学模型,得到目标声学模型,包括:

将所述初始声学模型作为初始的临时声学模型;

A、使用所述临时声学模型以及所述初始语言模型对所述未标注的方言口音普通话语音数据进行识别处理,得到识别文本;

B、根据所述识别文本的置信度、语种信息以及地域标签信息,得到预设数量的数据集合,每个数据集合中包括多个所述识别文本,且同一数据集合中的所述识别文本对应同一类方言口音普通话;

C、使用每个所述数据集合,分别对所述临时声学模型进行调整,得到所述预设数量的方言声学模型;

D、根据各所述方言声学模型的准确率,从所述各所述方言声学模型中筛选出至少一个备选合并模型;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011433866.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top