[发明专利]一种语音识别方法、装置、设备及存储介质有效

申请号：	202010300250.2	申请日：	2020-04-16
公开（公告）号：	CN111508479B	公开（公告）日：	2022-11-22
发明（设计）人：	刘引;卢华玮;秦邱川;杨声春;徐欣欣;魏鑫;田成志;汪哲逸;王璇	申请（专利权）人：	重庆农村商业银行股份有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L15/22;G10L15/26
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	薛娇
地址：	400000 ***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音识别方法，其特征在于，包括：

获取通用训练集及与各业务场景分别对应的子训练集；其中，所述通用训练集包含通用的语音及相应文本信息，所述子训练集包含对应业务场景下的语音及相应的符合对应业务场景下用语规则的文本信息；

利用所述通用训练集对预设识别模型进行训练，得到初始识别模型；并利用与各业务场景对应的子训练集对所述初始识别模型进行训练，得到与各业务场景分别对应的订制模型；

利用各订制模型对在对应业务场景下输入的语音进行识别，得到所识别的语音对应的文本信息；

其中，所述利用所述通用训练集对预设识别模型进行训练，得到初始识别模型，包括：

分别利用第一通用训练集及第二通用训练集对所述预设识别模型进行训练，得到第一初始识别模型及第二初始识别模型；所述第一通用训练集及所述第二通用训练集分别为所包含语音采用标准语言及指定方言的通用训练集；

所述利用与各业务场景对应的子训练集对所述初始识别模型进行训练，得到与各业务场景分别对应的订制模型，包括：

利用与各业务场景对应的第一子训练集及第二子训练集一一对应的分别对所述第一初始识别模型及所述第二初始识别模型进行训练，得到与各业务场景分别对应的第一订制模型及第二订制模型；所述第一子训练集及所述第二子训练集分别为所包含语音采用标准语言及指定方言的子训练集；

所述利用各订制模型对在对应业务场景下输入的语音进行识别，包括：

确定在任意业务场景下输入的语音为待识别语音，如果所述待识别语音采用标准语言，则利用该任意业务场景对应的所述第一订制模型对所述待识别语音进行识别，如果所述待识别语音采用指定方言，则利用该任意业务场景对应的所述第二订制模型对所述待识别语音进行识别；

对应地，确定所述待识别语音所采用的语言，包括：

将所述待识别语音输入至语言识别模型中，并确定所述语言识别模型输出的结果所表示的语言为所述待识别语音所采用的语言；其中，所述语言识别模型为预先利用语言训练集训练得到的，所述语言训练集包括分别采用标准语言及指定方言的语音、以及表示各语音采用的语言的标注；

或者，确定所述待识别语音所采用的语言，包括：

将所述待识别语音转换为拼音，判断转换得到的拼音中出现指定字母的频率是否大于频率阈值，如果是，则确定所述待识别语音采用的语言为标准语言，否则，确定所述待识别语音采用的语言为指定方言；其中，所述指定字母为在所述标准语言中使用的、且在所述指定方言中被映射为其他字母的字母。

2.根据权利要求1所述的方法，其特征在于，所述通用训练集及所述子训练集包含的语音中均包括采用指定方言的语音及采用标准语言的语音。

3.根据权利要求1或2所述的方法，其特征在于，所述得到所识别的语音对应的文本信息之后，还包括：

将得到的所识别的语音对应的文本信息进行输出，在外界基于输出的文本信息点击确认后执行与该输出的文本信息对应的操作，否则，指示外界重新输入语音。

4.根据权利要求3所述的方法，其特征在于，获取与各业务场景分别对应的子训练集之前，还包括：

接收外界输入的场景划分指令，在该场景划分指令的指示下将指定行业中的全部场景划分为与不同业务分别对应的业务场景。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆农村商业银行股份有限公司，未经重庆农村商业银行股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010300250.2/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载