[发明专利]语音识别训练和解码方法及装置在审
申请号: | 201911052184.5 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110827802A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 陆沁 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 训练 解码 方法 装置 | ||
1.一种语音识别训练方法,包括:
对于初始说法和至少一个初始词条,分别训练与所述初始说法对应的n-gram语言模型和与所述至少一个初始词条对应的至少一个grammar语言模型;
基于所述n-gram语言模型构成初始说法解码网络;
基于所述至少一个grammar语言模型相应地构成至少一个初始词条解码网络。
2.根据权利要求1所述的方法,其中,所述方法还包括:
响应于用户添加新的说法,训练与所述新的说法对应的新的n-gram语言模型;
将所述新的n-gram语言模型构成的解码网络与初始说法解码网络合并成新的说法解码网络。
3.根据权利要求2所述的方法,其中,所述方法还包括:
响应于用户添加新的词条,生成与所述新的词条对应的新的grammar语言模型;
将所述新的grammar语言模型构成的解码网络与对应的初始词条解码网络合并成新的词条解码网络;
将所述新的词条解码网络的路径概率归一。
4.根据权利要求3所述的方法,其中,所述将所述新的词条解码网络的路径概率归一包括:
修改所述新的词条解码网络中每条完整路径的概率以使得所述新的词条解码网络的整体概率保持为1。
5.根据权利要求3所述的方法,其中,所述将所述新的n-gram语言模型构成的解码网络与初始说法解码网络合并成新的说法解码网络包括:
将所述新的n-gram语言模型构成的解码网络与初始说法解码网络并联成新的说法解码网络;
所述将所述新的grammar语言模型构成的解码网络与初始词条解码网络合并成新的词条解码网络包括:
将所述新的grammar语言模型构成的解码网络与初始词条解码网络并联成新的词条解码网络。
6.一种语音识别解码方法,包括:
将接收的语句文本分为说法和至少一个词条;
获取所述语句文本中的所述说法和所述至少一个词条的顺序;
根据所述顺序,当走到说法路径时,进入与所述说法对应的n-gram语言模型解码网络进行解码,当走到词条路径时,进入对应的词条的grammar语言模型解码网络进行解码。
7.一种语音识别训练装置,包括:
模型训练模块,配置为对于初始说法和至少一个初始词条,分别训练与所述说法对应的n-gram语言模型和与所述至少一个初始词条对应的至少一个grammar语言模型;
说法解码网络构成模块,配置为基于所述n-gram语言模型构成初始说法解码网络;
词条解码网络构成模块,配置为基于所述至少一个grammar语言模型相应地构成至少一个初始词条解码网络。
8.一种语音识别解码装置,包括:
分词模块,配置为将接收的语句文本分为说法和至少一个词条;
顺序获取模块,配置为获取所述语句文本中的所述说法和所述至少一个词条的顺序;
解码模块,配置为根据所述顺序,先进入与所述说法对应的n-gram语言模型解码网络进行解码,当走到词条路径时,跳转到相应的词条的grammar语言模型解码网络进行解码,当词条网络走到终点后,跳回与所述说法对应的n-gram语言模型解码网络进行解码。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911052184.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于知识图谱的伤寒辨证推理系统
- 下一篇:一种针织机的智能恒张力送纱方法