[发明专利]语音识别训练和解码方法及装置在审
申请号: | 201911052184.5 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110827802A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 陆沁 | 申请(专利权)人: | 苏州思必驰信息科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 训练 解码 方法 装置 | ||
本发明公开语音识别训练和解码方法及装置,其中,一种语音识别训练方法,包括:对于初始说法和至少一个初始词条,分别训练与初始说法对应的n‑gram语言模型和与至少一个初始词条对应的至少一个grammar语言模型;基于n‑gram语言模型构成初始说法解码网络;基于至少一个grammar语言模型相应地构成至少一个初始词条解码网络。本申请的方法和装置提供的方案适用于本地,提供了较灵活的说法识别及较精准的关键词识别,且支持用户自定义并快速在本地进行更新。
技术领域
本发明属于语音识别技术领域,尤其涉及语音识别训练和解码方法及装置。
背景技术
相关技术中,语音识别技术越来越广泛地运用到生活中,给人们的生活带来了极大的便利。语言模型作为语音识别技术中的一个重要部分,能计算一串词序列的概率,从而帮助给出更符合人语言习惯的词序列。
常用的语言模型有基于语法网络的grammar语言模型,基于统计的 n-gram语言模型,以及基于神经网络的语言模型。grammar语言模型是把语言层信息组织成一个固定的语法,解码时只能识别出语法中语句,灵活度较差,但对于语法中语句识别准确率较高。n-gram语言模型假设第K个词的出现只与前面的K-n个词相关,通过统计语料中n个词同时出现的次数,即可算出整句的概率。n-gram语言模型存在回退,因而理论上可以识别出任意语句,灵活性较大。但同时,这种灵活性,加上n- gram语言模型使用概率平滑技术模拟出的低频词概率与实际概率存在一定差异,导致识别错误的概率升高。神经网络语言模型是用一个关于θ的函数F(w,context(w),θ)来表示当前词为w时,其上下文为context(x)的概率。神经网络对参数的共享,使其对低频词具有天然的平滑能力,从而具有更好的泛化性。循环神经网络能更有的理由历史信息,从而进一步提高识别正确性。但神经网络训练的计算复杂度较高,无法实现本地训练及快速更新。
市面上已有的运用于本地的识别系统,部分采用grammar语言模型。grammar语言模型构成的解码网络小,且对于语法内语句识别准确率高,能保证有限说法的识别。但用户往往不能满足于这种局限的识别。因而另一部分本地识别系统采用n-gram语言模型来增加灵活性,但同时会带来性识别准确率的下降,从而导致用户的不满。
支持用户自定义的产品目前较少。而那些少数支持自定义的,或需要通过网络上传到云端更新模型,或需要在本地消耗较多资源和较长时间更新模型。因而可以推断,它们是将用户自定义部分的文本融入原有文本中,重新训练了语言模型。
发明内容
本发明实施例提供一种语音识别训练和解码方法及装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种语音识别训练方法,包括:对于初始说法和至少一个初始词条,分别训练与所述初始说法对应的n-gram 语言模型和与所述至少一个初始词条对应的至少一个grammar语言模型;基于所述n-gram语言模型构成初始说法解码网络;基于所述至少一个 grammar语言模型构成至少一个初始词条解码网络。
第二方面,本发明实施例提供一种语音识别解码方法,包括:将接收的语句文本分为说法和至少一个词条;获取所述语句文本中的所述说法和所述至少一个词条的顺序;根据所述顺序,先进入与所述说法对应的n-gram语言模型解码网络进行解码,当走到词条路径时,跳转到相应的词条的grammar语言模型解码网络进行解码,当词条网络走到终点后,跳回与所述说法对应的n-gram语言模型解码网络进行解码。
第三方面,本发明实施例提供一种语音识别训练装置,包括:模型训练模块,配置为对于初始说法和至少一个初始词条,分别训练与所述说法对应的n-gram语言模型和与所述至少一个初始词条对应的至少一个 grammar语言模型;说法解码网络构成模块,配置为基于所述n-gram语言模型构成初始说法解码网络;词条解码网络构成模块,配置为基于所述至少一个grammar语言模型相应地构成至少一个初始词条解码网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州思必驰信息科技有限公司,未经苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911052184.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于知识图谱的伤寒辨证推理系统
- 下一篇:一种针织机的智能恒张力送纱方法