[发明专利]异构解码网络的构建方法及系统、语音识别方法及系统有效

申请号：	201410290869.4	申请日：	2014-06-24
公开（公告）号：	CN104064184B	公开（公告）日：	2017-03-08
发明（设计）人：	鹿晓亮;单言丰;刘强	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L15/183	分类号：	G10L15/183;G10L15/06
代理公司：	北京维澳专利代理有限公司11252	代理人：	王立民,吉海莲
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	解码网络构建方法系统语音识别
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及语音信号处理技术领域，尤其涉及一种异构解码网络的构建方法及系统、语音识别方法及系统。

背景技术

语音识别技术就是让机器通过识别和理解过程将语音信号转变为相应的文本或命令的技术。现有的语音识别系统，通常只能单独支持命令词识别(基于规则的语音识别系统)或听写识别(基于统计的语音识识别系统)。因此，在一些多业务的场景(比如在车载设备上的应用，既需要命令词识别，如“打电话给xxx”、“发短信给xxx”，还需要听写识别，如短信的内容，导航的目的地等；再比如手机语音助手上的使用，对于大部分的功能，比如聊天、查天气、查股票等都是听写识别，但是打电话和发短信功能都是使用的命令词识别)下，需要同时配置这两种系统，实现多种不同语音业务的并联识别。

基于规则的语音识别系统利用命令词解码网络实现解码，而基于统计的语音识别系统利用听写解码网络实现解码。由于这两种类型的解码网络的结构不同，所以针对这两种类型的解码网络需要分别配置不同的识别引擎才能完成识别工作。这种方式不仅会占用大量系统资源，影响系统性能，而且，由于听写解码网络和命令词解码网络的结构不一致，需要进行置信度判决来选择最终的识别结果，可靠性差，效率低，而且增加了整个语音识别系统的复杂度。

发明内容

本发明实施例一方面提供了一种异构解码网络的构建方法及系统，可以在多业务的场景下，通过配置一套识别引擎完成多种不同业务的并联识别、节省系统资源。

本发明实施例另一方面提供了一种基于该异构解码网络的语音识别方法及系统，以提高识别效果及识别效率，降低系统的复杂度。

本发明实施例提供一种异构解码网络的构建方法，包括：

获取业务所需的命令词解码网络和听写解码网络，所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分，所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分；

构建命令词训练数据集和听写训练数据集，所述命令词训练数据集内的命令词训练数据由所述命令词条构成，所述听写训练数据集内的听写训练数据由所述听写词条构成；

利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分；

优化所述命令词解码网络，并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分；

将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。

优选地，所述利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分包括：

依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分；所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分，所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；

依次将所述听写训练数据集内的每一个听写训练数据分别输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述听写训练数据的第二命令词网络得分和第二听写网络得分，所述第二命令词网络得分为与所述听写训练数据相匹配的命令词条对应的声学模型得分，所述第二听写网络得分为与所述听写训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；

确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件：对于命令词训练数据集内的设定比例的命令词训练数据，所述第一命令词网络得分与所述补偿得分之和大于所述第一听写网络得分；对于听写训练数据集内的设定比例的听写训练数据，所述第二命令词网络得分与所述补偿得分之和小于所述第二听写网络得分。

优选地，所述确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件包括：

获取满足第一取值范围且能够整除第一步进量的第一参数，以及满足第二取值范围且能够整除第二步进量的第二参数的所有参数组合；

依次对每一组参数组合，获取所述命令词训练数据集内满足第一预设条件的命令词训练数据个数，所述第一预设条件为：所述第一参数和所述命令词训练数据对应的第一命令词网络得分的乘积与所述第二参数的和，大于所述命令词训练数据对应的第一听写网络得分；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司，未经科大讯飞股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410290869.4/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于语音前端噪声消除的提高语音识别准确率的方法
下一篇：一种像素电路、有机电致发光显示面板及显示装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]异构解码网络的构建方法及系统、语音识别方法及系统有效

专利文献下载