[发明专利]一种语音识别系统中拒识能力提升方法有效

申请号：	201210581426.1	申请日：	2012-12-27
公开（公告）号：	CN103077708A	公开（公告）日：	2013-05-01
发明（设计）人：	鹿晓亮;赵志伟;陈旭;尚丽;吴晓如;于振华	申请（专利权）人：	安徽科大讯飞信息科技股份有限公司
主分类号：	G10L15/14	分类号：	G10L15/14;G10L15/30;G10L15/06
代理公司：	北京科迪生专利代理有限责任公司 11251	代理人：	成金玉
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种语音识别系统中拒识能力提升方法，步骤为：收集各种各样的噪声数据；按噪声种类进行分类；再针对不同类别的噪声分别训练高斯混合模型（GMM）；最后组合各类GMM模型为整体的吸收模型；通过各种比较随意的文本训练统计语言模型，然后通过加权有限状态机（WFST）技术构建识别网络，称之为吸收网络；将吸收网络和吸收模型同原始解码网络并联，形成新的解码网络；将输入的原始音频经过端点检测以及特征提取模块，生成特征向量；特征向量在解码网络的三个部分中根据Viterbi算法进行竞争，生成最终的识别结果，噪声以及集外词能够得到有效的拒识。本发明在兼顾识别效率的前提下，很好解决了对于集外词以及无效输入的拒识问题。
搜索关键词：	一种语音识别系统中拒识能力提升方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种语音识别系统中拒识能力提升方法，其特征在于实现步骤如下：（1）收集各种各样的噪声数据；然后按噪声种类进行分类，噪声种类包括背景噪声、背景音乐、关门声咳嗽声；再针对不同类别的噪声分别训练高斯混合模型（GMM）；最后组合各类GMM模型为整体的吸收模型；（2）通过各种比较随意的文本训练统计语言模型，然后通过加权有限状态机（WFST）技术构建识别网络，称之为吸收网络；（3）将吸收网络和吸收模型同原始解码网络并联，形成新的解码网络；（4）将输入的原始音频经过端点检测以及特征提取模块，生成特征向量，该特征向量输入（3）中生成的解码网络中进行解码；（5）特征向量在解码网络的吸收网络、吸收模型以及命令词网络根据Viterbi算法进行竞争，生成最终的识别结果，噪声以及集外词能够得到有效的拒识。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司，未经安徽科大讯飞信息科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201210581426.1/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音识别系统中拒识能力提升方法有效

专利文献下载