[发明专利]一种语音识别系统中拒识能力提升方法有效
申请号: | 201210581426.1 | 申请日: | 2012-12-27 |
公开(公告)号: | CN103077708A | 公开(公告)日: | 2013-05-01 |
发明(设计)人: | 鹿晓亮;赵志伟;陈旭;尚丽;吴晓如;于振华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/30;G10L15/06 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 成金玉 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 系统 中拒识 能力 提升 方法 | ||
技术领域
本发明涉及一种语音识别系统中拒识能力提升方法,用于语音识别系统中的命令词识别技术领域。
背景技术
命令词识别系统是目前语音识别系统中很重要的一个类别,广泛应用于家电、车载、智能手机以及呼叫中心的导航产品中。命令词识别系统的任务是在识别语法范围内,找出输入语音最相似的识别结果。相对于范围有限的识别语法,输入语音是无限的,当输入语音的实际内容不在识别语法范围之内,称此输入为集外词。除了集外词之外,还会有诸如背景说话声、噪声等其他的无效输入,这些无效输入送入自动语音识别系统之后,也会给出语法范围内的识别结果,相当于做出了不必要的响应,影响用户的体验。基于上述原因,自动语音识别系统需要具备较强的集外词以及无效输入的拒识能力,也即自动判断是否为集外词或者无效输入。
目前的系统拒识能力主要依靠置信度判决的方案,也即自动语音识别系统不仅能给出识别结果,还应该给出该识别结果是输入语音真实内容的可信度,从而对集外词进行判决,这个过程称为置信度判决。最直接的做法是将根据声学模型和识别语法所计算得到的输入语音相对于识别结果的似然值或者是它的某种变换做为置信度,进行置信度判决。而置信度判决任务需要面对不同的输入语音,似然值的取值范围会因为输入语音的长短、说话人、背景噪声等因素的变化而有很大变化,将似然值直接应用于置信度判决,性能并不理想。后来的研究者将语音的后验概率作为识别结果的置信度,取得了较好的性能,这类方法通常基于贝叶斯公式和全概率公式来进行:
上式中W代表识别结果,X代表输入语音,P(W|X)为识别结果W对于输入语音X的后验概率,该后验概率可以通过贝叶斯公式以及全概率公式求得,Ω代表辅助解码空间,该空间是一个全路径集合,包含的元素为全部竞争路径。基于后验概率的置信度判决方案的核心是确定一个辅助空间Ω并且在Ω上准确高效地获取有效竞争路径。基于置信度判决的方案在整个 语音识别流程中所处的位置如图1所示:
目前基于后验概率的置信度都有各自的缺陷。通过定义辅助空间并且在其上进行解码获取有效竞争路径的方案,要么竞争路径的有效性非常依赖于识别语法本身,普适性较差;要么采用全因素解码网络进行解码,在解码获取有效竞争路径的时候兼顾包括时序信息、语言模型等重要知识,能够比较准确地获取到有效竞争路径,但是算法复杂度较高,在对实时率要求比较高的语音识别系统中很难成功应用。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种语音识别系统中拒识能力提升方法,采用一种吸收模型和吸收网络的方法,在兼顾识别效率的前提下,很好解决了对于集外词以及无效输入的拒识问题。
本发明技术解决方案:一种语音识别系统中拒识能力提升方法,实现步骤如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210581426.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:金片装置切刀驱动机构
- 下一篇:被动式磁悬浮轴承及其组件