[发明专利]语音识别方法和装置有效
申请号: | 201511021289.6 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105632495B | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 彭星源;潘复平 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 | ||
1.一种语音识别方法,其特征在于,包括:
根据用户输入的语音向所述用户发出提问;
接收所述用户针对所提问题的答案;
根据所提问题所属的受限领域,进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴;
其中,所述根据所提问题所属的受限领域,进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴包括:
如果所提问题属于强受限领域,则采用非交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴;
如果所提问题属于关键受限领域,则采用交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴。
2.根据权利要求1所述的方法,其特征在于,所述采用非交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴包括:
采用正向语言模型和反向语言模型分别对所述答案进行识别,分别获得所述正向语言模型对所述答案的识别结果的打分,以及所述反向语言模型对所述答案的识别结果的打分,其中,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型;
将所述正向语言模型对所述答案的识别结果的打分与所述反向语言模型对所述答案的识别结果的打分进行比较;
如果所述正向语言模型对所述答案的识别结果的打分较高,则确定所述答案的识别结果不属于拒识范畴;如果所述反向语言模型对所述答案的识别结果的打分较高,则确定所述答案的识别结果属于拒识范畴。
3.根据权利要求1所述的方法,其特征在于,所述采用交叉方式进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴包括:
采用正向语言模型和反向语言模型对所述答案中的每一项N元文法分别进行打分,取分值较高的识别结果作为所述答案中每一项N元文法的识别结果,其中,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型;
根据最终获得的所述答案的识别结果中每个词和解析出所述每个词的语言模型的组合的重要程度,确定所述答案的识别结果是否属于拒识范畴。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述根据所提问题所属的受限领域,进行正向语言模型和反向语言模型的竞争,获得所述答案的识别结果是否属于拒识范畴之前,还包括:
训练获得所述正向语言模型和所述反向语言模型,所述反向语言模型为通用语言模型减去所述正向语言模型之后的模型。
5.根据权利要求4所述的方法,其特征在于,所述正向语言模型包括强受限领域语言模型;
所述训练获得强受限领域语言模型包括:
通过正则表达式构造出类语言模型的原始语料;
穷举所述类语言模型的原始语料中需要填充的类内语料;
如果所述原始语料和所述类内语料组合生成的训练语料的规模小于或等于预定阈值,则对所述训练语料进行训练,生成所述强受限领域语言模型;
如果所述原始语料和所述类内语料组合生成的训练语料的规模大于预定阈值,则生成所述类语言模型的原始语料中需要填充的类内语料的表述语言模型,将所述类语言模型与所述表述语言模型进行组合,生成所述强受限领域语言模型。
6.根据权利要求4所述的方法,其特征在于,所述正向语言模型包括关键受限领域语言模型;
所述训练获得关键受限领域语言模型包括:
通过正则表达式构造出类语言模型的原始语料;
穷举所述类语言模型的原始语料中需要填充的类内关键词的所有语料;
将所述原始语料与所述类内关键词的所有语料组合生成训练语料,并对所述训练语料进行训练,获得关键受限领域语言模型。
7.根据权利要求6所述的方法,其特征在于,所述获得关键受限领域语言模型之后,还包括:
保留所述关键受限领域语言模型中所述类内关键词的语料的全部N元文法的概率,减小非类内关键词的语料的N元文法的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511021289.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于统计模型的双传感器语音增强方法与装置
- 下一篇:多剂量洗涤剂输送装置