[发明专利]语音解析方法和装置有效
申请号: | 201510903049.2 | 申请日: | 2015-12-09 |
公开(公告)号: | CN105529028B | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 贺利强;潘复平;钱胜;万广鲁 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/187 | 分类号: | G10L15/187;G10L25/51 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 解析 方法 装置 | ||
本发明提出一种语音解析方法和装置,其中,方法包括:S1、接收输入的待检测语音信号;S2、分帧提取待检测语音信号的语音特征信息,根据语音特征信息和声学模型生成待检测语音信号的识别结果;S3、根据识别结果和预设静音检测算法初步检测出待检测语音信号的语音端点;S4、计算待检测语音信号的置信度信息;S5、解析待检测语音信号的语义信息;以及S6、根据置信度信息和语义信息获取待检测语音信号对应的语音解析结果。本发明实施例的语音解析方法和装置,能够准确地识别语音的有效性,以及通过语义解析,确定语义是否与上下文相关,提高了语音识别系统的性能,使得多轮对话交互过程更加流畅,提升用户使用体验。
技术领域
本发明涉及语音识别技术领域,特别涉及一种语音解析方法和装置。
背景技术
随着人机信息交互技术的发展,语音识别技术显示出其重要性。在语音识别系统中,语音端点检测是语音识别中的关键技术之一。语音端点检测是指在连续声音信号中找出语音部分的起始点和终止点。端点检测准确与否,会直接影响到语音识别系统的性能。如果端点切分出现错误,则会导致漏识别或者误识别等情况的发生,进而可导致语音识别结果不准确。
目前,传统的语音端点检测方法主要是获取时域或频域能量,并与给定的阈值进行比较,从而判断出语音的起始点和终止点。端点检测的一般过程为:1、分帧提取语音特征,计算时域或频域能量;2、将能量值与阈值比较,判断语音起始点;3、若找到语音起始点,则继续向后取能量值与阈值比较,判断语音是否结束;4、若找到语音结束点,则终止查找,返回结果。
然而,在实现本发明的过程中发明人发现上述方法至少存在以下问题:当对一段语音进行语音端点检测时,在非平稳噪声、较低信噪比环境下,所检测的语音端点的准确率较低,影响语音识别系统的性能,可能会被误判为噪声,导致用户使用体验差。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种语音解析方法,该方法能够准确地识别语音的有效性,以及通过语义解析,确定语义是否与上下文相关,提高了语音识别系统的性能,使得多轮对话交互过程更加流畅,提升用户使用体验。
本发明的第二个目的在于提出一种语音解析装置。
为实现上述目的,本发明第一方面实施例的语音解析方法,包括:S1、接收输入的待检测语音信号;S2、分帧提取所述待检测语音信号的语音特征信息,根据所述语音特征信息和声学模型生成所述待检测语音信号的识别结果;S3、根据所述识别结果和预设静音检测算法初步检测出所述待检测语音信号的语音端点;S4、计算所述待检测语音信号的置信度信息;S5、解析所述待检测语音信号的语义信息;以及S6、根据所述置信度信息和所述语义信息获取所述待检测语音信号对应的语音解析结果。
本发明实施例的语音解析方法,通过分帧提取待检测语音信号的语音特征信息,根据语音特征信息和声学模型生成待检测语音信号的识别结果,再根据识别结果和预设静音检测算法初步检测出待检测语音信号的语音端点,然后基于置信度信息和语义信息获取待检测语音信号对应的语音解析结果,在复杂的环境噪声场景,能够准确地识别语音的有效性,以及通过语义解析,确定语义是否与上下文相关,提高了语音识别系统的性能,使得多轮对话交互过程更加流畅,提升用户使用体验。
为实现上述目的,本发明第二方面实施例的语音解析装置,包括:接收模块,用于接收输入的待检测语音信号;识别模块,用于分帧提取所述待检测语音信号的语音特征信息,根据所述语音特征信息和声学模型生成所述待检测语音信号的识别结果;检测模块,用于根据所述识别结果和预设静音检测算法初步检测出所述待检测语音信号的语音端点;计算模块,用于计算所述待检测语音信号的置信度信息;解析模块,用于解析所述待检测语音信号的语义信息;以及获取模块,用于根据所述置信度信息和所述语义信息获取所述待检测语音信号对应的语音解析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510903049.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自动语音的通信方法及装置
- 下一篇:新型十三孔陶笛