[发明专利]语音识别系统的端点检测方法及系统有效
申请号: | 201510413643.3 | 申请日: | 2015-07-14 |
公开(公告)号: | CN105118502B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 王凯夫;彭守业;牛建伟;贾磊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/02;G10L15/16;G10L21/0208 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种语音识别系统的端点检测方法及系统,其中,该方法包括基于长短时记忆神经网络训练声学识别模型;通过预设语音端点检测算法初步识别出待识别语音信号的语音端点;分帧提取待识别语音信号的语音特征信息,并将语音特征信息输入声学识别模型,以使声学识别模型根据语音特征信息生成待识别语音信号的声学识别结果;以及根据声学识别结果对初步识别出的语音端点进行调整。本发明实施例的语音识别系统的端点检测方法,提供了一种通过声学识别结果对初步识别出的语音端点进行调整的端点检测方式,准确定位了待识别语音信号的语音端点,提高了语音端点检测的准确率,进而可提高语音识别的准确性,提高语音识别系统的性能。 | ||
搜索关键词: | 语音 识别 系统 端点 检测 方法 | ||
【主权项】:
一种语音识别系统的端点检测方法,其特征在于,包括以下步骤:基于长短时记忆神经网络训练声学识别模型;通过预设语音端点检测算法初步识别出待识别语音信号的语音端点;分帧提取所述待识别语音信号的语音特征信息,并将所述语音特征信息输入所述声学识别模型,以使所述声学识别模型根据所述语音特征信息生成所述待识别语音信号的声学识别结果;以及根据所述声学识别结果对初步识别出的语音端点进行调整;其中,所述根据所述声学识别结果对初步识别出的语音端点进行调整,包括:判断所述声学识别结果中是否包含韵母;以及如果所述声学识别结果中包含韵母,则确定所述声学识别结果中的第一个韵母所在的帧,并获取在所述第一个韵母所在的帧之前,且距离所述第一个韵母所在的帧最近的非语音帧,并根据所述最近的非语音帧的下一帧对初始识别出的语音起始点进行调整。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510413643.3/,转载请声明来源钻瓜专利网。