[发明专利]一种语音结束端点检测方法及装置在审
申请号: | 201910876235.X | 申请日: | 2019-09-17 |
公开(公告)号: | CN110689877A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 龙嘉裕 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/87;G10L15/26 |
代理公司: | 11291 北京同达信恒知识产权代理有限公司 | 代理人: | 宋正伟 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 发音区间 文本信息 语境类型 语言特征 时长 句子 语音 结束时间点 端点检测 信息确定 语义结构 语音信号 检测 转换 申请 | ||
本申请实施例提供一种语音结束端点检测方法及装置,其中方法包括:获取用户输入的语音信号,并将所述语音信号转换为文本信息;确定所述文本信息对应的语境类型,和/或所述语音信号中的非语言特征信息;根据所述语境类型和/或所述非语言特征信息确定检测时长;识别所述文本信息中的每个字在所述语音信号中对应的发音区间,当确定所述文本信息中的第一字的发音区间之后的所述检测时长内,不包括第二字的发音区间,则将所述第一字在所述语音信号中对应的发音区间的结束时间点作为第一端点;当确定所述第一字所处的句子的语义结构完整时,将第一端点作为所述第一字所处的句子在所述语音信号中的语音结束端点。
技术领域
本申请涉及语音检测技术领域,尤其涉及一种语音结束端点检测方法及装置。
背景技术
随着科技的进步,人们的工作、生活几乎每天都应用到计算机以及网络,为了更便捷、高效的为工作、生活服务,语音识别在各个领域里的应用日益广泛,比如,人机交互式的语音识别,人与人之间沟通交流时以语音识别的方式记录两者的对话内容,亦或是随时随地的以语音的方式记录自己的所思所想等等,这一识别方式已逐渐成为语音应用发展的趋势。语音识别的过程主要包括4个步骤,分别是:语音信号采集、语音信号的特征参数提取、声学模型与模式匹配、语言模型与语言处理。其中,在第一步骤中的语音信号采集时,首先要对用户输入的语音信号进行判断,准确找出语音信号的起始点和终止点,从而知晓用户的这句话是否已说完,这就应用到端点检测技术(voice activity detection,VAD),VAD技术作为语音识别系统与处理阶段遇到的第一个关键技术,其准确性在某种程度上直接决定了语音识别系统的成败。
现有技术中的VAD技术主要是获取用户的语音信号,根据过零率和声音量级等指标去检测一句话是否结束,具体的,如果在获取的语音流中前面连续多个帧的语音能量值小于预先设定的语音能量低点阈值,而接下来连续多个帧的语音能量值大于语音能量低点阈值,则在语音能量值增大的地方就是语音信号的起点;同样的,如果连续多个帧的语音能量值较大,随后多个帧的语音能量值变小,即小于预先设定的语音能量高点阈值,并且持续一定的时长,则认为在语音能量值减小的地方就是语音信号的终点。
从中可以看出,现有技术中的VAD技术仅是从语音能量的有无以及固定的检测时长中确定出语音信号的起点和终点,但现实生活的很多场景中,用户说话时会遇到各种情况,仅从语音能量的有无以及固定的检测时长是无法灵活应对这些情况的,比如,用户边思考边回答,这时犹豫、停顿的时间就会有所延长;再比如用户在说话时被打断、被插话等,这就导致VAD技术检测的通用性较差,准确率较低。
综上所述,现有技术中的VAD技术仅仅根据语音能量来判断句子的结束,导致检测的准确率较低。
发明内容
本申请实施例提供一种语音结束端点检测方法及装置,用以解决现有技术中端点检测的准确率较低的问题。
本申请实施例提供一种语音结束端点检测方法,该方法包括:获取用户输入的语音信号,并将所述语音信号转换为文本信息;确定所述文本信息对应的语境类型,和/或所述语音信号中的非语言特征信息;根据所述语境类型和/或所述非语言特征信息确定检测时长;识别所述文本信息中的每个字在所述语音信号中对应的发音区间,当确定所述文本信息中的第一字的发音区间之后的所述检测时长内,不包括第二字的发音区间,则将所述第一字在所述语音信号中对应的发音区间的结束时间点作为第一端点;所述第一字为所述文本信息中的任一字,所述第二字位于所述第一字之后且与所述第一字相邻;当确定所述第一字所处的句子的语义结构完整时,将所述第一端点作为所述第一字所处的句子在所述语音信号中的语音结束端点。
通过这种方法先得到句子对应的语音信号的结束时间点,即第一端点;再进一步对句子语义结构完整性做判断,最终确定第一端点是否为语音结束端点,从而可以提高语音结束端点检测的准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910876235.X/2.html,转载请声明来源钻瓜专利网。