[发明专利]语音信号处理方法、装置、电子设备及存储介质在审
申请号: | 201910809985.5 | 申请日: | 2019-08-29 |
公开(公告)号: | CN112530417A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 韩伟;王阳阳;李曙光 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G10L15/197 | 分类号: | G10L15/197;G10L15/18 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭晓丽 |
地址: | 100025 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 装置 电子设备 存储 介质 | ||
本发明涉及人工智能技术领域,公开了一种语音信号处理方法、装置、电子设备及存储介质,所述方法包括:对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;对临时识别结果进行分词处理,得到若干分词片段;获取第一分词序列之后的下一个分词片段为结束字符的预测概率,预测概率为根据词频数据确定的,词频数据包括基于语料库中的语料确定出的各分词序列在各语料中出现的次数,第一分词序列为临时识别结果中最后的N个分词片段组成的序列;若预测概率大于概率阈值,对临时识别结果进行语义解析。本发明实施例提供的技术方案,能够及时准确地对持续输入的音频流数据进行截断处理,缩短了智能设备的响应时间,提高用户体验。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音信号处理方法、装置、电子设备及存储介质。
背景技术
目前的智能设备在进行语音识别和语音处理时,通常要先获取一段具有完整语义的语音数据,然后经过ASR(Automatic Speech Recognition,语音识别)处理获得语音识别结果,再基于该语音识别结果进行语义理解,得到语音数据对应的响应数据,以向用户作出反馈。
现有的获取具有完整语义的语音数据的一种方式为:用户在输入一段语音数据后按下指定按键,以告知智能设备语音输入结束,智能设备获取这段语音数据进行处理,但是,这种方式操作繁琐,且适应场景单一、不够灵活。另外一种方式为,在智能设备持续收音时通过语音活动检测(Voice Activity Detection,VAD)技术对连续输入的语音数据进行截断,得到一段完整的语音数据,但是,当环境噪声较大时,采用这种方法会发生无法截断或误判截断等情况,导致无法及时进行语音识别,进而延长了智能设备的响应时间,导致用户无法获到及时的回复,降低了用户体验。
发明内容
本发明实施例提供一种语音信号处理方法、装置、电子设备及存储介质,以解决现有技术中无法对语音数据进行有效地截断,导致智能设备无法及时作出准确响应的问题。
第一方面,本发明一实施例提供了一种语音信号处理方法,包括:
对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;
对所述临时识别结果进行分词处理,得到若干分词片段;
获取第一分词序列之后的下一个分词片段为结束字符的预测概率,所述预测概率为根据所述词频数据确定的,所述词频数据包括基于语料库中的语料确定出的各分词序列在各语料中出现的次数,所述第一分词序列为所述临时识别结果中最后的N个分词片段组成的序列,N为正整数;
若所述预测概率大于概率阈值,对所述临时识别结果进行语义解析。
作为一种可能的实施方式,所述获取第一分词序列之后的下一个分词片段为结束字符的预测概率,具体包括:
从所述词频数据中获取所述第一分词序列对应的次数M;从所述词频数据中获取第二分词序列对应的次数K,所述第二分词序列为在所述第一分词序列之后增加所述结束字符得到的序列;根据所述K和所述M,确定所述预测概率;
或者,从预先配置的各N元分词序列之后的下一个分词片段为结束字符的概率数据中,将所述第一分词序列对应的概率数据确定为预测概率,所述N元分词序列是基于所述语料库中的语料进行分词处理得到的,所述概率数据是根据所述N元分词序列对应的词频数据和在所述N元分词序列之后增加所述结束字符得到的N+1元分词序列对应的词频数据确定的。
作为一种可能的实施方式,通过如下方式获取所述词频数据:
对所述语料库中的各语料进行分词处理,得到各语料对应的分词片段;
将每个语料中连续的N个分词片段组成的序列确定为一个N元分词序列;
将每个语料中连续的N+1个分词片段组成的序列确定为一个N+1元分词序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910809985.5/2.html,转载请声明来源钻瓜专利网。