[发明专利]语音活性检测方法、语音活性检测装置以及电子设备在审

专利信息
申请号: 201910811556.1 申请日: 2019-08-30
公开(公告)号: CN110428853A 公开(公告)日: 2019-11-08
发明(设计)人: 戴健 申请(专利权)人: 北京太极华保科技股份有限公司
主分类号: G10L25/78 分类号: G10L25/78;G10L25/84;G10L25/21;G10L25/18;G10L15/26;G10L25/51
代理公司: 北京善任知识产权代理有限公司 11650 代理人: 金杨
地址: 102200 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 声音数据 语音 活性检测 活性检测装置 语音活动检测 电子设备 预设条件 语音数据 准确度 热噪声 检测 噪音
【说明书】:

发明提供了一种语音活性检测方法、语音活性检测装置及电子设备。语音活性检测方法包括:获取声音数据;提取所述声音数据中的能量值数据;提取所述声音数据中的第二特征;根据声音数据中的能量值数据,判断所述声音数据是否满足第一预设条件;当满足所述第一预设条件后,根据所述第二特征,判断所述声音数据是否为语音数据。本发明的语音活性检测方法通过两次判断的方式进行判断,相对于现有技术,具有更高的准确度,本发明不仅能实现传统方案的检测效果,在遇到能量值较大、持续时间较长或者偶发性噪音时仍可以检测是否为人的声音,是否为是环境热噪声;此外,本发明方案使语音活动检测有效率提高了30%,提高了语音活动检测的准确性以及实用性。

技术领域

本发明涉及语音活性检测技术,特别涉及一种语音活性检测方法、语音活性检测装置、以及采用了该语音活性检测方法的电子设备。

背景技术

VAD(Voice Activity Detection,语音活性检测)是智能语音交互中的重要技术。在智能语音交互中,检测到活动语音之后,再向后将语音转成文字,最后将文字送给智能引擎进行处理。在智能语音处理中,VAD主要起到两个作用:

1)检测到是人的语音之后,再将其发给ASR(Automatic Speech Recognition,自动语音识别)处理,可以极大的节省带宽、节省ASR的使用费用;

2)可以避免环境噪音导致的ASR误识别,进而导致流程引擎的错误处理动作。

传统的VAD检测技术,主要有两种方案:方案1是简单设定声音的能量值与持续时间作为阈值,对噪声进行检测。该方案的问题是当遇到能量值较大或持续时间较长的噪音时无能为力;方案2是利用信号处理(如高斯分布等算法),对噪音进行检测。该方案的代表方案是WebRTC,而WebRTC中的VAD模块能较好的处理一定特征的背景噪声,但对于偶发性的噪声无能为力。

上述两种方案一致存在的问题,是无法判断是否是人的声音。两种方案更多用于传统电话人人交互领域,而非人机交互领域的场景设计。对于智能语音交互,需要突出检测是否是人的声音,这两种方案存在的诸多不足,无法满足这一要求。

因此,希望有一种技术方案来克服或至少减轻现有技术的至少一个上述缺陷。

发明内容

本发明目的在于提供语音活性检测方法、设备以及电子设备来克服或至少减轻现有技术的至少一个上述缺陷。

为实现上述目的,本发明提供一种语音活性检测方法,所述语音活性检测方法包括:获取声音数据;提取所述声音数据中的能量值数据;提取所述声音数据中的第二特征;根据声音数据中的能量值数据,判断所述声音数据是否满足第一预设条件;当满足所述第一预设条件后,根据所述第二特征,判断所述声音数据是否为语音数据。

可选地,所述第二特征包括所述声音数据中的声音数据特征以及所述声音数据中的频域数据特征;

所述当满足所述第一预设条件后,根据所述第二特征,判断所述声音数据是否为语音数据包括:

当满足所述第一预设条件后,根据所述声音数据中的频域数据,对所述声音数据进行识别,判断所述声音数据是否为非杂音数据;

当满足所述第一预设条件以及判断所述声音数据为非杂音数据后,根据所述声音数据特征,识别所述声音数据中是否具有文字信息;

若所述声音数据中具有文字信息,则确定所述声音数据为语音数据。

可选地,所述第一预设条件包括能量阈值以及持续时间阈值;

所述根据声音数据中的能量值数据,判断所述声音数据是否满足第一预设条件包括:

判断所述声音数据中的能量值数据是否超过所述能量阈值且超过所述能量阈值的声音数据的持续时间是否超过所述持续时间阈值,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京太极华保科技股份有限公司,未经北京太极华保科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910811556.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code