[发明专利]音频处理方法、装置、电子设备及存储介质在审
申请号: | 202010737225.0 | 申请日: | 2020-07-28 |
公开(公告)号: | CN111899726A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 李杰;成凯;郭少军 | 申请(专利权)人: | 上海喜日电子科技有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L25/78;G10L25/84 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张磊 |
地址: | 201100 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供的音频处理方法、装置、电子设备及存储介质。该音频处理方法中,通过控制语音与干扰声音两者之间在持续时长上的差异,对获取的音频片段进行分析,确定出有效音频片段。由于,由于能够区分出音频数据中的干扰声音与控制语音,因此,能够提高与设备语音交互过程中的准确率。
技术领域
本申请涉及数据处理领域,具体而言,涉及一种音频处理方法、装置、电子设备及存储介质。
背景技术
用户通过控制语音与设备进行交互时,环境中的其他干扰声音会对用户发出的控制语音造成一定的干扰。设备在进行语音交互时,难以区分其采集的音频数据是否为控制语音,继而影响语音交互的准确率。
发明内容
为了克服现有技术中的至少一个不足,本申请实施例的目的之一在于提供一种音频处理方法,所述方法包括:
获取语音控制时的音频数据;
从所述音频数据中确定出每次静默时长不超过第一时长阈值的待识别音频片段,其中,在所述静默时长内,该音频数据对应的声音强度不超过静默阈值;
将所述待识别音频片段的采集时长与第二时长阈值进行比较,确定超过该第二时长阈值的有效音频片段。
可选地,所述将所述待识别音频片段的采集时长与第二时长阈值进行比较,确定出超过该第二时长阈值的有效音频片段的步骤,包括:
将所述待识别音频片段的采集时长与所述第二时长阈值进行比较;
若所述待识别音频片段的采集时长超过该第二时长阈值,则将所述待识别音频片段确定为所述有效音频片段:
若所述待识别音频片段的采集时长不超过该第二时长阈值,则获取新的音频数据,再次从所述音频数据中确定出静默时长不超过第一时长阈值的待识别音频片段的步骤执行。
可选地,所述从所述音频数据中确定出每次静默时长不超过第一时长阈值的待识别音频片段的步骤,包括:
从所述音频数据中确定出每次静默时长不超过第一时长阈值的至少一条待识别音频片段;
所述将所述待识别音频片段的采集时长与第二时长阈值进行比较,确定超过该第二时长阈值的有效音频片段的步骤,包括:
针对每条待识别音频片段,将所述待识别音频片段的录音时长与所述第一时长阈值进行比较。
可选地,所述方法还包括:
统计多条有效语音片段的录音时长;
根据所述多条有效语音片段的录音时长的统计结果,调整所述第二时长阈值,获得新的第二时长阈值。
可选地,所述根据所述多条有效语音片段的录音时长的统计结果,调整所述第二时长阈值的步骤,包括:
根据所述多条有效语音的录音时长,获取所述多条有效语音的录音时长的高斯分布;
根据所述高斯分布结果,确定出置信区间超过置信阈值的时长作为所述新的第二时长阈值。
可选地,所述根据所述多条有效语音片段的录音时长的统计结果,调整所述第二时长阈值的步骤,包括:
将所述多条有效语音片段的录音时长按照递增或递减的顺序进行排序,获得排序结果;
根据所述排序结果,选取所述排序结果中预设位置的录音时长作为所述新的第二时长阈值。
可选地,记录有声纹信息与待匹配第二时长阈值的对应关系,所述将所述待识别音频片段的采集时长与第二时长阈值进行比较之前,还包括:
获取所述待识别音频片段的声纹信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海喜日电子科技有限公司,未经上海喜日电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010737225.0/2.html,转载请声明来源钻瓜专利网。