[发明专利]音频处理方法、装置、电子设备、存储介质在审

专利信息
申请号: 202111443133.2 申请日: 2021-11-30
公开(公告)号: CN114171006A 公开(公告)日: 2022-03-11
发明(设计)人: 姜双双;戚萌;陆成;董斐 申请(专利权)人: 展讯通信(上海)有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/04;G10L15/06;G10L15/26
代理公司: 上海弼兴律师事务所 31283 代理人: 金学来;罗朗
地址: 201203 上海市浦东新区自*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 处理 方法 装置 电子设备 存储 介质
【说明书】:

发明公开了音频处理方法、装置、电子设备、存储介质。该音频处理方法,包括:确定音频数据的各音频帧的预估语料的概率以及所述预估语料的语料序列;确定目标语料在所述语料序列中的位置信息;将各个预估语料中概率与所述目标语料相匹配的预估语料的音频帧,确定为所述目标语料的初始音频帧;从所述初始音频帧中确定对应于所述位置信息的目标音频帧,并将所述目标音频帧确定为包含所述目标语料的音频片段。从而,能够准确定位目标语料在音频数据中的位置,准确确定音频数据中包含目标语料的音频片段,相较于人工确定目标语料的位置的方式,不仅节省了人力成本,还具有效率高、准确度高的优点。

技术领域

本发明涉及音频处理技术领域,尤其涉及一种音频处理方法、装置、电子设备、存储介质。

背景技术

AI(人工智能)技术引入智能语音领域,很大程度的提高了识别率,降低了误识别率,但是要求训练样本有大量的语料支持,而对于语音唤醒和多命令词识别来说,现有的开源数据十分有限,获取途径通常是人工录取或者人工确定开源的音频数据中目标语料的位置并手动截取音频片段作为训练样本,这种方法费时费力。

发明内容

本发明要解决的技术问题是为了克服现有技术中通过人工录取或者人工确定开源的音频数据中目标语料的位置并手动截取音频片段的方式费时费力的缺陷,提供一种音频处理方法、装置、电子设备、存储介质。

本发明是通过下述技术方案来解决上述技术问题:

第一方面,提供一种音频处理方法,包括:

确定音频数据的各音频帧的预估语料的概率以及所述预估语料的语料序列;

确定目标语料在所述语料序列中的位置信息;

将所述各个预估语料中概率与所述目标语料相匹配的预估语料的音频帧,确定为所述目标语料的初始音频帧;

从所述初始音频帧中确定对应于所述位置信息的目标音频帧,并将所述目标音频帧确定为包含所述目标语料的音频片段。

可选地,确定目标语料在所述语料序列中的位置信息,包括:

在所述目标语料包含多个语料的情况下,将所述语料序列的所有音素中与所述目标语料包含的多个语料的排序规则相匹配的音素的位置信息,确定为所述目标语料在所述语料序列中的位置信息。

可选地,从所述初始音频帧中确定对应于所述位置信息的目标音频帧,包括:

从所述音频数据的所有音频帧中确定出非静音帧;

将所述初始音频帧中帧坐标落入所述位置信息对应的非静音帧的帧坐标范围内的音频帧确定为所述目标音频帧;所述帧坐标范围的下限值为所述位置信息表征的帧坐标,所述帧坐标范围的上限值为所述位置信息表征的帧坐标与帧数差之和,所述帧数差为所述语料序列中语料的数量与从所述所有音频帧中确定出的非静音帧的数量之差。

可选地,确定音频数据的各音频帧的各个预估语料的概率以及所述各个预估语料的语料序列,包括:

将所述音频数据的输入预先训练的语音识别模型,根据所述语音识别模型的输出结果确定所述各个预估语料的概率和所述语料序列。

第二方面,提供一种音频处理装置,包括:

语料确定模块,用于确定音频数据的各音频帧的预估语料的概率以及所述预估语料的语料序列;

位置确定模块,用于确定目标语料在所述语料序列中的位置信息;

音频帧确定模块,用于将各个预估语料中概率与所述目标语料相匹配的预估语料的音频帧,确定为所述目标语料的初始音频帧;

片段确定模块,用于从所述初始音频帧中确定对应于所述位置信息的目标音频帧,并将所述目标音频帧确定为包含所述目标语料的音频片段。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于展讯通信(上海)有限公司,未经展讯通信(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111443133.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top