[发明专利]语音数据的分离方法、装置、设备及存储介质在审

专利信息
申请号: 202110838468.8 申请日: 2021-07-23
公开(公告)号: CN113470688A 公开(公告)日: 2021-10-01
发明(设计)人: 张旭龙;王健宗 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G10L21/0272 分类号: G10L21/0272;G10L25/18;G10L25/30
代理公司: 深圳众鼎专利商标代理事务所(普通合伙) 44325 代理人: 陈美君
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 数据 分离 方法 装置 设备 存储 介质
【说明书】:

发明涉及语音信号处理技术领域,本发明公开了一种语音数据的分离方法、装置、设备及存储介质,所述方法包括:通过将待分离语音数据输入至人声分离模型;对贷分离语音数据进行多通道子频带处理,得到全频数据和子频带数据;再对各全频数据以及所有子频带数据进行人声频率特征提取,根据提取的人声频率特征进行识别,得到人声识别矩阵;运用二值掩蔽方法,对所有人声识别矩阵进行掩码拼接处理,得到分离掩码结果;对待分离语音数据进行人声分离,得到人声音频数据。因此,本发明实现了自动分离出语音数据中的人声部分,无需人工录制,节省成本,提高了分离准确率和质量。

技术领域

本发明涉及语音信号处理技术领域,尤其涉及一种语音数据的分离方法、装置、设备及存储介质。

背景技术

音乐是一种乐器音和歌声混合叠加而成的复杂音频信号,其中包含了各种乐器的伴奏和不同人的歌声,近些年来,音乐创作速度呈现爆炸式增长,每天有成百上千的原唱歌曲产生,但与原唱歌曲相对应的K歌伴奏无法及时提供到K歌系统中进行导入使用,K歌系统中的绝大部分伴奏库都需要具有音频知识的专业人员进行录制,而且目前现有技术大部分针对双声道歌曲的人声和伴奏的分离,无法对单声道歌曲进行,造成应用场景受限,以及对双声道歌曲进行分离时,需要同时对左右声道的混合歌曲进行分离,造成对双声道音频的分离复杂度较高,往往容易出现混杂人声部分。因此,现有的人声和半奏的分离方案的要求门槛高,录制效率低,成本高,而且达不到用户对于纯净的伴奏声或者人声的要求。

发明内容

本发明提供一种语音数据的分离方法、装置、计算机设备及存储介质,实现了通过人声分离模型进行多通道子频带处理,和人声频率特征提取,以及运用二值掩蔽方法,自动分离出语音数据中的人声部分,无需人工录制,减少了成本,提高了分离准确率和质量,并提升了分离效率和用户体验满意度。

一种语音数据的分离方法,包括:

获取待分离语音数据,并将所述待分离语音数据输入至人声分离模型;

对所述待分离语音数据进行多通道子频带处理,得到多个全频数据和多个子频带数据;其中,一个所述全频数据对应多个所述子频带数据;

对各所述全频数据以及与各所述全频数据对应的所有所述子频带数据进行人声频率特征提取,根据提取的所述人声频率特征进行人声频率点识别,得到与各所述全频数据一一对应的人声识别矩阵;

运用二值掩蔽方法,对所有所述人声识别矩阵进行掩码拼接处理,得到分离掩码结果;

根据所述分离掩码结果,对所述待分离语音数据进行人声分离,得到与所述待分离语音数据对应的人声音频数据。

一种语音数据的分离装置,包括:

获取模块,用于获取待分离语音数据,并将所述待分离语音数据输入至人声分离模型;

处理模块,用于对所述待分离语音数据进行多通道子频带处理,得到多个全频数据和多个子频带数据;其中,一个所述全频数据对应多个所述子频带数据;

提取模块,用于对各所述全频数据以及与各所述全频数据对应的所有所述子频带数据进行人声频率特征提取,根据提取的所述人声频率特征进行人声频率点识别,得到与各所述全频数据一一对应的人声识别矩阵;

拼接模块,用于运用二值掩蔽方法,对所有所述人声识别矩阵进行掩码拼接处理,得到分离掩码结果;

分离模块,用于根据所述分离掩码结果,对所述待分离语音数据进行人声分离,得到与所述待分离语音数据对应的人声音频数据。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音数据的分离方法的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110838468.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top