[发明专利]音频处理方法、装置、存储介质、电子设备在审
申请号: | 202111296208.9 | 申请日: | 2021-11-03 |
公开(公告)号: | CN114242111A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 杨锐;刘永亮 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G10L25/48 | 分类号: | G10L25/48;G06F21/10 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司 11134 | 代理人: | 谢湘宁;李静茹 |
地址: | 311121 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 存储 介质 电子设备 | ||
1.一种音频处理方法,其特征在于,包括:
获取待处理音频;
对所述待处理音频进行分帧处理,得到多个音频帧;
对所述多个音频帧的至少一个音频帧进行偏移位置搜索,得到第一样本对和第二样本对;
基于用户标识信息和多个候选偏移值,对所述第一样本对和所述第二样本对进行样本偏移,得到偏移后音频。
2.根据权利要求1所述的音频处理方法,其特征在于,对所述待处理音频进行分帧处理,得到所述多个音频帧包括:
按照固定样本数量对所述待处理音频进行分帧处理,得到所述多个音频帧,其中,所述多个音频帧的每个音频帧包括:多个样本。
3.根据权利要求2所述的音频处理方法,其特征在于,对所述多个音频帧的至少一个音频帧进行偏移位置搜索,得到所述第一样本对包括:
从所述多个样本中的第一个样本开始往后搜索,查找样本符号反转的两个相邻样本,得到所述第一样本对;或者,
从所述多个样本中的第一个样本开始往后搜索,查找连续静音样本,并从所述连续静音样本中选取两个静音样本,得到所述第一样本对。
4.根据权利要求2所述的音频处理方法,其特征在于,对所述多个音频帧的至少一个音频帧进行偏移位置搜索,得到所述第二样本对包括:
从所述多个样本中的末尾样本开始往前搜索,查找样本符号反转的两个相邻样本,得到所述第二样本对;或者,
从所述多个样本中的末尾样本开始往前搜索,查找连续静音样本,并从所述连续静音样本中选取两个静音样本,得到所述第二样本对。
5.根据权利要求1所述的音频处理方法,其特征在于,基于所述用户标识信息和所述多个候选偏移值,对所述第一样本对和所述第二样本对进行样本偏移,得到所述偏移后音频包括:
基于所述用户标识信息和所述多个候选偏移值,生成偏移序列;
利用所述偏移序列对所述第一样本对和所述第二样本对进行样本偏移,得到偏移后边界样本;
对所述偏移后边界样本进行插值平滑处理,得到所述偏移后音频。
6.根据权利要求5所述的音频处理方法,其特征在于,基于所述用户标识信息和所述多个候选偏移值,生成所述偏移序列包括:
基于第一数量和预设偏移幅度,确定所述多个候选偏移值,其中,所述第一数量为所述多个音频帧的每个音频帧中所包含的固定样本数量;
利用所述用户标识信息生成随机序列,其中,所述随机序列的长度为第二数量,所述第二数量为所述多个音频帧的数量;
通过所述随机序列与所述多个候选偏移值之间的映射关系,生成所述偏移序列。
7.根据权利要求1所述的音频处理方法,其特征在于,所述音频处理方法还包括:
从所述多个音频帧中查找目标音频帧;
对多个目标样本进行相关度计算,确定样本对齐位置,其中,所述多个目标样本为所述偏移后音频中选取的多个连续样本,所述目标音频帧与所述多个目标样本的相关度满足预设条件;
从所述样本对齐位置开始,对所述偏移后音频进行分帧处理,得到多个偏移后音频帧;
通过所述多个音频帧与所述多个偏移后音频帧之间的对应关系,从第三数量的偏移后音频帧中连续提取二进制随机序列,其中,所述第三数量为所述用户标识信息的二进制表示所需最大长度;
利用所述二进制随机序列重构所述用户标识信息。
8.一种音频处理方法,其特征在于,包括:
接收来自于客户端的待处理音频;
对所述待处理音频进行分帧处理以得到多个音频帧,对所述多个音频帧的至少一个音频帧进行偏移位置搜索以得到第一样本对和第二样本对,以及基于用户标识信息和多个候选偏移值对所述第一样本对和所述第二样本对进行样本偏移以得到偏移后音频;
将所述偏移后音频反馈至所述客户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111296208.9/1.html,转载请声明来源钻瓜专利网。