[发明专利]齿音调整方法、装置、电子设备及计算机可读存储介质在审
申请号: | 202110163186.2 | 申请日: | 2021-02-05 |
公开(公告)号: | CN112951266A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 熊贝尔;朱一闻;曹偲;郑博;刘华平 | 申请(专利权)人: | 杭州网易云音乐科技有限公司 |
主分类号: | G10L21/0316 | 分类号: | G10L21/0316;G10L21/0208;G10L25/18 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 310052 浙江省杭州市萧山区钱江世*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 齿音 调整 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请的实施方式提供了一种齿音调整方法、齿音调整装置、电子设备以及计算机可读存储介质,涉及音频处理技术领域。该方法包括:获取到录制的音频数据;对所述音频数据进行音量归一化并根据归一化结果确定用于表征音量变化程度的增益值;根据所述增益值和音量归一化前所述音频数据对应的原齿音特征值计算音量归一化后所述音频数据对应的目标齿音特征值;根据所述目标齿音特征值对所述音频数据进行齿音调整。可见,实施本申请实施例可以对音频数据进行音量归一化,从而得到用于表征音量变化程度的增益值,进而根据增益值可以确定出音量归一化后的音频数据对应的齿音特征,根据该齿音特征对音频数据进行个性化的齿音调整,可以改善齿音抑制效果。
技术领域
本申请的实施方式涉及音频处理技术领域,更具体地,本申请的实施方式涉及齿音调整方法、齿音调整装置、电子设备以及计算机可读存储介质。
背景技术
齿音(ess/sibilant)是指人的一切咝擦声,对应于较高的锐度,一般不适宜人耳收听。对于音频采集软件(如,唱歌软件)而言,通常会在获取到的音频数据之后对音频数据中的齿音进行带阻滤波处理,进而再将处理后的音频数据输出给用户,使得音频数据中每帧数据都处于合适的锐度范围内,避免较高锐度的齿音对人耳的听力造成损伤。但是,不同音频数据对应的音量通常不同,如果使用统一的处理方式,容易导致齿音抑制效果不佳的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此,不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
基于上述问题,发明人进行了相应的思考,做出了有针对性的改进,提供了齿音调整方法、齿音调整装置、电子设备以及计算机可读存储介质,可以对音频数据进行音量归一化,从而得到用于表征音量变化程度的增益值,进而根据增益值可以确定出音量归一化后的音频数据对应的齿音特征,根据该齿音特征对音频数据进行个性化的齿音调整,可以改善齿音抑制效果。
根据本申请实施例的第一方面,公开了一种齿音调整方法,包括:
获取到录制的音频数据;
对音频数据进行音量归一化并根据归一化结果确定用于表征音量变化程度的增益值;
根据增益值和音量归一化前音频数据对应的原齿音特征值计算音量归一化后音频数据对应的目标齿音特征值;
根据目标齿音特征值对音频数据进行齿音调整。
在一个实施例中,基于前述方案,对音频数据进行音量归一化,包括:
当检测到用于开启降噪功能的用户操作时,确定用户操作在音频数据中对应的当前播放帧;
从当前播放帧开始逐帧进行音量归一化,直到检测到用于关闭降噪功能的用户操作为止或检测到音频数据播放完毕为止。
在一个实施例中,基于前述方案,根据目标齿音特征值对音频数据进行齿音调整,包括:
根据目标齿音特征值从当前播放帧开始逐帧进行齿音调整,直到检测到用于关闭降噪功能的用户操作为止或检测到音频数据播放完毕为止。
在一个实施例中,基于前述方案,根据目标齿音特征值对音频数据进行齿音调整之后,上述方法还包括:
将音频数据与进行齿音调整后的音频数据进行对应存储并播放齿音调整后的音频数据。
在一个实施例中,基于前述方案,根据增益值和音量归一化前音频数据对应的原齿音特征值计算音量归一化后音频数据对应的目标齿音特征值之前,上述方法还包括:
确定音频数据中各帧音频对应的频带响度;
根据各帧音频对应的频带响度计算各帧音频对应的响度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州网易云音乐科技有限公司,未经杭州网易云音乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110163186.2/2.html,转载请声明来源钻瓜专利网。