[发明专利]基于检测音频信号中的特定声音来调整齿音检测在审
申请号: | 202080051216.4 | 申请日: | 2020-07-16 |
公开(公告)号: | CN114127848A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 马远星;李凯;房倩倩 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/18;G10L25/30;G10L21/0232;G10L25/78 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 魏小薇;吴丽丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 检测 音频 信号 中的 特定 声音 调整 齿音 | ||
1.一种方法,包括:
接收音频信号;
从所述音频信号中提取多个时频特征,所述多个时频特征包括一个或多个短期特征或长期特征;
根据所提取的短期特征或长期特征,对用于检测所述音频信号中的齿音的齿音检测器的一个或多个参数进行调整;以及
使用具有一个或多个经调整的参数的所述齿音检测器来检测所述音频信号中的齿音。
2.如权利要求1所述的方法,其中,所述短期特征包括冲击音。
3.如权利要求1所述的方法,其中,所述短期特征包括平摩擦音。
4.如权利要求1所述的方法,其中,所述长期特征包括经平滑的音频频谱平衡特征。
5.如权利要求1所述的方法,其中,调整齿音检测器的所述一个或多个参数包括生成控制信号,所述控制信号包括由短期特征检测产生的值。
6.如权利要求1所述的方法,其中,调整齿音检测器的所述一个或多个参数包括:
确定所述一个或多个短期特征;
确定所述一个或多个长期特征;以及
基于所述一个或多个短期特征和所述一个或多个长期特征的组合来调整所述一个或多个齿音参数。
7.如权利要求1或2所述的方法,其中,使用所述多个时频特征来确定所述音频信号是否包括所述冲击音包括:
对于所述音频信号中的第一时间间隔,计算一个或多个齿音频带中的第一总功率和一个或多个非齿音频带中的第二总功率;
对于所述音频信号中的第二时间间隔,计算一个或多个齿音频带中的第三总功率和一个或多个非齿音频带中的第四总功率;
基于所述第一总功率与所述第三总功率之间的差值来确定第一通量值,并且基于所述第二总功率与所述第四总功率之间的差值来确定第二通量值;以及
基于所述第一通量值是否满足第一阈值以及所述第二通量值是否满足第二阈值来确定是否存在所述冲击音。
8.如权利要求1至3中任一项所述的方法,进一步包括响应于确定存在所述冲击音:
生成输出值;以及
对所述输出值应用平滑算法。
9.如权利要求4所述的方法,其中,对所述输出值应用所述平滑算法包括使用起音时间常数和释放时间常数。
10.如权利要求5所述的方法,进一步包括基于所述冲击音的类型来调整所述起音时间常数或所述释放时间常数。
11.如权利要求1至6中任一项所述的方法,进一步包括基于所述多个时频特征来确定所述冲击音的类型。
12.如权利要求7所述的方法,其中,确定冲击音的类型包括:
将所述齿音频带和非齿音频带中的每一者的数据与多个已知冲击音的对应频带数据进行比较;以及
基于所述比较来识别所述冲击音。
13.如权利要求1至12中任一项所述的方法,其中,使用所述多个时频特征来确定所述音频信号是否包括所述平摩擦音包括:
基于齿音语音频带频谱和频带数量来计算齿音频谱平坦度度量。
14.如权利要求1至12中任一项所述的方法,其中,使用所述多个时频特征来确定所述音频信号是否包括所述平摩擦音包括:
计算相邻齿音频带的功率的方差。
15.如权利要求1至12中任一项所述的方法,其中,使用所述多个时频特征来确定所述音频信号是否包括所述平摩擦音包括:
计算齿音频带中的功率的峰值-均值比或峰值-中值比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080051216.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光电组件、像素、显示装置和方法
- 下一篇:NK细胞定向的嵌合蛋白