[发明专利]基于检测音频信号中的特定声音来调整齿音检测在审
申请号: | 202080051216.4 | 申请日: | 2020-07-16 |
公开(公告)号: | CN114127848A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 马远星;李凯;房倩倩 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G10L25/60 | 分类号: | G10L25/60;G10L25/18;G10L25/30;G10L21/0232;G10L25/78 |
代理公司: | 北京市汉坤律师事务所 11602 | 代理人: | 魏小薇;吴丽丽 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 检测 音频 信号 中的 特定 声音 调整 齿音 | ||
本文公开了一种用于调整齿音检测器的参数的方法。从正在接收的音频信号中提取时频特征。基于这些时频特征,确定音频信号是否包括短期特征或长期特征。根据确定音频信号包括短期特征或长期特征,对用于检测音频信号中的齿音的齿音检测器的一个或多个参数进行调整。使用具有一个或多个经调整的参数的齿音检测器来检测音频信号中的齿音。
相关申请的交叉引用
本申请要求于2019年8月8日提交的美国临时申请号62/884,320和2019年7月17日提交的国际申请号PCT/CN 2019/096399的优先权,其中每个均通过援引并入本文。
技术领域
本公开的实施例总体上涉及音频信号处理,并且更具体地涉及齿音(sibilance)检测的调整。
背景技术
在语音学中,齿音是指具有强烈重读的摩擦辅音(例如,s、sh、ch、z、v和f)的言语。这些辅音是当通过声道的空气受到舌头和嘴唇的位置限制时产生的。音频信号中的齿音通常在4kHz(“千赫兹”)到12kHz的频率范围内,这取决于各说话的人。如果齿音的能量高,则言语将具有不自然的刺耳感,这将降低音频信号的质量并使收听者感到厌烦。
发明内容
所公开的实施例检测音频信号中的短期特征和长期特征并且调整齿音检测,以避免将特征误认为音频信号中的过度齿音。所公开的系统和方法的优点在于,通过不抑制可能是音频内容的期望部分的短期特征或长期特征来保持音频信号的质量。所公开的系统和方法对于低保真度设备特别有用,如对高频具有较差麦克风频率响应的低质量头戴式设备或具有低质量扬声器的移动设备。
在一些方面,本公开描述了一种用于调整齿音参数并且在齿音检测中使用经调整的齿音参数的方法。系统接收音频信号(例如,电影配乐、音乐、用户生成的音频或播客)并且从音频信号中提取多个时频特征(例如,多个频带的能量数据),时频特征包括短期特征(如冲击音(例如,枪声)和/或平摩擦音(例如,字母“f”音))和/或长期特征(如经平滑的频谱平衡特征)。根据确定输入信号包括短期特征和/或长期特征,系统对用于检测音频信号中的齿音的齿音检测器的一个或多个参数进行调整。使用具有一个或多个经调整的参数的齿音检测器,系统继续检测音频信号中的齿音并且使用多频带压缩器抑制齿音,或者将检测到的齿音用于任何其他期望的应用。在实施例中,使用基于监督或无监督机器学习的分类器(例如,神经网络)来实施齿音检测器,所述分类器在具有一个或多个短期特征和/或长期特征的音频样本上被训练。
这些和其他方面、特征和实施例可以被表达为用于执行功能的方法、装置、系统、部件、程序产品、构件或步骤,并且可以以其他方式表达。
通过以下描述,包括权利要求,这些和其他方面、特征和实施例将变得显而易见。
附图说明
在附图中,为了便于描述,示出了示意性元件的特定布置或排序,如那些表示设备、模块、指令块和数据元素的示意性元件。然而,本领域技术人员应当理解,附图中示意性元件的特定排序或布置并不意味着需要特定的处理次序或顺序、或者过程的分离。进一步地,在附图中包括示意性元件并不意味着在所有实施例中都需要这种元件,或者在一些实施例中,由这种元件表示的特征可以不包括在其他元件中或与其他元件组合。
进一步地,在使用如实线或虚线或箭头等连接元件来说明两个或更多个其他示意性元件之间的连接、关系或关联的附图中,不存在任何这种连接元件并不意味着不能存在连接、关系或关联。换句话说,元件之间的一些连接、关系或关联没有在附图中示出,以免混淆本公开。另外,为了便于说明,使用单个连接元件来表示元件之间的多种连接、关系或关联。例如,在连接元件表示信号、数据或指令的通信的情况下,本领域技术人员应当理解,这种元件表示可能需要的用于影响通信的一个或多个信号路径。
图1A是根据本公开的一些实施例的调整用于齿音检测的参数的系统的框图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080051216.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:光电组件、像素、显示装置和方法
- 下一篇:NK细胞定向的嵌合蛋白