[发明专利]用于信号传输控制的方法和系统有效
申请号: | 201210080977.X | 申请日: | 2012-03-23 |
公开(公告)号: | CN103325386A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 格伦·N·迪金森;双志伟;大卫·古纳万;孙学京 | 申请(专利权)人: | 杜比实验室特许公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 杜诚;李春晖 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 信号 传输 控制 方法 系统 | ||
1.一种方法,包括:
接收或访问音频信号,所述音频信号包括多个时间上顺序的块或帧;
确定两个或更多特征,所述特征合起来表征先前在相对于当前时间点最近的时间段内已经处理的所述顺序音频块或帧中的两个或更多个,其中所述特征确定超过特异度标准,并且相对于最近处理的音频块或帧被延迟;
检测所述音频信号中语音活动的指示,其中所述语音活动检测(VAD)基于一个判决,所述判决超过预设的灵敏度阈值并且在一个时间段上计算而得,所述时间段相对于每个所述音频信号块或帧的时长而言是短的,其中所述判决涉及当前音频信号块或帧的一个或更多个特征;
组合所述高灵敏度短期VAD、所述最近高特异度音频块或帧特征确定和涉及状态的信息,所述信息基于一个或更多个先前计算的特征确定的历史,所述特征确定是从在所述最近高特异度音频块或帧特征确定时间段之前的时间确定的多个特征中收集的;以及
基于所述组合输出有关所述音频信号的开始或终止的判决,或与之相关的增益。
2.如权利要求1所述的方法,其中所述组合步骤还包括组合与一个特征有关的一个或更多个信号或确定,该特征包括所述音频信号的当前或先前处理的特征。
3.如权利要求1所述的方法,其中所述状态涉及烦扰特征或音频信号中的语音内容与音频信号的总音频内容的比值中的一个或更多个。
4.如权利要求1所述的方法,其中所述组合步骤还包括组合涉及远端装置或音频环境的信息,所述远端装置或音频环境与正执行所述方法的装置通信耦合。
5.如权利要求1所述的方法,还包括:
分析所确定的表征最近处理的音频块或帧的特征;
基于所确定的特征的分析,推断所述最近处理的音频块或帧包含至少一个非期望的时间信号分段;以及
基于非期望信号分段推断来测量烦扰特征。
6.如权利要求5所述的方法,其中所测量的烦扰特征是变化的。
7.如权利要求6所述的方法,其中所测量的烦扰特征是单调变化的。
8.如权利要求5、6或7中的一个或更多个所述的方法,其中所述高特异度先前音频块或帧特征确定包括期望语音内容相对于非期望时间信号分段的比值或主导程度中的一个或更多个。
9.如权利要求5、6、7或8中的一个或更多个所述的方法,还包括计算涉及所述期望语音内容相对于所述非期望时间信号分段的比值或主导程度的移动统计数据。
10.如权利要求5所述的方法,还包括:
确定一个或更多个特征,所述特征识别两个或更多个所述先前处理的顺序音频块或帧的聚集上的烦扰特征;
其中所述烦扰测量进一步基于所述烦扰特征识别。
11.如权利要求1所述的方法,还包括:
控制增益应用;以及
基于所述增益应用控制,平滑所述期望时间音频信号分段开始或终止。
12.如权利要求11所述的方法,其中:
所述平滑期望时间音频信号分段开始包括渐强;以及
所述平滑期望时间音频信号分段终止包括渐弱。
13.如权利要求3或引用权利要求6的权利要求7中的一个或更多个所述的方法,还包括基于所测量的烦扰特征来控制增益水平。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210080977.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可拆卸盖板的小容量交流接触器
- 下一篇:抗弯曲的多模光纤和光学系统