[发明专利]针对自动化的说话者追踪系统的声学回声控制有效
申请号: | 201480057051.6 | 申请日: | 2014-10-07 |
公开(公告)号: | CN105637860B | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 孙浩海 | 申请(专利权)人: | 思科技术公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;G10L25/51;H04M9/08 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 李晓冬 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 自动化 说话 追踪 系统 声学 回声 控制 | ||
一种处理系统可以包括:追踪麦克风阵列;音频追踪器电路,其被连接到追踪麦克风阵列以基于来自阵列的音频输入来追踪音频源;通信麦克风;处理器。处理器可以包括音频电路以从通信麦克风接收音频输入并且处理音频输入以将声学回声消除(AEC)和声学回声抑制(AES)处理中的一个或多个应用到音频输入。处理器还可以包括计算电路以计算AEC和/或AES处理之后和之前的信号功率的比和控制电路以基于由计算电路计算的比来生成声学回声存在指示。处理器可以经由发送电路、经由处理器和音频追踪器之间的数据通信信道来将声学回声存在指示发送到音频追踪设备。
技术领域
本申请一般地涉及说话者追踪系统和声学回声控制。
背景技术
在典型的说话者(speaker)追踪系统中,声学回声控制基于输出给说话者的音频输出(即,音频输出返回)而被执行。
附图说明
通过参考以下具体描述并结合附图进行考虑时,对所公开的实施例及其带来的优点的更完整的认识将能够被容易地获得同时也变得更好理解,其中:
图1是执行音频追踪的传统硬件装置的示意图;
图2是执行音频追踪的另一硬件装置的示意图;
图3是处理器的示意图;
图4是另一处理器的示意图;以及
图5是示例性算法的流程图。
具体实施方式
根据示例性实现方式,一种处理器可以包括以下各项:音频电路,其被配置为从通信麦克风接收音频输入,并且处理音频输入以将声学回声消除(AEC)和声学回声抑制(AES)处理中的一个或多个应用到音频输入;计算电路,其被配置为计算AEC和/或AES处理之后与之前的信号功率的比;控制电路,其被配置为基于由计算电路计算的比来生成声学回声存在指示(acoustic echo presence indication);发送电路,其被配置为将声学回声存在指示发送到音频追踪设备。
计算电路还可以被配置为将该比值与预定义的阈值进行比较,并且控制电路可以被配置为基于相对于预定义的阈值的比值来生成声学回声存在指示,并且将声学回声存在指示发送到音频追踪设备。
预定义的阈值可以为0.9,其中比值大于0.9指示微不足道的、无关紧要的声学回声或者无声学回声,比值为0.9或小于0.9指示强回声。预定义的阈值还可以为大约或近似0.9,在0.9+/-1%、2%、3%、4%或5%和任意中间值的范围内,或者在0.9+/-0.1、0.2、0.3、0.4或0.5的范围内。预定义的阈值还可以为大约或近似0.80、0.81、0.82、0.83、0.84、0.85、0.86、0.87、0.88、0.90、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98或0.99,在0.1%、0.5%、1%、2%、3%、4%或5%和任意中间值的范围内(相关值上限为1),或者在近似值的0.1、0.2、0.3、0.4或0.5范围内(相关值上限为1)。
预定义的阈值还可以是满足以下范围的任意值:0.8≤阈值≤0.9、0.75≤阈值≤0.95、0.85≤阈值≤0.95、0.88≤阈值≤0.9、0.9≤阈值≤0.92、0.89≤阈值≤0.91、0.85≤阈值≤0.9、0.8<阈值<0.9、0.75<阈值<0.95、0.85<阈值<0.95、0.88<阈值<0.9、0.9<阈值<0.92、0.89<阈值<0.91或0.85≤阈值≤0.9。
计算电路可以被配置为计算针对每一时间帧的全频段信号的比。
计算电路可以被配置为计算针对每一时间帧的众多窄带信号的比。
计算电路可以被配置为计算短时傅里叶变换域中的众多频率点(frequency bin)的比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思科技术公司,未经思科技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480057051.6/2.html,转载请声明来源钻瓜专利网。