[发明专利]用于单个和多个发言者的双模式AGC有效

专利信息
申请号: 201310052511.3 申请日: 2013-02-06
公开(公告)号: CN103247297A 公开(公告)日: 2013-08-14
发明(设计)人: N·恩伯姆;J·斯科格伦德;A·J·麦克唐纳德;B·沃尔克 申请(专利权)人: 谷歌公司
主分类号: G10L25/27 分类号: G10L25/27;G06K9/00;H04N7/15
代理公司: 北京市金杜律师事务所 11256 代理人: 酆迅
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 单个 发言者 双模 agc
【权利要求书】:

1.一种用于改变通信系统中音频电平的控制系统(100),所述控制系统包括:

至少一个接收单元(110、120),用于接收音频信号和视频信号;

确定单元(130、140),用于通过对所述音频信号或所述视频信号执行识别来确定正在发言的个体的数目;以及

增益调整单元(150),用于基于所确定的正在发言的个体的所述数目来调整所述音频信号的增益。

2.根据权利要求1所述的控制系统,其中

所述识别通过执行脸部识别或语音分析来执行,以便确定正在发言的个体的数目。

3.根据权利要求1所述的控制系统,其中

所述识别通过对所述音频信号执行语音分析来执行,以便确定正在发言的个体的数目。

4.根据权利要求1所述的控制系统,其中

所述识别通过对所述视频信号执行脸部识别来执行。

5.根据权利要求1所述的控制系统,进一步包括:

切换单元(150)用于基于所检测到的正在发言的个体的数目在单个发言者模式与多发言者模式之间切换。

6.根据权利要求4所述的控制系统,其中

所述脸部识别被执行以用于检测一个或多个脸部。

7.根据权利要求6所述的控制系统,进一步包括:

切换单元(150)用于基于所检测到的脸部的数目在单个发言者模式与多发言者模式之间切换。

8.根据权利要求6所述的控制系统,其中

响应于所述检测到多个脸部,所述切换单元从所述单个发言者模式切换到所述多发言者模式,并且增益调整单元在所述多发言者模式中以第一速率调整所述音频信号的增益,

响应于所述仅检测到单个脸部,所述切换单元从所述多发言者模式切换到所述单个发言者模式,并且增益调整单元在所述单个发言者模式中以第二速率调整所述音频信号的增益,并且

其中所述第一速率是不同于所述第二速率的速率。

9.根据权利要求8所述的控制系统,

其中所述第一速率是大于所述第二速率的速率。

10.根据权利要求1所述的控制系统,

其中所述检测单元通过将所检测到的语音的音量与至少一个阈值进行比较来确定所检测到的语音的音量是否在给定音量范围之外,

其中所述检测单元基于所检测到的语音的音量出现在所述给定音量范围之外来确定所检测到的语音的音量是否在所述给定音量范围之外,

其中所述检测单元基于所检测到的语音的音量来确定所述第一速率,以及

其中所述检测单元基于所检测到的语音的音量来确定所述第二速率。

11.根据权利要求1所述的控制系统,其中

所述至少一个接收单元接收具有所述音频信号和所述视频信号两者的数据流。

12.根据权利要求1所述的控制系统,其中

所述至少一个接收单元包括第一接收单元用于接收所述音频信号;以及

所述至少一个接收单元包括第二接收单元用于接收所述视频信号。

13.根据权利要求12所述的控制系统,其中

所述第一接收单元是麦克风;以及

所述第二接收单元是相机。

14.一种用于改变通信系统中音频电平的控制方法,所述控制方法包括:

接收音频信号(310);

接收视频信号(210);

对所述视频信号或所述音频信号执行识别来确定正在发言的个体的数目(220、230、320、330);以及

基于所确定的正在发言的个体的所述数目来调整所述音频信号的增益(240、250、340、350)。

15.根据权利要求14所述的控制方法,其中

所述识别通过执行脸部识别或语音分析来执行,以便确定正在发言的个体的所述数目。

16.根据权利要求14所述的控制方法,其中

所述识别通过对所述音频信号执行语音分析来执行,以便确定正在发言的个体的所述数目。

17.根据权利要求14所述的控制方法,其中

所述识别通过对所述视频信号执行脸部识别来执行。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310052511.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top