[发明专利]用于单个和多个发言者的双模式AGC有效

申请号：	201310052511.3	申请日：	2013-02-06
公开（公告）号：	CN103247297A	公开（公告）日：	2013-08-14
发明（设计）人：	N·恩伯姆;J·斯科格伦德;A·J·麦克唐纳德;B·沃尔克	申请（专利权）人：	谷歌公司
主分类号：	G10L25/27	分类号：	G10L25/27;G06K9/00;H04N7/15
代理公司：	北京市金杜律师事务所 11256	代理人：	酆迅
地址：	美国加利***	国省代码：	美国;US
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于单个发言者双模 agc
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于改变通信系统中音频电平的控制系统(100)，所述控制系统包括：

至少一个接收单元(110、120)，用于接收音频信号和视频信号；

确定单元(130、140)，用于通过对所述音频信号或所述视频信号执行识别来确定正在发言的个体的数目；以及

增益调整单元(150)，用于基于所确定的正在发言的个体的所述数目来调整所述音频信号的增益。

2.根据权利要求1所述的控制系统，其中

所述识别通过执行脸部识别或语音分析来执行，以便确定正在发言的个体的数目。

3.根据权利要求1所述的控制系统，其中

所述识别通过对所述音频信号执行语音分析来执行，以便确定正在发言的个体的数目。

4.根据权利要求1所述的控制系统，其中

所述识别通过对所述视频信号执行脸部识别来执行。

5.根据权利要求1所述的控制系统，进一步包括：

切换单元(150)用于基于所检测到的正在发言的个体的数目在单个发言者模式与多发言者模式之间切换。

6.根据权利要求4所述的控制系统，其中

所述脸部识别被执行以用于检测一个或多个脸部。

7.根据权利要求6所述的控制系统，进一步包括：

切换单元(150)用于基于所检测到的脸部的数目在单个发言者模式与多发言者模式之间切换。

8.根据权利要求6所述的控制系统，其中

响应于所述检测到多个脸部，所述切换单元从所述单个发言者模式切换到所述多发言者模式，并且增益调整单元在所述多发言者模式中以第一速率调整所述音频信号的增益，

响应于所述仅检测到单个脸部，所述切换单元从所述多发言者模式切换到所述单个发言者模式，并且增益调整单元在所述单个发言者模式中以第二速率调整所述音频信号的增益，并且

其中所述第一速率是不同于所述第二速率的速率。

9.根据权利要求8所述的控制系统，

其中所述第一速率是大于所述第二速率的速率。

10.根据权利要求1所述的控制系统，

其中所述检测单元通过将所检测到的语音的音量与至少一个阈值进行比较来确定所检测到的语音的音量是否在给定音量范围之外，

其中所述检测单元基于所检测到的语音的音量出现在所述给定音量范围之外来确定所检测到的语音的音量是否在所述给定音量范围之外，

其中所述检测单元基于所检测到的语音的音量来确定所述第一速率，以及

其中所述检测单元基于所检测到的语音的音量来确定所述第二速率。

11.根据权利要求1所述的控制系统，其中

所述至少一个接收单元接收具有所述音频信号和所述视频信号两者的数据流。

12.根据权利要求1所述的控制系统，其中

所述至少一个接收单元包括第一接收单元用于接收所述音频信号；以及

所述至少一个接收单元包括第二接收单元用于接收所述视频信号。

13.根据权利要求12所述的控制系统，其中

所述第一接收单元是麦克风；以及

所述第二接收单元是相机。

14.一种用于改变通信系统中音频电平的控制方法，所述控制方法包括：

接收音频信号(310)；

接收视频信号(210)；

对所述视频信号或所述音频信号执行识别来确定正在发言的个体的数目(220、230、320、330)；以及

基于所确定的正在发言的个体的所述数目来调整所述音频信号的增益(240、250、340、350)。

15.根据权利要求14所述的控制方法，其中

所述识别通过执行脸部识别或语音分析来执行，以便确定正在发言的个体的所述数目。

16.根据权利要求14所述的控制方法，其中

所述识别通过对所述音频信号执行语音分析来执行，以便确定正在发言的个体的所述数目。

17.根据权利要求14所述的控制方法，其中

所述识别通过对所述视频信号执行脸部识别来执行。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于谷歌公司，未经谷歌公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310052511.3/1.html，转载请声明来源钻瓜专利网。

上一篇：纳米香体微胶囊功效性元素纤维织物内衣
下一篇：一种带测量微型轴承内外圈测量台的轮廓仪

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于单个和多个发言者的双模式AGC有效

专利文献下载