[发明专利]基于语音方向的麦克风控制在审
申请号: | 201880100287.1 | 申请日: | 2018-12-17 |
公开(公告)号: | CN113170022A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | S·巴里特卡;S·库图鲁 | 申请(专利权)人: | 惠普发展公司;有限责任合伙企业 |
主分类号: | H04M3/56 | 分类号: | H04M3/56;G10L15/22;H04S7/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张凌苗;吕传奇 |
地址: | 美国德*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 方向 麦克风 控制 | ||
根据示例,一种装置可以包括处理器和其上存储指令的非暂时性计算机可读介质,处理器可以执行所述指令以访问在麦克风处于静音状态时由麦克风捕捉的用户的语音的音频信号。处理器还可以执行指令以分析所访问的音频信号的频谱或频率内容,以确定在用户说话时用户是否正面对麦克风。另外,基于在用户说话时用户正面对麦克风的确定,处理器可执行指令以使麦克风解除静音。
背景技术
诸如电话会议和视频会议应用之类的电信应用可以促进在多个远程定位的用户之间的通信,以通过因特网协议网络、通过基于陆地的电话网络和/或通过蜂窝网络彼此通信。特别地,电信应用可以使得音频针对每个用户被本地捕捉并且被传送到其他用户,使得用户可以经由这些网络听到其他用户的话音。一些电信应用还可以使用户的静止和/或视频图像能够被本地捕捉并且被传送到其他用户,使得用户可以经由这些网络查看其他用户。
附图说明
本公开的特征通过示例的方式示出并且不在(一个或多个)以下附图中受到限制,其中,相同的数字指示相同的元素,其中:
图1示出了可以基于在用户说话时用户是否可能正面对麦克风来自动控制麦克风的解除静音(unmute)的示例装置的框图;
图2A示出了可以包括图1中描绘的示例装置的特征的示例系统的框图;
图2B示出了可以在捕捉的音频信号的训练阶段和推断(inference)阶段期间执行的操作的示例过程框图;
图3示出了可以基于在用户说话时用户是否可能正面对麦克风来自动控制麦克风的解除静音的示例装置的框图;
图4和图5分别描绘了用于基于关于在用户说话时用户是否正面对麦克风的确定来自动对麦克风解除静音的示例方法;以及
图6示出了示例非暂时性计算机可读介质的框图,该计算机可读介质可以具有存储在其上的机器可读指令,当由处理器执行时,该机器可读指令可以使处理器基于在用户说话时用户可能正面对麦克风的确定来提示用户对麦克风解除静音。
具体实施方式
为了简单和说明的目的,通过主要参考本公开的示例来描述本公开的原理。在以下描述中,阐述了许多具体细节以便提供对示例的理解。然而,对于本领域的普通技术人员来说将清楚的是,可以在不局限于这些具体细节的情况下实施示例。在一些情况下,没有详细描述公知的方法和/或结构,以免不必要地模糊对示例的描述。此外,可以以各种组合一起使用示例。
贯穿本公开,术语“一”和“一个”旨在表示特定元素中的一个或特定元素中的多个。如本文所用,术语“包括”意味着包括但不限于,术语“包含”意味着包含但不限于。术语“基于”可以意味着部分地基于。
当音频会议应用被激活时,麦克风可以以静音状态开始。通常,用户可能没有意识到他们的麦克风是处于静音状态的,并且因此可能在对他们的麦克风解除静音之前就开始讲话。这可能导致电话会议开始时的混乱。这也可能发生在在音频会议期间或在其他应用期间用户有意使其麦克风静音并且在再次讲话之前忘记对其麦克风解除静音之时。
本文公开的是用于基于用户意图使用户的语音被捕捉的确定来自动对麦克风解除静音的装置、系统和方法。例如,处理器可以确定在用户说话时用户是否正面对静音的麦克风并且基于该确定而自动地对麦克风解除静音。处理器可以通过分析由麦克风捕捉的音频信号的频谱或频率内容来进行该确定。此外或替代地,处理器可通过对所捕捉音频信号应用机器学习模型来进行该确定。在一些示例中,处理器可以实现话音活动检测技术以确定所捕捉的音频信号是否包括用户的话音。在一些示例中,关于用户是否正面对静音的麦克风的确定可以以训练全连接神经网络(FCNN)或卷积神经网络(CNN)来标识语音的方向性为前提。
在一些示例中,可以利用由第二麦克风捕捉的第二音频信号来分析由第二麦克风捕捉的第二音频信号的特性,以确定在用户说话时用户是否可能正面对麦克风和第二麦克风。在这些示例中,处理器可基于上文所讨论的关于用户是否正面对麦克风的确定和基于音频信号与第二音频信号的特性的分析的确定来确定是否对麦克风和第二麦克风解除静音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司,有限责任合伙企业,未经惠普发展公司,有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880100287.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电池、电池包、蓄电装置、车辆以及飞行体
- 下一篇:无刷电机