[发明专利]在多源环境中的非谐波语音检测及带宽扩展有效
申请号: | 201880026185.X | 申请日: | 2018-04-19 |
公开(公告)号: | CN110537222B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | V·S·C·S·奇比亚姆;V·阿提 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L19/008 | 分类号: | G10L19/008;G10L19/02;G10L21/038 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 安之斐 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 环境 中的 谐波 语音 检测 带宽 扩展 | ||
本发明提供一种装置,其包含经配置以进行以下操作的多声道编码器:接收第一音频信号及第二音频信号;对所述第一音频信号及所述第二音频信号执行降混操作以产生中间信号;基于所述中间信号产生低频带中间信号及高频带中间信号;及至少部分地基于对应于低频带信号的低频带话音值及对应于所述高频带中间信号的增益值来确定标记与所述高频带中间信号相关联的多源旗标的值。所述多声道编码器经配置以基于所述多源旗标产生高频带中间激励信号且基于所述高频带中间激励信号产生位流。所述装置还包含经配置以将所述位流及所述多源旗标发射至第二装置的发射器。
本申请案主张以下共同拥有的申请案的优先权益:2017年4月21日申请的名为“在多源环境中的声道间带宽扩展(INTER-CHANNEL BANDWIDTH EXTENSION IN A MULTI-SOURCE ENVIRONMENT)”的美国临时专利申请案第62/488,654号,及2018年4月18日申请的名为“在多源环境中的非谐波语音检测及带宽扩展(NON-HARMONIC SPEECH DETECTION ANDBANDWIDTH EXTENSION IN A MULTI-SOURCE ENVIRONMENT)”的美国非临时专利申请案第15/956,645号,前述申请案中的每一者的内容的全文以引用的方式并入本文中。
技术领域
本发明大体上涉及音频信号的编码或音频信号的解码。
背景技术
技术的进步已产生更小且更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线电话(例如移动及智能电话)、平板计算机及膝上型计算机,所述便携式个人计算装置小而轻质且容易由用户携载。这些装置可经由无线网络传达话音及数据包。另外,许多此类装置结合额外功能性,例如数字静态相机、数字视频相机、数字记录器及音频文件播放器。此外,这些装置可处理可执行指令,包含软件应用程序,例如可用以存取互联网的网络浏览器应用程序。因而,这些装置可包含显著的计算能力。
第一装置可包含或耦合至一或多个麦克风以接收音频信号。第一装置编码经接收音频信号并将经编码音频信号发送至第二装置。第二装置可包含一或多个输出装置(例如一或多个扬声器)以产生输出。举例来说,第二装置解码经编码音频信号以产生经提供至所述一或多个输出装置的输出信号。
在单声道编码或立体声编码中,编码器可基于经接收音频信号产生低频带信号及高频带信号。在单声道编码或立体声编码中,经接收音频信号可为多个声源(例如同时讲话的两个人)的组合。举例来说,第一声源可提供有声区段(例如字母“r”的声音)且第二声源可提供无声区段(例如声音“ssss”)。在此情境中,有声区段的能量可集中于低频带中,而无声区段的能量集中于高频带中。因此,低频带为高度有声的,这是因为低频带的能量的大部分(或全部)来自第一声源的有声区段,且高频带有高度噪声,这是因为高频带的能量的大部分(或全部)来自第二声源的无声区段。
可基于低频带信号产生低频带话音参数。低频带话音参数接着可用以产生用以产生高频带激励的混频因数(例如指示低频带中的多少为噪声、低频带中的多少为谐波等的增益值)。低频带的谐波性质通过将低频带激励扩展至高频带中而外推至高频带中。如果低频带话音参数指示低频带为谐波,那么高频带扩展也将为谐波。替代地,如果低频带话音参数指示低频带为噪声,那么高频带扩展也将为噪声。在低频带及高频带具有不同调和性特性的情形中,低频带话音因数可不反映(或指示)高频带的调和性。因此,在此情形下,使用低频带话音参数以控制高频带激励的产生并不反映高频带。
在单声道解码或立体声解码中,解码器接收经编码低频带信号及经编码高频带信号。为产生输出信号(反映由编码器接收的音频信号),解码器以类似于编码器的方式产生高频带激励。类似于上文结合编码器所描述的问题,如果在解码器处使用的低频带话音参数不反映高频带(例如当低频带话音因数指示低频带为高度有声的且高频带为有高度噪声时),那么在解码器处产生的高频带激励可不匹配编码器处的高频带且解码器的输出的播出质量可降级。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880026185.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于空间音频处理的两阶段音频聚焦
- 下一篇:语音检测的方法和装置