[发明专利]预处理音频信号的方法和设备在审
申请号: | 201480020943.9 | 申请日: | 2014-02-14 |
公开(公告)号: | CN105556593A | 公开(公告)日: | 2016-05-04 |
发明(设计)人: | 坦卡西·V·拉玛巴德兰;约耳·A·克拉克;帕特里克·J·格里斯;马克·A·加休科 | 申请(专利权)人: | 谷歌技术控股有限责任公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L21/02;H04M1/725;H04W4/02 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李佳;穆德骏 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预处理 音频 信号 方法 设备 | ||
技术领域
本公开涉及处理音频信号,尤其涉及预处理音频信号的方法和设 备。
背景技术
虽然语音识别已经出现数十年,但是语音识别软件和硬件的质量 直到最近才达到足够高的水平以吸引大量消费者。近年来语音识别变 得非常普及的一个领域是智能电话和平板计算机产业。使用启用语音 识别的装置,完全通过发音,消费者就可以执行诸如打电话、写电子 邮件、以及用GPS导航这样的任务。
但是在这样的装置中语音识别远远未臻完美。在初次使用启用语 音识别的装置时,用户可能需要“训练”语音识别软件来识别他或她 的发音。但是,即使经过训练,语音识别功能也不能在所有声音环境 下工作良好。例如,背景噪声的出现会降低语音识别的准确性。
附图说明
虽然后附权利要求书通过特性阐述了本技术的特征,但是根据结 合附图的以下详细描述可以更好地理解这些技术,在附图中:
图1示出用户向电子装置说话,在附图中将电子装置描述为移动装 置。
图2示出图1的电子装置的示例组件。
图3示出可以实施各种实施例的体系结构。
图4示出根据本发明实施例可以执行的步骤。
具体实施方式
根据前述,现在将描述用于预处理音频信号的方法和设备。
根据实施例,电子装置能够选择适合于装置操作所在环境的预处 理技术。这样,装置提高了语音识别准确度。在一个实施方式中,装 置使用从音频信号本身获得的信息,以及从一个或多个辅助装置获得 的信息。
装置能够在多种预处理技术(例如,单麦克风噪声抑制、双麦克风 噪声抑制、自适应噪声消除)中的任何一个中选择并将选择的技术应用 于装置的音频输入信号。适当预处理技术的选择可以取决于背景噪声 的等级以及背景噪声的特性(例如,变化性、频谱形状等等)。
根据实施例,一个或多个辅助装置提供可以对其进行预处理过程 选择的附加信息。例如,全球定位信号(GPS)模块可以提供有关装置的 位置、装置是否在运动及其速度的信息。根据装置的位置和速度,可 以获得有关背景噪声的等级以及背景噪声的特性的线索。例如,装置 可以放置在安静的家庭环境、繁忙的餐厅、城市街道、或者公路中。 它可以静止,或者以60mph的速度移动。基于装置的位置和速度,可以 在类似条件下使用现有知识(例如,存储的噪声等级和特性的查找表) 来推测有关噪声等级和噪声特性的信息。然后可将这样的信息用于为 输入信号选择适当的预处理技术,从而增强语音识别性能。
在实施例中,电子装置接收具有音频信息的音频信号,获得辅助 信息(诸如位置、速度、方向、光和温度),并基于音频信息和辅助信息, 确定电子装置操作所在音频环境的类型。装置基于确定的音频环境类 型选择音频预处理过程,并根据选择的预处理过程预处理音频信号。 然后,装置可以对经过预处理的音频信号执行语音识别。
用于预处理过程的可能实施方式包括直通式信号传输、单麦克风 噪声抑制、双麦克风噪声抑制、以及自适应噪声消除。
在实施例中,确定音频环境的类型涉及确定装置是在车辆中、在 家里、在餐厅中、在办公室中、还是在街道上操作。
如同这里使用的,装置的“音频环境”表示除了用户语音的声音 之外,装置听得见的声音的特性。背景噪声是音频环境的一部分。
如同这里使用的,“模块”是在硬件上执行的软件。模块可以在 多个硬件元件上执行,或可以在单个硬件元件上执行。此外,当附图 中示出多个模块时,应当理解,实际上模块可以都在相同的装置上并 且在软件的相同整体单元中执行。
当本公开提及模块和其他元件相互“提供”信息(数据)时,应当 理解,可以有可以执行这样的动作的多种可能方式,包括沿着传导路 径(例如电线)传输的电信号以及对象间方法调用。
这里所述的一些实施例在常通音频(AOA)的背景下可用。当使用 AOA时,装置102(图1)能够在收到来自用户的触发命令时从休眠模式中 苏醒。AOA对装置(尤其是移动装置)提出了附加要求。因此,当装置102 能够准确迅速识别用户的发音命令时,AOA最有效。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌技术控股有限责任公司,未经谷歌技术控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480020943.9/2.html,转载请声明来源钻瓜专利网。