[发明专利]用于关键字检测的自适应音频帧处理有效
申请号: | 201480025428.X | 申请日: | 2014-04-24 |
公开(公告)号: | CN105229726B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 李敏秀;金泰殊;黄奎雄;金圣雄;真珉豪 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/08 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音特征 缓冲器 目标关键字 输入声音 自适应 关键字检测 移动装置 输入流 音频帧 检测 方差 跳过 标准化 统计 激活 进程 | ||
1.一种从输入声音检测目标关键字来激活移动装置中的功能的方法,所述方法包括:
通过所述移动装置,在缓冲器中接收提取自输入声音流的子段的第一多个声音特征;
一旦已在所述缓冲器中接收到所述第一多个声音特征,就生成所述第一多个声音特征的特征统计;
一旦已在所述缓冲器中接收到所述第一多个声音特征,就通过所述移动装置,在所述缓冲器中接收第二多个声音特征;
对于在所述缓冲器中接收到的所述第二多个声音特征中的每一声音特征,更新所述特征统计;
当在所述缓冲器中接收到所述第二多个声音特征中的一声音特征时,通过所述移动装置,处理来自所述缓冲器的第一数目个声音特征,所述第一数目个声音特征包含两个或多个声音特征,其中所述处理是基于所述第一多个声音特征的所述特征统计或经更新的特征统计的;
通过所述移动装置,为所述经处理的声音特征中的至少一个声音特征确定关键字得分;以及
当所述关键字得分大于阈值得分时,通过所述移动装置,将所述输入声音检测为所述目标关键字。
2.根据权利要求1所述的方法,其中处理所述第一数目个声音特征包括:
从所述缓冲器检索所述第一数目个声音特征;以及
基于特征统计来处理所述检索到的声音特征。
3.根据权利要求2所述的方法,其中所述特征统计包含均值和方差,且其中处理所述检索到的声音特征包括基于所述特征统计来使所述检索到的声音特征标准化。
4.根据权利要求2所述的方法,其中处理所述检索到的声音特征包括基于所述第一多个声音特征的所述特征统计,来处理所述第一多个声音特征中的声音特征。
5.根据权利要求2所述的方法,其中处理所述检索到的声音特征包括:
基于所述第二多个声音特征的第一声音特征来更新所述特征统计;以及
基于所述经更新的特征统计来处理所述第二多个声音特征的所述第一声音特征。
6.根据权利要求2所述的方法,其中处理所述检索到的声音特征包括基于所述特征统计来处理选定数目个所述检索到的声音特征。
7.根据权利要求6所述的方法,其中基于所述移动装置的资源信息来调整所述选定数目。
8.根据权利要求2所述的方法,其中处理所述检索到的声音特征包括:
将所述检索到的声音特征之中的一声音特征识别为当前声音特征;
确定所述当前声音特征与先前声音特征之间的差异;以及
当所述差异小于阈值时,使用对应于所述先前声音特征的经处理的声音特征作为对应于所述当前声音特征的经处理的声音特征。
9.根据权利要求1所述的方法,其中基于所述移动装置的资源信息来调整所述第一数目。
10.根据权利要求1所述的方法,其中为所述经处理的声音特征中的所述至少一个声音特征确定所述关键字得分包括使用马尔可夫链模型来计算所述关键字得分。
11.根据权利要求1所述的方法,其中处理所述第一数目个声音特征包括:当所述缓冲器中的所述声音特征的特定数目小于所述第一数目时,处理位于所述缓冲器中的所述特定数目个声音特征。
12.根据权利要求1所述的方法,
其中在所述缓冲器中接收所述第一多个声音特征包括:
将所述输入声音的第一部分分割为第一多个帧;以及
从所述第一多个帧中的至少一个帧提取第一声音特征,
其中在所述缓冲器中接收所述第二多个声音特征包括:
将所述输入声音的第二部分分割为第二多个帧;以及
从所述第二多个帧中的至少一个帧提取第二声音特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480025428.X/1.html,转载请声明来源钻瓜专利网。