[发明专利]利用运行范围归一化的神经网络语音活动检测有效
申请号: | 201580063710.1 | 申请日: | 2015-09-26 |
公开(公告)号: | CN107004409B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | E·维克斯 | 申请(专利权)人: | 密码有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L25/27;G10L25/78 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵蓉民;徐东升 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | “运行范围归一化”方法包括计算对语音活动检测(VAD)有用的特征的数值范围的运行估计,并且通过将它们映射到期望范围来对特征进行归一化。运行范围归一化包括计算VAD特征的最小值和最大值的运行估计,以及通过将原始范围映射到期望范围来对特征值进行归一化。平滑系数被任选地选择以定向地偏置最小值和最大值的运行估计中的至少一个的变化率。归一化的VAD特征参数被用于训练机器学习算法以检测语音活动并使用经训练的机器学习算法来隔离或增强音频数据的话语分量。 | ||
搜索关键词: | 利用 运行 范围 归一化 神经网络 语音 活动 检测 | ||
【主权项】:
一种从音频信号获得归一化语音活动检测特征的方法,包括以下步骤:在计算系统处将音频信号划分成时间帧的序列;针对每个时间帧计算所述音频信号的一个或多个语音活动检测特征;针对每个所述时间帧计算所述音频信号的所述一个或多个语音活动检测特征的最小值和最大值的运行估计;针对每个所述时间帧通过比较所述音频信号的所述一个或多个语音活动检测特征的所述最小值和所述最大值的所述运行估计来计算所述一个或多个语音活动检测特征的输入范围;以及针对每个所述时间帧将所述音频信号的所述一个或多个语音活动检测特征从所述输入范围映射到一个或多个期望目标范围,以获得一个或多个归一化语音活动检测特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于密码有限公司,未经密码有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201580063710.1/,转载请声明来源钻瓜专利网。
- 上一篇:吊灯(1656)
- 下一篇:床高档(青少年床高档88016H‑1)