[发明专利]使用神经网络进行基于频率的音频分析在审
申请号: | 201780029211.X | 申请日: | 2017-05-10 |
公开(公告)号: | CN109155006A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | 多米尼克·罗博列克;马修·谢里菲 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G10L15/16;G06N3/04 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;周亚荣 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 频域特征 卷积 神经网络输出 对数标度 音频分析 音频样本 配置 计算机存储介质 滤波器 计算机程序 训练数据 映射 | ||
1.一种用于在训练数据上训练包括多个神经网络层的神经网络的方法,
其中,所述神经网络被配置成接收音频样本的频域特征并且处理所述频域特征以针对所述音频样本生成神经网络输出,
其中,所述神经网络包括(i)被配置成将频域特征映射到对数标度频域特征的卷积层,其中,所述卷积层包括一个或多个卷积层滤波器,以及(ii)具有相应的层参数、被配置成处理所述对数标度频域特征以生成所述神经网络输出的一个或多个其它神经网络层,并且
其中,所述方法包括:
获得训练数据,所述训练数据对于多个训练音频样本中的每一个训练音频样本包括所述训练音频样本的频域特征和针对所述训练音频样本的已知输出;以及
在所述训练数据上训练所述神经网络以调整所述其它神经网络层的所述参数的值并且调整所述一个或多个卷积层滤波器以确定频域特征到对数标度频域特征的最佳对数卷积映射。
2.根据权利要求1所述的方法,其中,所述训练音频样本的所述频域特征存在于包括一个或多个频带的频谱中。
3.根据权利要求2所述的方法,其中,在所述训练数据上训练所述神经网络包括对于所述卷积层:
接收所述训练音频样本的所述频域特征;
确定所述一个或多个卷积层滤波器中的每一个的大小;
放大所述一个或多个频带以与所确定的所述一个或多个卷积层滤波器的大小匹配;
使用所述卷积层来处理所述一个或多个放大的频带以生成卷积层输出;
从所述卷积层上方的神经网络层接收用于所述频域特征的反向传播梯度;
相对于所述一个或多个卷积层滤波器计算用于所述神经网络的误差函数的梯度,其中,所述误差函数取决于所述一个或多个卷积层滤波器和所接收到的反向传播梯度;以及
使用所计算的梯度来更新所述一个或多个卷积层滤波器。
4.根据权利要求3所述的方法,其中,确定所述一个或多个卷积层滤波器中的每一个的相应的大小包括:
选择与所述频谱的最高部分相对应的频带;以及
基于所选择的频带确定所述一个或多个卷积层滤波器中的每一个的相应的大小。
5.根据权利要求3所述的方法,其中,确定所述一个或多个卷积层滤波器中的每一个的相应的大小包括确定所述一个或多个卷积层滤波器中的每一个的预定相应的大小。
6.根据权利要求3至5中的任一项所述的方法,其中,放大所述一个或多个频带以与所确定的所述一个或多个卷积层滤波器的大小匹配包括使用插值方法来放大所述一个或多个频带。
7.根据权利要求1至6中的任一项所述的方法,其中,所述训练音频样本的所述频域特征包括线性频域特征。
8.一种用于通过神经网络的多个层中的每一个层来处理数据输入的方法,
其中,所述神经网络被配置成接收音频样本的频域特征并且处理所述频域特征以针对所述音频样本生成神经网络输出,
其中,所述神经网络包括(i)被配置成将频域特征映射到对数标度频域特征的卷积层,其中,所述卷积层包括一个或多个卷积层滤波器,以及(ii)具有相应的层参数、被配置成处理所述对数标度频域特征以生成所述神经网络输出的一个或多个其它神经网络层,并且
其中,所述方法包括:
获得包括音频样本的频域特征的数据输入;
使用所述卷积层来处理所述频域特征以生成卷积层输出,其中,所述卷积层输出包括对数标度频域特征;以及
使用所述一个或多个其它神经网络层来处理所生成的卷积层输出以生成神经网络输出。
9.根据权利要求8所述的方法,其中,使用所述卷积层来处理所述频域特征以生成卷积层输出,其中,所述卷积层输出包括对数标度频域特征,包括:
在所述卷积层处接收所述频域特征,其中,所述频域特征存在于包括一个或多个频带的频谱中;
对于每个频带,基于所述频带缩减相应的卷积滤波器的大小;
使用经缩减的一个或多个卷积滤波器来处理所述一个或多个频带以生成所述卷积层输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780029211.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:使用伪计数的增强学习
- 下一篇:训练量子优化器