[发明专利]一种音频处理方法、装置、电子设备及存储介质有效
申请号: | 201911402690.2 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111145765B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 王运侠 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G06N3/04;G06N3/08 |
代理公司: | 北京乐知新创知识产权代理事务所(普通合伙) 11734 | 代理人: | 江宇 |
地址: | 215024 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 处理 方法 装置 电子设备 存储 介质 | ||
1.一种音频处理方法,其特征在于,所述方法包括:
对实时输入的音频信息进行切分,得到至少一个音频段;
对所述至少一个音频段中每一个音频段进行神经网络计算,得到每一个音频段所对应的输出,将所述每一个音频段的输出进行合并得到输出结果;
其中,对所述至少一个音频段中每一个音频段进行神经网络计算,得到每一个音频段所对应的输出,包括:
将所述每一个音频段的序列开始、序列中间以及序列结束分别进行神经网络计算,得到所述每一个音频段所对应的第一结果、第二结果以及第三结果;
将每一个音频段所对应的所述第一结果、第二结果、第三结果合并,得到所述每一个音频段所对应的输出。
2.根据权利要求1所述的方法,其特征在于,所述神经网络为DFSMN模型。
3.根据权利要求2所述的方法,其特征在于,将所述每一个音频段的序列开始进行神经网络计算,得到所述每一个音频段所对应的第一结果,包括:
将所述每一个音频段中长度为L1的序列开始输入至N层的DFSMN模型,得到经过全部N层的DFSMN模型处理后的长度为L1-M的第一结果;
其中,L1为大于等于M的整数,N为大于等于1的整数,M为大于等于1且小于L1的整数。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将长度为l1的输入序列输入至第n层DFSMN,将第n层DFSMN模型输出的长度为l1的第n个子结果中的最后m个时刻的输出删除,得到所述第n层DFSMN输出的长度为l1-m的输出序列;
其中,l1为大于m且小于等于L1的整数,n为大于等于1且小于等于N的整数,m为大于等于1且小于等于M的整数。
5.根据权利要求2所述的方法,其特征在于,将所述每一个音频段的序列中间进行神经网络计算,得到所述每一个音频段所对应的第二结果,包括:
将每一个音频段中长度为L2的序列中间输入至N层的DFSMN模型,得到所述N层的DFSMN输出的长度为L2的第二结果;
其中,L2为大于等于1的整数,N为大于等于1的整数,N为网络中包含的DFSMN的层数。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
将长度为l2的输入序列输入至第n层DFSMN,计算之前,将前一次计算第n层DFSMN输出时丢弃的m个时刻的数据拼接到l2长度的输入前面,得到l2+m的第n个子结果;第n层DFSMN计算完成之后,将所述长度为l2+m的第n个子结果中最后m个时刻的输出删除,得到长度为l2+m-m的第n个子结果;
其中l2为大于等于1小于等于L2的整数,n为大于等于1且小于等于N的整数,m为大于等于1的整数。
7.根据权利要求2所述的方法,其特征在于,将所述每一个音频段的序列结束进行神经网络计算,得到所述每一个音频段所对应的第三结果,还包括:
将每一个音频段中长度为L3的序列中间部分输入至N层的DFSMN模型,得到所述N层的DFSMN输出的长度为L3+M的第三处理结果;
其中,L3为大于等于1的整数,N为大于等于1的整数,M为大于等于1的整数。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
将前一时刻中第n层DFSMN输出时丢弃的m个时刻的结果添加至l3的输入序列的开始部分,得到长度为l3+m的序列;
将长度为l3+m的序列输入至第n层DFSMN,得到所述第n层DFSMN模型输出的长度为l3+m的第n个子结果;
其中,l3为小于等于L3的整数,n为大于等于1且小于等于N的整数,m为大于等于1的整数、且小于等于M的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911402690.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种参数化的几何椭圆精确拟合方法
- 下一篇:HTTP报文处理方法及装置