[发明专利]基于全卷积神经网络的语音增强方法、装置及存储介质有效
申请号: | 201811350813.8 | 申请日: | 2018-11-14 |
公开(公告)号: | CN109326299B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 赵峰;王健宗;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 李玉琦;董永辉 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于人工智能领域,本发明公开了一种基于全卷积神经网络的语音增强方法,包括:构建全卷积神经网络模型,所述全卷积神经网络模型包括输入层、隐含层和输出层,所述隐含层为多个卷积层,每个卷积层均具有多个滤波器;训练所述全卷积神经网络模型;将原始语音信号输入经过训练的全卷积神经网络模型;输出增强语音信号。本发明的全卷积神经网络模型中,删除了全连接层,仅包含卷积层,大大减小了神经网络的参数,使得全卷积神经网络模型可以适用于限制内存的移动设备中,并且每个输出样本仅仅依赖相邻输入,可以通过更少的权重值很好地保留语音信号的原始信息和空间排列信息。本发明还公开了一种电子装置和计算机可读存储介质。 | ||
搜索关键词: | 基于 卷积 神经网络 语音 增强 方法 装置 存储 介质 | ||
【主权项】:
1.一种基于全卷积神经网络的语音增强方法,应用于电子装置,其特征在于,构建全卷积神经网络模型,所述全卷积神经网络模型包括输入层、隐含层和输出层,所述隐含层为多个卷积层,每个卷积层均具有多个滤波器,所述输出层的输出模型为:yt=FT*Rt (1)其中,yt是输出层的第t个节点,FT是滤波器的权重矩阵的转置,F∈Rf×1,f表示滤波器尺寸,Rt是隐含层的第t个节点;训练所述全卷积神经网络模型;将原始语音信号输入经过训练的全卷积神经网络模型;输出增强语音信号。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811350813.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种游戏语音聊天音量自适应调节方法
- 下一篇:一种进行信号处理的方法及设备