[发明专利]一种基于分离卷积神经网络的语音唤醒方法及系统有效

专利信息
申请号: 202011141291.8 申请日: 2020-10-22
公开(公告)号: CN112233675B 公开(公告)日: 2023-10-27
发明(设计)人: 付冠宇;詹毅;乔树山;尚德龙;周玉梅;李郡 申请(专利权)人: 中科南京智能技术研究院
主分类号: G10L15/22 分类号: G10L15/22;G10L15/16;G10L15/06;G10L25/24
代理公司: 北京高沃律师事务所 11569 代理人: 张梦泽
地址: 211100 江苏省南京市江宁*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分离 卷积 神经网络 语音 唤醒 方法 系统
【说明书】:

发明涉及一种基于分离卷积神经网络的语音唤醒方法及系统,在模型优化过程中对模型的权重以及激活值进行了二值化,把矩阵乘法代替为异或非操作,节省了大量的加法以及乘法计算,降低了运算量和运算时间减少数据存储空间;并在反向传播中对梯度进行了低位宽量化同样减少了数据的存储空间,并可以类似的在反向传播中减少由于梯度与权重的矩阵乘法引起的乘加运算,减少由于量化引起的精度损失。

技术领域

本发明涉及语音识别领域,特别是涉及一种基于分离卷积神经网络的语音唤醒方法及系统。

背景技术

一个卷积神经网络提供在时间和空间上的平移不变性卷积,将卷积神经网络的思想应用到语音识别的声学建模中,则可以利用卷积的不变性来克服语音信号本身的多样性。从这个角度来看,则可以认为是将整个语音信号分析得到的时频谱当作一张图像一样来处理,采用图像中广泛应用的深层卷积网络对其进行唤醒。但是通过训练神经网络得到的语音唤醒模型存在着高计算量与高功耗的问题;由于数以千万计的计算量,将语音唤醒模型部署到硬件上时会造成硬件面积过大,功耗过高等问题。这使得深层的卷积神经网络严重依赖于GPU等高性能硬件,导致语音唤醒模块在设备上应用的局限性较大。

发明内容

本发明的目的是提供一种基于分离卷积神经网络的语音唤醒方法及系统,减少识别处理任务量,减小硬件面积和硬件损耗。

为实现上述目的,本发明提供了如下方案:

一种基于分离卷积神经网络的语音唤醒方法,所述语音唤醒方法包括:

获取待识别音频文件并提取所述待识别音频文件的语音特征;

将所述待识别音频文件的语音特征输入到音频唤醒模型中,得到音频识别结果;其中,所述音频唤醒模型是依据二值化、批量正则化以及深度可分离卷积神经网络模型建立而成;所述音频唤醒模型的建立方法具体包括:

获取训练样本;所述训练样本包括多个样本对;每个样本对均包括一个输入、一个输出;所述输入为已知识别结果的音频文件的语音特征,所述输出为所述已知识别结果的音频文件对应的识别结果;

利用对所述深度可分离卷积神经网络模型的所有参数权重和所有参数激活值进行二值化处理,得到二值化分离卷积神经网络模型;其中xb为二值化后的参数,x表示参数权重或参数激活值;

将所述已知识别结果的音频文件的语音特征输入到所述二值化分离卷积神经网络模型,利用批量正则化、二值化对所述二值化分离卷积神经网络模型进行处理,得到二值化分离卷积神经网络模型的输出;

根据所述二值化分离卷积神经网络模型的输出和所述已知识别结果的音频文件对应的识别结果,利用损失函数对所述二值化分离卷积神经网络模型进行优化,得到损失函数对于全精度权重的导数;

根据所述损失函数对于全精度权重的导数对所述二值化分离卷积神经网络模型的权值进行更新,进而更新所述二值化分离卷积神经网络模型;更新后的二值化分离卷积神经网络模型为所述音频唤醒模型。

可选的,所述将所述已知识别结果的音频文件的语音特征输入到所述二值化分离卷积神经网络模型,利用批量正则化、二值化对所述二值化分离卷积神经网络模型进行处理,得到二值化分离卷积神经网络模型的输出具体包括:

S1:获取所述已知识别结果的音频文件的语音特征;

S2:将所述已知识别结果的音频文件的语音特征作为所述二值化分离卷积神经网络模型第一层的输入,将所述已知识别结果的音频文件的语音特征与第一权值相乘,得到第一层未处理的输出;

S3:将所述第一层未处理的输出依次进行批量正则化处理和二值化处理,得到所述二值化分离卷积神经网络模型第一层输出;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科南京智能技术研究院,未经中科南京智能技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011141291.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top