[发明专利]一种基于轻量级卷积神经网络的嵌入式音频事件检测方法有效
申请号: | 201711315405.4 | 申请日: | 2017-12-12 |
公开(公告)号: | CN109919295B | 公开(公告)日: | 2022-10-28 |
发明(设计)人: | 邹月娴;张小虎 | 申请(专利权)人: | 北京大学深圳研究生院 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 518055 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种嵌入式音频事件检测方法,涉及音频事件检测技术。首先对卷积神经网络模型进行改进,提出轻量级膨胀卷积神经网络(Lightened Dilated Convolution Neural Network,L‑D‑CNN),包括膨胀卷积层、池化层、特征求和层、输出层。采用L‑D‑CNN作为模型训练模块,模型大小减少了50‑60倍,可以降低神经网络的计算复杂度,在显卡上的运算速度提高了50‑60倍,可使用嵌入式的Nvidia TX2显卡运行;此外,对嵌入式音频事件的检测精度提高了2%‑8%。 | ||
搜索关键词: | 一种 基于 轻量级 卷积 神经网络 嵌入式 音频 事件 检测 方法 | ||
【主权项】:
1.一种轻量级卷积神经网络的构建方法,基于膨胀卷积和特征求和构建轻量级膨胀卷积神经网络,包括如下过程:A)构建膨胀卷积层,采用膨胀卷积层替代卷积层,使得神经网络模型对更长的时序信息进行建模;膨胀卷积层针对卷积层的卷积核进行修改,通过在卷积层中卷积核的每个相邻元素中插入n个零值,使得卷积核由k*k的卷积核扩张成了[k+(k‑1)*n]*[k+(k‑1)*n]的膨胀卷积核,由此构建得到膨胀卷积层;B)通过特征求和层对卷积神经网络中卷积层提取的高层局部特征进行压缩,减少模型的参数,以达到压缩网络的目的,使得神经网络可以在移动终端或嵌入式平台上应用;所述特征求和层具体是:对于卷积神经网络的卷积层提取的高层局部特征的每一张特征图谱,通过式1进行计算,得到每一张特征图:式1中,对于从底层卷积层输出的一个N*N大小的特征图,特征图中的像素为(a1,a2,…,ann),b为特征求和层对于每一张特征图的输出结果;通过特征求和层,每一张底层卷积层提取的的局部特征均得到了压缩;构建的轻量级膨胀卷积神经网络结构包括膨胀卷积层、池化层、特征求和层、输出层。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711315405.4/,转载请声明来源钻瓜专利网。