[发明专利]应用于卷积神经网络的数据处理方法、装置及设备在审
申请号: | 202111022274.7 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113655990A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06F7/523 | 分类号: | G06F7/523;G06F17/16;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张芳;黄健 |
地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 卷积 神经网络 数据处理 方法 装置 设备 | ||
本申请提供一种应用于卷积神经网络的数据处理方法、装置及设备,该方法包括:对接收到的当前层的输入特征数据进行卷积计算,得到当前层的初始输出特征数据。向通道注意力结构输入该输入特征数据,以使其对该输入特征数据执行预定处理,输出通道相关性矩阵,并将初始输出特征数据与通道相关性矩阵的相乘结果,作为当前层的最终输出特征数据。本申请的方法,在卷积神经网络中的至少一层设置通道注意力结构,采用获得的通道相关性矩阵对空间特征进行校准,由于通道相关性矩阵可以表征当前层的通道在不同的共享卷积核下变换结果的相似性程度,因此可以精准度量通道重要性,从而可以对空间特征进行准确校准。
技术领域
本申请涉及计算机视觉系统识别技术领域,尤其涉及一种应用于卷积神经网络的数据处理方法、装置及设备。
背景技术
卷积神经网络(Convolutional Neural Networks,简称CNN)是一类包含卷积计算且具有深度结构的神经网络。其在视觉任务中表现出了巨大的性能增益,因此,对其特征表示的增强一直是研究的重点。其中,通道注意是具有代表性的工作之一,包括特征聚合和描述符变换。
目前,通常利用全局平均池、最大池化、二阶池化或轴方向分离池化作为空间特征聚合,并采用串行全连接层、行卷积或一维卷积作为描述符变换。
但是,上述方法仅通过信息整合(即空间维度上的池化和通道维度上的加权和)来建模通道重要性,对通道重要性的度量不够精确,从而无法对空间特征进行准确校准。
发明内容
本申请提供一种应用于卷积神经网络的数据处理方法、装置及设备,用以获得准确的特征数据。
第一方面,本申请实施例提供一种应用于卷积神经网络的数据处理方法,所述卷积神经网络中的至少一层设有通道注意力结构;所述数据处理方法包括:
接收当前层的输入特征数据,并对所述的输入特征数据进行卷积计算,得到当前层的初始输出特征数据;
若当前层设有通道注意力结构,则向所述通道注意力结构输入所述输入特征数据,以获得通道相关性矩阵;其中,所述通道注意力结构通过对所述输入特征数据执行预定处理,输出所述通道相关性矩阵;其中,所述通道相关性矩阵表征当前层的通道在不同的共享卷积核下变换结果的相似性程度;
将所述初始输出特征数据与所述通道相关性矩阵的相乘结果,作为当前层的最终输出特征数据。
进一步地,如上所述的方法,所述通道注意力结构用于执行以下处理:
针对每个共享卷积核,计算所述共享卷积核与当前层中各通道的输入特征数据的卷积结果;
对不同共享卷积核对应的卷积结果进行点积计算,获得所述通道相关性矩阵。
进一步地,如上所述的方法,所述针对每个共享卷积核,计算所述共享卷积核与当前层中各通道的输入特征数据的卷积结果之后,还包括:
针对每个共享卷积核,计算所述共享卷积核与当前层通道的输入特征数据的卷积结果,获得不同共享卷积核对应的特征图组;
分别将不同共享卷积核对应的特征图组在空间维度上展开,获得不同共享卷积核对应的中间结果;
所述对不同共享卷积核对应的卷积结果进行点积计算,获得所述通道相关性矩阵,包括:
对不同共享卷积核对应的中间结果进行点积计算,获得点积计算结果,并对所述点积计算结果在空间维度上折叠,获得所述通道相关性矩阵。
进一步地,如上所述的方法,所述共享卷积核的数量为三个;所述对不同共享卷积核对应的中间结果进行点积计算,获得点积计算结果,包括:
确定所述不同共享卷积核中的第一共享卷积核和第二共享卷积核;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111022274.7/2.html,转载请声明来源钻瓜专利网。