[发明专利]构建卷积神经网络在审
申请号: | 201680086870.2 | 申请日: | 2016-06-17 |
公开(公告)号: | CN109643396A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 曹家乐 | 申请(专利权)人: | 诺基亚技术有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06K9/00 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;张曦 |
地址: | 芬兰*** | 国省代码: | 芬兰;FI |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图 卷积 卷积神经网络 训练数据集 计算机程序产品 多媒体内容 信息处理 构建 更新 | ||
本公开的实施例提供了一种用于信息处理的方法、装置和计算机程序产品。该方法包括:基于针对多媒体内容的训练数据集,确定用于卷积神经网络中的卷积层的卷积参数和第一特征图;根据第一特征图之间的相关性来改变第一特征图的顺序,以获得第二特征图;以及基于训练数据集和第二特征图来更新卷积参数。
技术领域
本公开的实施例一般地涉及信息处理,并且更特别地涉及用于构建卷积神经网络(CNN)的方法、装置和计算机程序产品。
背景技术
CNN已经在图像识别、对象检测、语音识别等应用中实现了最先进的性能。CNN的代表性应用包括阿尔法围棋(AlphaGo)、高级驾驶员辅助系统(ADAS)、自动驾驶汽车、光学字符识别(OCR)、面部识别、大规模图像分类(例如,ImageNet分类)、以及人机交互(HCI)。
通常,CNN被组织在两种类型的交织层中:卷积层和池化(子采样)层。卷积层的作用是特征表示,并且特征的语义层次随着层的深度而增加。设计有效的卷积层以获得稳健的特征图(feature map)是提高CNN性能的关键。
发明内容
总体上,本公开的实施例包括一种用于构建CNN的方法、装置和计算机程序产品。
在本公开的第一方面,提供了一种方法。该方法包括:基于针对多媒体内容的训练数据集,确定用于卷积神经网络中的卷积层的卷积参数和第一特征图;根据第一特征图之间的相关性来改变第一特征图的顺序,以获得第二特征图;以及基于训练数据集和第二特征图来更新卷积参数。
在一些实施例中,更新卷积参数包括:确定第一特征图的顺序的改变量;以及响应于该量大于预定阈值,更新卷积参数。
在一些实施例中,该方法进一步包括:将索引指配给第一特征图;以及生成索引列表。
在一些实施例中,该方法进一步包括:基于第二特征图来更新索引列表。
在一些实施例中,确定第一特征图的顺序的改变量包括:确定生成的索引列表与更新的索引列表之间的差异。
在一些实施例中,根据第一特征图之间的相关性来改变第一特征图的顺序包括:获得第一特征图的表示信息;确定表示信息之间的差异;以及基于表示信息之间的差异来确定相关性。
在本公开的第二方面,提供了一种装置。该装置包括:至少一个处理器;以及包括计算机程序代码的至少一个存储器;至少一个存储器和计算机程序代码被配置为,与至少一个处理器一起,使得装置至少执行:基于针对多媒体内容的训练数据集,确定用于卷积神经网络中的卷积层的卷积参数和第一特征图;根据第一特征图之间的相关性来改变第一特征图的顺序,以获得第二特征图;以及基于训练数据集和第二特征图来更新卷积参数。
在本公开的第三方面,提供了一种装置。该装置包括用于执行根据本公开的第一方面的方法的部件。
在本公开的第四方面,提供了一种计算机程序产品。该计算机程序产品包括至少一个计算机可读非瞬态存储器介质,该至少一个计算机可读非瞬态存储器介质具有存储在其上的程序代码,该程序代码在由装置执行时,使得装置执行根据本公开的第一方面的方法。
将理解,发明内容不旨在标识本公开的实施例的关键特征或必要特征,也不旨在用于限制本公开的范围。本公开的其他特征通过以下描述将变得易于理解。
附图说明
通过附图中的本公开的一些实施例的更详细描述,本公开的上述和其他目的、特征和优点将变得更加明显,其中:
图1示意地示出了本公开的实施例可以被实施在其中的CNN的架构;
图2是根据本公开的实施例的方法的流程图;
图3a示出了在重排序之前的特征图的示例;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于诺基亚技术有限公司,未经诺基亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680086870.2/2.html,转载请声明来源钻瓜专利网。