[发明专利]具有软内核选择的卷积神经网络在审
申请号: | 202080010184.3 | 申请日: | 2020-01-23 |
公开(公告)号: | CN113348472A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 布兰东·绍隆·杨;国·V·勒;严基铨;加布里尔·明策尔·本德 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 邓聪惠;周亚荣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 内核 选择 卷积 神经网络 | ||
1.一种通过卷积神经网络处理网络输入以生成所述网络输入的网络输出的计算机实现的方法,其中,所述卷积神经网络包括多个卷积层,并且其中,所述方法包括:
接收所述图像处理神经网络中所述多个卷积层中的第一卷积层的输入张量,所述第一卷积层具有多个内核,并且所述输入张量是从所述网络输入得出的;
从所述输入张量确定所述多个内核中的每个内核的相应的与输入相关的权重;
通过根据所述相应的与输入相关的权重计算所述多个内核的加权和来生成与输入相关的内核;以及
从所述第一卷积层的所述输入张量生成所述第一卷积层的输出张量,包括在所述与输入相关的内核与所述输入张量之间执行卷积。
2.一种执行计算机视觉任务的计算机实现的方法,包括根据权利要求1所述的方法,其中,所述网络输入包括可视数据,并且其中,生成所述网络输出包括执行所述计算机视觉任务。
3.根据权利要求2所述的计算机实现的方法,其中,所述网络输入包括一个或多个图像,并且所述计算机视觉任务包括以下中的一个:
图像分类,其中,所述网络输出包括多个分值,对应于不同的对象类别的每个分值表示所述一个或多个图像描绘属于所述对象类别的对象的可能性;
对象检测,其中,所述网络输出识别所述一个或多个图像中的一个或多个区域,并且对于每个区域,识别所述区域描绘感兴趣的对象的可能性;
图像分割,其中,所述网络输出针对所述一个或多个图像中的每个像素定义预定分类集合中每个分类的相应的可能性;
深度估计,其中,所述网络输出针对所述一个或多个图像中的每个像素定义相应的深度值,或者
运动估计,其中,所述图像处理输出针对所述输入图像中的一个输入图像的每个像素,定义在所述网络输入中所述图像之间的在所述像素处描绘的场景的运动。
4.根据任何前述权利要求所述的方法,其中,从所述输入张量确定所述多个内核中的每个内核的相应的与输入相关的权重包括:
通过具有多个参数的非线性路由函数来处理所述输入张量,以生成所述多个内核的所述相应的与输入相关的权重。
5.根据权利要求4所述的方法,其中,所述非线性函数包括一个或多个神经网络层。
6.根据权利要求5所述的方法,其中,所述一个或多个神经网络层包括全局平均池化层,所述全局平均池化层跨所述输入张量的空间维度执行全局平均池化。
7.根据权利要求6所述的方法,其中,所述全局平均池化层后面是一个或多个全连接层和非线性度。
8.根据任何前述权利要求所述的方法,其中,生成输出张量还包括:
向所述卷积的输出应用批量归一化和激活函数。
9.根据任何前述权利要求所述的方法,其中,所述卷积是深度卷积。
10.根据任何前述权利要求所述的方法,其中,所述卷积是点卷积。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080010184.3/1.html,转载请声明来源钻瓜专利网。