[发明专利]用于将卷积神经网络应用于图像的方法和图像处理实体有效
申请号: | 201811525270.9 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109961083B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | N·丹尼尔松;S·莫林;M·斯堪斯 | 申请(专利权)人: | 安讯士有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 李烨;杨晓光 |
地址: | 瑞典*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 卷积 神经网络 应用于 图像 方法 处理 实体 | ||
公开了一种用于将卷积神经网络应用于图像的方法和图像处理实体(400)。图像处理实体(400)在使用卷积内核提供特征图的同时处理(A020)图像,由此特征图的第二特征图尺寸大于用其训练了特征内核的特征图的第一特征图尺寸。此外,图像处理实体(400)以步进方式重复应用(A040)特征内核到特征图,其中特征内核被训练以基于第一特征图尺寸的特征图识别特征,其中特征内核具有第一特征图尺寸,其中通过将卷积内核卷积在具有第一图像尺寸的图像上来获得特征图,这使得,至少由于卷积,特征图具有第二特征图尺寸,其中步进方式由大于第一特征图尺寸的一半的步长表示。还公开了对应的计算机程序(703)和计算机程序载体(705)。
技术领域
本文的实施例涉及通过使用卷积神经网络的图像处理。特别地,公开了用于将卷积神经网络应用于第二图像尺寸的图像的方法和图像处理实体。还公开了对应的计算机程序和计算机程序载体。
背景技术
在图像处理领域内,特定类型(genre)涉及通过卷积神经网络进行对象检测。卷积神经网络的使用例如由于其计算效率已变得越来越流行。
被配置为识别图像中的对象(例如汽车、猫、人等)的已知卷积神经网络将该图像作为输入并提供分数,例如作为对象存在于图像中的概率。
在为了分析图像而执行的所谓卷积动作中,在整个图像上以滑动窗口的方式应用过滤器内核。因此,应用过滤器内核并将其沿行列移动,直到分析整个图像。移动过滤器内核的像素量通常称为步幅。在许多情况下使用一个像素的步幅。过滤器内核以这种方式假定覆盖整个图像的多个位置。在每个位置处,过滤器内核与整个图像的相应部分进行卷积。相应部分具有与过滤器内核相同的尺寸,例如3×3像素,5×5像素等。相应部分通常被称为过滤器内核的感受野(receptive field)。对于每个位置,卷积结果是通常通过非线性函数传递的单个标量值。一旦卷积完成,就获得包括所有位置的值的所谓的特征图。
卷积神经网络可以配置有一个或多个卷积动作,每个动作产生相应的特征图,该特征图用作后续动作的输入。
卷积神经网络还可以配置有一个或多个池化(pooling)动作,其中每个池化动作导致输入特征图的维度减小。与过滤器内核类似,在输入特征图上以滑动窗口方式应用所谓的池化内核。同样在这种情况下,术语“步幅”可用于描述池化内核如何在图像上移动以覆盖其整体。
随后,在作为分类器训练网络的情况下,通过对于要识别和/或要分类的每个对象类型向例如最后特征图(last feature map)应用相应的过滤器,来获得所谓的全连接层。全连接层是向量,其中每个索引对应于相应的对象类型,并且每个索引的相应分数表示概率。因此,对于每个对象类型将存在相应的分数作为对于每个对象类型应用相应过滤器的相应结果。利用卷积神经网络,相应过滤器的尺寸等于如“全连接”的词语所指示的最后特征图。此外,分数因此指示对应对象类型的对象存在于图像中的概率。总之,如果要仅检测一种对象类型,则结果层包括单个标量值。在要检测许多对象的情况下,当然可以对于每个要检测的对象类型有一个标量值。也就是说,全连接层是矢量。在某些情况下,可能存在进一步更早的全连接层。以上描述应用于如何从如上所述的最终或最后特征图获得全连接层。
当使用卷积神经网络进行对象检测时,卷积神经网络需要用一定尺寸的图像进行训练。然后可以将卷积神经网络应用于特定尺寸的图像。这是有问题的,因为技术快速发展并且具有越来越高图像分辨率的相机不断出现在市场上。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安讯士有限公司,未经安讯士有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811525270.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像采集的包装品质识别方法
- 下一篇:用于检验价值文件的方法和设备