[发明专利]用于处理多通道特征图图像的方法和装置有效
申请号: | 201880023698.5 | 申请日: | 2018-04-30 |
公开(公告)号: | CN110494892B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 赵大星;李元宰 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/30;G06T9/00;G06T1/20;G06N3/02 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 潘剑颖 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 处理 通道 特征 图像 方法 装置 | ||
提供了一种基于卷积神经网络的图像处理方法。所述方法包括:在第二层中接收通过利用第一层的多个滤波器核将卷积运算应用于卷积神经网络的输入图像而生成的多通道特征图图像,所述卷积神经网络具有多个层;分析所述多通道特征图图像的动态范围;基于所述动态范围来重新排序所述多通道特征图图像;并且在第二层中处理重新排序的多通道特征图图像。
技术领域
本公开涉及利用机器学习算法的人工智能(AI)系统及其应用,更具体地,涉及用于压缩在基于卷积神经网络的图像处理过程中生成的多通道特征图图像的技术。
背景技术
人工智能(AI)系统是模拟人类级别的智能并自行学习和评判的计算机系统。系统被使用得越多,系统的结果被改善得就越多(例如识别率)。
AI技术包括机器学习(深度学习)技术和元素技术,机器学习(深度学习)技术使用自行分类/学习输入数据特性的算法,并且元素技术通过利用机器学习(深度学习)算法模拟人脑的识别、判断等功能。
元素技术可以包括例如以下各项中的至少一项:用于识别人类语言/字符的语言理解技术、用于以人类视觉的方式识别对象的视觉识别技术、用于判断和逻辑推理以及预测信息的推理/预测技术、用于将人的经验信息处理为知识数据的知识表示技术、以及用于控制车辆的自动驾驶和机器人的运动的运动控制技术。
特别地,用于以人类视觉的方式识别和处理对象的视觉识别技术包括对象识别、对象跟踪、图像检索、人类识别、场景理解、空间理解和图像增强。
发明内容
解决技术问题的技术方案
根据本公开的一方面,提供了一种基于卷积神经网络的图像处理方法,所述方法包括:在第二层中接收通过利用第一层的多个滤波器核将卷积运算应用于卷积神经网络的输入图像而生成的多通道特征图图像,所述卷积神经网络具有多个层;分析多通道特征图图像的动态范围;根据动态范围重新排序多通道特征图图像;并且在第二层中处理重新排序的多通道特征图图像。
有益效果
根据特征图图像的压缩结构,可以进行CNN操作和图像压缩操作(即编码或解码)之间的流水线处理。因此,可以显著减少CNN中的数据业务,并且还可以降低获得计算结果所需的功率。而且,降低了从存储器读取或写入与中间结果或特征分类层的权重相关的数据的频率,从而可以提高执行速度,并且可以降低存储器存储的功耗和负担。
附图说明
根据结合附图的以下描述,本公开的特定实施例的上述和其他方面、特征以及优点将更清楚,在附图中:
图1是基于卷积神经网络的图像处理过程的图;
图2是针对在基于卷积神经网络的图像处理过程中生成的多通道特征图图像的压缩处理的图;
图3是根据实施例的图像处理装置的框图;
图4A是根据实施例的图像处理装置中的图像编码装置的框图;
图4B是根据实施例的图像处理装置中的图像解码装置的框图;
图5是根据实施例的多通道特征图图像和滤波器核之间的卷积运算的过程的图;
图6是根据实施例的用于处理多通道特征图图像的编码单元的图;
图7是根据实施例的重新排序多通道特征图图像集的方法的图;
图8是根据实施例的将编码单元划分为子编码单元的方法的图;
图9是根据实施例的对每一个子编码单元执行预测的过程的图;
图10是根据实施例的配置比特流的分区的方法的图;
图11是根据实施例的配置比特流的方法的图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880023698.5/2.html,转载请声明来源钻瓜专利网。