[发明专利]一种图像形状的编码方法在审
申请号: | 201811145800.7 | 申请日: | 2018-09-29 |
公开(公告)号: | CN109522911A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 苗军;许少武;卿来云;乔元华;邹柏贤 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G06K9/48 | 分类号: | G06K9/48;G06K9/32;G06K9/00 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像形状 显著特征 形状编码 特征图 准确率 图像识别 二值化 原图像 学习 | ||
本发明公开了一种图像形状编码方法,包括步骤:1)提取原图像显著特征,获得显著特征图;2)对显著特征图二值化,获得二值特征图;3)对二值特征图形状编码,获得形状编码图。本发明的图像形状编码方法应用于CNN的学习后在实验中所能取得的最高识别准确率,普遍高于不使用该方法时所能取得的最高识别准确率。因此,本发明有助于提升CNN的图像识别能力。
技术领域
本发明涉及图像处理中的图像编码,特别涉及图像形状的编码方法。
背景技术
卷积神经网络(Convolutional Neural Network,CNN)是一种高效的智能图像识别方法,已经在许多领域的实际应用中取得了优异的成果。但有研究表明,目前常用的CNN通常只能学习到图像的中低层特征(边缘、纹理)而没能获得描述图像的全局结构的高级语义特征(形状、结构),这使得CNN在进行图像识别时会出现错识(将两张不同的图像识别为相同的对象)、漏识(将两张相似的图像识别为不同的对象)的问题,限制了CNN所能达到的最高识别准确率。因此,若能将形状特征引入CNN的学习中,必将令CNN的识别准确率有所提高,进一步地,将有效促进图像识别相关工作的发展。
发明内容
本发明的目的是提供一种对图像形状进行编码的方法,将编码后的图像交予CNN进行学习可克服其在一般情况下无法获取图像高级语义特征的问题。
为实现上述目的,对图像形状进行编码的方法包括步骤:
步骤1)、使用中央周边差算子对原图像进行卷积,获得显著特征图;
步骤2)、对步骤1)中得到的显著特征图进行二值化操作,得到由取零值的非显著点和取非零值的显著点组成的二值特征图;
步骤3)、构造一个二维矩阵,亦即形状编码图统计步骤2)中得到的二值特征图中的显著点对的出现频率。
本发明的形状编码方法应用于CNN的学习后在实验中所能取得的最高识别准确率,普遍高于不使用该方法时所能取得的最高识别准确率。因此,本发明有助于提升CNN的图像识别能力。
附图说明
图1为通过用中央周边差算子对原图像进行卷积,获得显著特征图的示意图;
图2为对显著特征图进行二值化操作的示意图;
图3为将原始的人脸图像转换为二值特征图的示例图;
图4为构建形状编码图、统计二值特征图中显著点对的出现频度的示意图;
图5为对二值特征图进行形状编码的示例图;
图6为将图3中的二值特征图转换为相应的形状编码图的示例图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步说明。
一种图像形状的编码方法,包括:
步骤1)、提取图像显著特征;
步骤2)、将显著特征图像转换为二值特征图像;
步骤3)、对二值特征图像进行形状编码。
在所述的步骤1)中,使用中央周边差算子对原图像进行卷积,从而得到显著特征图像。
在所述的步骤2)中,指定一个阈值,将图像中像素点值小于该阈值的像素点的值置零,令显著特征图像转换为只包含零值和非零值像素点的二值特征图像。
在所述的步骤3)中,统计二值特征图中的各类显著点对的出现频度并在一个二维矩阵亦即形状编码图中进行记录。
统计显著点对时只将第二个显著点在纵轴方向上坐标值大于或等于第一个显著点对的显著点对,即△y≥0的显著点对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811145800.7/2.html,转载请声明来源钻瓜专利网。