[发明专利]一种基于多模板的图像识别方法有效
申请号: | 201710056968.X | 申请日: | 2017-01-22 |
公开(公告)号: | CN106845550B | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 肖东晋;张立群;刘顺宗 | 申请(专利权)人: | 阿依瓦(北京)技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 上海智晟知识产权代理事务所(特殊普通合伙) 31313 | 代理人: | 张东梅 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模板 图像 识别 方法 | ||
1.一种图像识别方法,包括:
接收待识别的图像;
利用两个模板同时对所述图像进行卷积计算,以便得到所述图像的各区域与所述两个模板对应的类别得分,其中所述两个模板尺寸相同,并且所述两个模板为通过模板训练过程得到的对称模板,所述对称模板是模板训练过程中成对出现的模板,所述模板训练过程包括:根滤波器初始化:对于每个目标类别,根据训练数据集中目标矩形框大小的统计值,自动选择根滤波器的尺寸;根滤波器更新:给定上一步训练得到的初始根滤波器,对于训练集中的每个矩形框,在根滤波器和矩形框重叠50%以上的条件下,找到滤波器得分最高的一个位置;部件滤波器初始化:根据上面训练的根滤波器初始化八个部件滤波器,首先选择面积a,使得8a等于根滤波器面积的80%,使用穷举方法从根滤波器中选出面积为a的、区域中所有单元的正权重平方和最大的矩形区域,将此区域的所有权重清零然后继续选择,直到选出八个矩形区域;模型更新:通过构建新的训练数据三元组(<x1,z1,y1>,...,<xn,zn,yn>)其中xi为样本,yi为样本类别,zi是上一次迭代学习到的模型中最适合xi的标签来更新模型;
基于所述类别得分判断图像区域中是否包含所识别的物体,
其中利用两个模板同时对所述图像进行卷积计算包括:
A)以所述图像的起始位置为起点,沿x轴方向和y轴方向取与模板大小等同的图像区域;
B)将所述图像区域分别与所述两个模板进行卷积计算,得到所述图像区域分别与两个模板对应的类别得分;
C)使起点坐标沿x轴方向加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;
D)判断所取的图像区域沿x轴方向是否超出图像的范围,如果所取的图像区域沿x轴方向未超出图像的范围,则返回步骤B),并重复步骤B)至D),直到所取的图像区域沿x轴方向超出图像的范围,则前进到步骤E);
E)将起点坐标的x值置为起始位置坐标值并将y值增加1,基于起点坐标沿x轴方向和y轴方向取与模板大小等同的图像区域;
F)判断所取的图像区域沿y轴方向是否超出图像的范围,如果所取的图像区域沿y轴方向未超出图像的范围,则返回步骤B),并重复步骤B)至E),直到所取的图像区域沿y轴方向超出图像的范围。
2.如权利要求1所述方法,其特征在于,所述两个模板通过特定程序和大量数据集训练得到。
3.如权利要求1所述方法,其特征在于,中央处理单元从图像读取要进行卷积计算的图像区域的像素值矩阵,并且在所述中央处理单元的控制下由图像处理单元完成图像区域与两个模板的卷积计算。
4.如权利要求3所述方法,其特征在于,图像区域与模板的卷积计算包括模板每点的值与图像区域相对应的值相乘,得到的值再求和,最终得到的和作为该图像区域的类别得分。
5.如权利要求1所述方法,其特征在于,当某一图像区域的类别得分大于特定阈值时,则判断该图像区域中包含所识别的物体;当某一图像区域的类别得分小于或等于特定阈值时,则判断该图像区域中不包含所识别的物体。
6.如权利要求5所述方法,其特征在于,通过统计训练图片集中所有正样本目标得分降序排序后的前95%的位置分数作为模板的所述特定阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿依瓦(北京)技术有限公司,未经阿依瓦(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710056968.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高光效旅游用环保头灯
- 下一篇:一种照明时间长的太阳能LED路灯装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序