[发明专利]物体识别方法及装置在审
申请号: | 202010157201.8 | 申请日: | 2016-10-24 |
公开(公告)号: | CN111523552A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 何凯 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06K9/62;G06K9/72 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 识别 方法 装置 | ||
1.一种物体识别方法,所述方法包括:
对待识别的图像进行区域划分,得到图像区域集合;
将所述图像区域集合输入预设的条件随机场模型中;其中,所述条件随机场模型基于空间视觉上下文信息和语义上下文信息构建而成;
在所述条件随机场模型中对所述图像区域集合中每一个图像区域进行标签推理;
将所述标签推理得出的概率最大的物体标签集合中的物体标签一一标注于对应的图像区域;
其中,所述条件随机场模型由图像区域的特征和被判断物体之间关系的点势函数基于空间视觉上下文信息的边势函数基于语义上下文信息的边势函数构成。
2.根据权利要求1所述的方法,所述图像区域的特征和被判断物体之间关系的点势函数如下公式所示:
其中,λk,αk是点势函数上的参数;是图像区域i被标注为物体k的标签值;是物体k出现在图像区域i中的概率值。
3.根据权利要求1所述的方法,所述基于空间视觉上下文信息的边势函数如下公式所示:
其中,是该边势函数上的参数;是图像区域i被标注为物体k的标签值;是图像区域j被标注为物体k的标签值;是物体k出现在图像区域j中的概率值;sim(xi,xj)=exp(-dist(xi,xj)),其中,dist(xi,xj)是图像特征xi,xj之间的欧式距离值。
4.根据权利要求1所述的方法,所述基于语义上下文信息的边势函数如下公式所示:
其中,εkp是该边势函数上的参数,是图像区域i被标注为物体k的标签值;是图像I被标注为物体p的标签值;cor(k,p)=μ·occur(k,p),其中,μ是平滑参数;occur(k,p)是物体k与p之间的共现频率;是物体p出现在图像I中的概率值。
5.根据权利要求1所述的方法,所述归一化常数通过最优化算法进行迭代求解。
6.根据权利要求5所述的方法,所述最优化算法包括投影梯度下降算法。
7.根据权利要求1所述的方法,所述在所述条件随机场模型中对所输入的图像区域集合中每一个图像区域进行标签推理,具体包括:
根据图像区域的特征和被判断物体,计算得出该图像区域的第一概率值;
根据图像区域和相邻图像区域之间特征的相似度进行标签平滑处理,计算得出该图像区域的第二概率值;
根据图像区域的被判断物体和相邻图像区域被标注的物体,从语义概念集合中获取这两个物体之间的共现频率,计算该图像区域的第三概率值;
根据所述第一概率值、第二概率值和第三概率值,计算得出该图像区域联合的概率值。
8.根据权利要求1所述的方法,所述标签推理通过迭代算法进行。
9.根据权利要求8所述的方法,所述迭代算法包括ICM算法。
10.一种物体识别装置,所述装置包括:
划分单元,对待识别的图像进行区域划分,得到图像区域集合;
输入单元,将所述图像区域集合输入预设的条件随机场模型中;其中,所述条件随机场模型基于空间视觉上下文信息和语义上下文信息构建而成;
识别单元,在所述条件随机场模型中对所述图像区域集合中每一个图像区域进行标签推理;
标注单元,将所述标签推理得出的概率最大的物体标签集合中的物体标签一一标注给对应的图像区域;
其中,所述条件随机场模型由图像区域的特征和被判断物体之间关系的点势函数基于空间视觉上下文信息的边势函数基于语义上下文信息的边势函数构成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010157201.8/1.html,转载请声明来源钻瓜专利网。