首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]物体识别方法及装置在审

申请号：	202010157201.8	申请日：	2016-10-24
公开（公告）号：	CN111523552A	公开（公告）日：	2020-08-11
发明（设计）人：	何凯	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06K9/46	分类号：	G06K9/46;G06K9/62;G06K9/72
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	周嗣勇
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	物体识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种物体识别方法，所述方法包括：

对待识别的图像进行区域划分，得到图像区域集合；

将所述图像区域集合输入预设的条件随机场模型中；其中，所述条件随机场模型基于空间视觉上下文信息和语义上下文信息构建而成；

在所述条件随机场模型中对所述图像区域集合中每一个图像区域进行标签推理；

将所述标签推理得出的概率最大的物体标签集合中的物体标签一一标注于对应的图像区域；

其中，所述条件随机场模型由图像区域的特征和被判断物体之间关系的点势函数基于空间视觉上下文信息的边势函数基于语义上下文信息的边势函数构成。

2.根据权利要求1所述的方法，所述图像区域的特征和被判断物体之间关系的点势函数如下公式所示：

其中，λ^k，α^k是点势函数上的参数；是图像区域i被标注为物体k的标签值；是物体k出现在图像区域i中的概率值。

3.根据权利要求1所述的方法，所述基于空间视觉上下文信息的边势函数如下公式所示：

其中，是该边势函数上的参数；是图像区域i被标注为物体k的标签值；是图像区域j被标注为物体k的标签值；是物体k出现在图像区域j中的概率值；sim(x_i,x_j)＝exp(-dist(x_i,x_j))，其中，dist(x_i,x_j)是图像特征x_i，x_j之间的欧式距离值。

4.根据权利要求1所述的方法，所述基于语义上下文信息的边势函数如下公式所示：

其中，ε^kp是该边势函数上的参数，是图像区域i被标注为物体k的标签值；是图像I被标注为物体p的标签值；cor(k,p)＝μ·occur(k,p)，其中，μ是平滑参数；occur(k，p)是物体k与p之间的共现频率；是物体p出现在图像I中的概率值。

5.根据权利要求1所述的方法，所述归一化常数通过最优化算法进行迭代求解。

6.根据权利要求5所述的方法，所述最优化算法包括投影梯度下降算法。

7.根据权利要求1所述的方法，所述在所述条件随机场模型中对所输入的图像区域集合中每一个图像区域进行标签推理，具体包括：

根据图像区域的特征和被判断物体，计算得出该图像区域的第一概率值；

根据图像区域和相邻图像区域之间特征的相似度进行标签平滑处理，计算得出该图像区域的第二概率值；

根据图像区域的被判断物体和相邻图像区域被标注的物体，从语义概念集合中获取这两个物体之间的共现频率，计算该图像区域的第三概率值；

根据所述第一概率值、第二概率值和第三概率值，计算得出该图像区域联合的概率值。

8.根据权利要求1所述的方法，所述标签推理通过迭代算法进行。

9.根据权利要求8所述的方法，所述迭代算法包括ICM算法。

10.一种物体识别装置，所述装置包括：

划分单元，对待识别的图像进行区域划分，得到图像区域集合；

输入单元，将所述图像区域集合输入预设的条件随机场模型中；其中，所述条件随机场模型基于空间视觉上下文信息和语义上下文信息构建而成；

识别单元，在所述条件随机场模型中对所述图像区域集合中每一个图像区域进行标签推理；

标注单元，将所述标签推理得出的概率最大的物体标签集合中的物体标签一一标注给对应的图像区域；

其中，所述条件随机场模型由图像区域的特征和被判断物体之间关系的点势函数基于空间视觉上下文信息的边势函数基于语义上下文信息的边势函数构成。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司，未经阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010157201.8/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于眼动数据获取产品原型方法和系统
下一篇：一种基于流固耦合的叶片振动响应分析方法

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code