[发明专利]融合多粒度上下文信息的图像像素语义标注方法有效

专利信息
申请号: 201510430264.5 申请日: 2015-07-21
公开(公告)号: CN105005794B 公开(公告)日: 2018-06-05
发明(设计)人: 谢刚;赵婕;赵文晶;续欣莹;杨云云 申请(专利权)人: 太原理工大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 太原科卫专利事务所(普通合伙) 14100 代理人: 朱源
地址: 030024 *** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及图像智能识别领域,具体涉及到融合多粒度上下文信息对图像进行像素语义标注的方法。本发明对图像标注结果与视觉特征之间的关系进行分析和统计,通过细粒度上下文描述和标注平滑参数构成细粒度位置对标注模型,用以表征语义标签在局部区域内的传递特点,同时,利用粗粒度上下文描述符和语义共生参数,构成粗粒度位置对标注模型,用以描述图像中蕴含的语义类别共生关系,采用二阶条件随机场模型将单位置标注模型和两种位置对标注模型结合,使得标注模型融合了丰富的图像信息,具有较高的图像标注精确度,然后采用piecewise方法结合训练数据对模型参数进行分段并行训练,提高了训练效率。
搜索关键词: 标注 上下文信息 图像标注 语义标注 粗粒度 细粒度 上下文描述符 图像智能识别 图像 上下文描述 随机场模型 语义 并行训练 二阶条件 共生关系 结合训练 局部区域 模型参数 模型结合 模型融合 平滑参数 视觉特征 图像像素 图像信息 训练效率 语义标签 语义类别 融合 像素 分段 共生 传递 统计 分析
【主权项】:
一种融合多粒度上下文信息的图像像素语义标注方法,其特征在于包括下列步骤:(1)将图像划分为网格图像,针对任意网格位置i,构造一个颜色、纹理、形状特征组成的特征向量Yi,得到特征向量集合Y={Yi|i∈N},N为位置的数量,Yi表示位置i的特征向量;(2)设θ为特征权重参数,设与特征向量集合对应的标注集合为L={Li|i∈N},其中Li表示位置i的语义标签,采用逻辑回归分类器构造softmax函数,利用所有的特征向量和权值参数统计每个位置所属语义类别的代价,建立图像语义的单位置标注模型;(3)确定细粒度上下文信息在图像标注中的作用,具体如下:a)以任意网格位置i为中心,设置其细粒度上下文窗口将中心位置i与其在细粒度窗口中相邻的其他位置两两组合,用j表示i的相邻位置,利用所有位置对(i,j)的合并特征构成细粒度上下文描述符fij;b)用Li和Lj分别表示位置i和j的语义标注结果,在细粒度窗口中考虑相邻位置的语义标注类别的连续性,为细粒度上下文描述符设置标注平滑参数α,当Li为语义标注中的第m类,而Lj为语义标注中的第n类,即Li≠Lj时,设其标注平滑参数αmn为0,因此,细粒度上下文窗口中的标注平滑参数仅与相同语义类别的位置对相关;c)针对具有相同语义类别的位置对,利用标注平滑参数和细粒度上下文描述符对中的位置对建立标注模型,得到基于细粒度的双位置标注模型;(4)确定粗粒度上下文信息在图像标注中的作用,具体如下:a)将每个以网格位置i为中心,面积为16×16grids~20×20grids的区域划分为8个子区域,这8个子区域构成粗粒度上下文窗口其中每个子区域被视作一个整体,作为i的相邻粗粒度位置其中o=1,2,…,8;b)中心位置i的粗粒度上下文窗口中,粗粒度位置内的合并特征构成粗粒度上下文特征描述符fio,粗粒度位置内蕴含的每类语义类别似然映射的最大值集合构成粗粒度上下文共生描述符由粗粒度上下文特征描述符fio和粗粒度上下文共生描述符组合构成粗粒度上下文描述符;利用粗粒度上下文描述符,统计所有粗粒度位置中语义类别的共生关系;c)设置语义共生参数β,结合粗粒度上下文描述符对中的位置对的标注结果进行建模,得到基于粗粒度的双位置标注模型;(5)将单位置标注模型和基于粗细粒度两种双位置标注模型结合,建立融合多粒度上下文信息的二阶条件随机场模型;(6)将已知的标注集合L和特征向量集合Y作为训练集,采用piecewise训练方法对二阶条件随机场模型进行训练,得到合适的模型参数具体如下:a)利用随机赋值对二阶条件随机场模型参数进行初始化,得到模型初始化参数λinitial=(θ,α,β);b)根据λinitial=(θ,α,β),利用所有的特征向量集合Y和已知的标注集合L,采用极大似然估计迭代计算P(L|Y,λ)的对数损失函数,利用piecewise训练方式对二阶条件随机场模型进行分段并行训练,直到收敛,此时,为所求的模型参数;(7)在确定融合多粒度上下文信息的二阶条件随机场模型参数的基础上,对未标注图像进行网格划分,根据提取的特征向量,利用边缘最大后验概率求得与未标注图像对应的最优标注集合,将最优标注集合结合相应的图像位置,在图像上输出最终的标注结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510430264.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top