[发明专利]一种基于关系正则化的视觉场景图生成系统及方法有效
申请号: | 201910004817.9 | 申请日: | 2019-01-03 |
公开(公告)号: | CN109726718B | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 宋井宽;郭昱宇;高联丽 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/82;G06N3/04 |
代理公司: | 成都希盛知识产权代理有限公司 51226 | 代理人: | 陈泽斌 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及视觉场景图生成技术,其公开了一种基于关系正则化的视觉场景图生成系统及方法,快速有效地判断物体间是否存在关系,有利于增强物体检测模型的探测效果。该系统,包括:物体检测器、物体标签精练器和物体关系生成器;通过物体检测器,探测图像中的物体,获得物体的标签、物体边框特征和联合边框特征;利用物体标签精练器对物体的标签进行精练,利用物体关系生成器获取物体之间的关系,生成最终的视觉场景图。本发明适用于视觉场景图的生成。 | ||
搜索关键词: | 一种 基于 关系 正则 视觉 场景 生成 系统 方法 | ||
【主权项】:
1.一种基于关系正则化的视觉场景图生成系统,其特征在于,包括:物体检测器、物体标签精练器和物体关系生成器;所述物体检测器,用于探测图像中的物体,获得物体的标签、物体边框特征和联合边框特征;所述物体标签精练器,包括关系正则化的标签编码器和标签解码器;所述关系正则化的标签编码器,用于编码物体检测器探测出的物体边框特征,获得全局特征,并基于全局特征获得关系仿射矩阵,融合物体间的仿射关系获得关系正则化的特征;所述标签解码器,用于基于关系正则化的标签编码器的输出来解码物体的标签,获得精练后的标签;所述物体关系生成器,包括关系正则化的关系编码器和关系解码器;所述关系正则化的关系编码器,用于编码标签解码器的输出,获得关系正则化的关系特征:所述关系解码器,对关系特征进行解码,获得物体间的关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910004817.9/,转载请声明来源钻瓜专利网。