[发明专利]基于Faster R-CNN的图模型构建方法在审
申请号: | 202110406043.X | 申请日: | 2021-04-15 |
公开(公告)号: | CN113516158A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 金海燕;闫智慧;肖照林;孙钦东 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 罗笛 |
地址: | 710048 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 faster cnn 模型 构建 方法 | ||
本发明公开了一种基于Faster R‑CNN的图模型构建方法,具体为:步骤1,将目标图像送入已经训练好的基于Faster R‑CNN的目标检测网络模型中,输出目标图像中各个目标对应的检测框;步骤2,根据设定的阈值对目标检测框进行筛选,去掉冗余的目标检测框;步骤3,给目标检测框分配唯一的标签;步骤4,将图像的目标划分为主要目标和次要目标,然后对次要目标构建目标树;步骤5,确定两个物体之间的相对位置关系;步骤6、根据目标树以及目标之间的位置关系构建图像的图模型。本发明的基于FasterR‑CNN的图模型构建方法,建立出的图模型能有效的表示出各个目标在目标图像中的空间布局和语义联系。
技术领域
本发明属于计算机数字图像处理技术领域,涉及一种基于Faster R-CNN的图模型构建方法。
背景技术
在当今飞速发展的信息时代,数字图像作为一种常见且有效的信息载体已渗透到社会生活的每一个角落,致使我们对图像处理的需求也日益增长。
在数字图像处理方向上,基于深度学习的目标检测算法是重要的研究内容之一,在医疗,智能家居和交通等不同领域有着巨大的应用。基于深度学习的图像处理算法与传统的图像处理算法相比,可以在复杂的环境下,提取更深层次的人物特征,提高算法鲁棒性和识别准确性。
目前,已有的构建图模型方法,往往利用深度学习对目标图像中的物体进行识别,但是现有的深度学习目标识别算法只能够检测出图形中物体的类别与位置,并不能得到图像中各个物体之间的空间相对位置关系,从而不能很好的构建出图像的图模型。
发明内容
本发明的目的是提供一种基于Faster R-CNN的图模型构建方法,建立出的图模型能有效的表示出各个目标在目标图像中的空间布局和语义联系。
本发明所采用的技术方案是,基于Faster R-CNN的图模型构建方法,具体按照如下步骤实施:
步骤1,将目标图像送入已经训练好的基于Faster R-CNN的目标检测网络模型中,输出目标图像中各个目标对应的检测框;
步骤2,根据设定的阈值对目标检测框进行筛选,去掉冗余的目标检测框;
步骤3,给去冗余后的目标检测框分配唯一的标签;
步骤4,根据经验设定阈值,将图像的目标划分为主要目标和次要目标,然后对次要目标构建目标树;
步骤5,通过任意两个次要目标重心之间的连线与竖轴的顺时针的夹角对检测框进行解析处理,得到目标图像中任意两个物体之间的相对位置关系,然后,计算目标图像中任意两个目标重心之间的距离,最后根据物体之间的距离、各个物体的重心得到任意两个物体之间的相对位置关系;
步骤6、根据目标树以及目标之间的位置关系构建图像的图模型。
基于Faster R-CNN的目标检测网络模型对目标图像进行检测的过程为:假设目标图像中共有n个物体,通过基于Faster R-CNN的目标检测网络模型进行目标检测之后输出目标图像中n个物体对应的目标检测框box和每个目标检测框对应的类别,将类别相同的目标检测框归为一类,将n个物体对应的目标检测框放入一个集合中,其中m表示目标图像中目标检测框的总数量,集合中的元素表示为:{box1,box2,...,boxm},其中boxi表示检测出的第i个目标检测框,输出的boxi是一个四维几何坐标(xi,yi,wi,hi),其中xi表示当前目标检测框的重心坐标点的x轴坐标值,yi表示当前目标检测框的重心坐标点的y轴坐标值,wi表示当前目标检测框的宽度,hi表示当前目标检测框的高度。
步骤2具体为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110406043.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于实际故障信息的系统阻抗校核方法
- 下一篇:一种投资理财指导教学装置