[发明专利]一种基于特征融合的Logo图像检测方法及系统在审
申请号: | 202210046494.1 | 申请日: | 2022-01-13 |
公开(公告)号: | CN114549845A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 侯素娟;李星卓;邵文静;刘文洁;贾伟宽;郑元杰 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06V10/40 | 分类号: | G06V10/40;G06V10/25;G06K9/62;G06N3/04;G06N3/08;G06V10/774;G06V10/82;G06V10/80 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 闫圣娟 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 融合 logo 图像 检测 方法 系统 | ||
1.一种基于特征融合的Logo图像检测方法,其特征在于,包括如下步骤:
将待检测Logo图像进行特征提取;
将提取的特征输入至融合多个异构信息路径的特征金字塔网络进行特征融合;
将融合后的特征图输入至通过内卷的方式构建的区域生成网络,生成区域建议框;
对区域建议框通过全连接层进行分类和定位,计算获得建议框的类别和最终的位置坐标。
2.如权利要求1所述的一种基于特征融合的Logo图像检测方法,其特征在于:融合多个异构信息路径的特征金字塔网络,具体为:融合特征金字塔网络和神经网络结构搜索的OPANAS连接骨干网络,包括六种异构信息路径和特征金字塔网络,OPANAS连接骨干网络结构包括金字塔网络以及设置在金字塔输入输出节点之间的多个中间节点,任意两个节点之间设置多个不同类型的异构信息路径。
3.如权利要求2所述的一种基于特征融合的Logo图像检测方法,其特征在于:通过一次性搜索方法来寻找最优路径聚合结构,从而确定融合多个异构信息路径的特征金字塔网络的结构。
4.如权利要求1所述的一种基于特征融合的Logo图像检测方法,其特征在于:异构信息路径包括自顶向下、自底向上、融合-分裂、尺度-均衡、跳跃-连接和无操作的异构信息路径。
5.如权利要求1所述的一种基于特征融合的Logo图像检测方法,其特征在于:将融合后的特征图输入至区域生成网络,生成区域建议框的步骤如下:
在特征图上采用卷积层作为滑动窗口进行滑动,找到滑动窗口中心点在原图上的对应点,生成不同大小和长宽比例的锚框;
基于锚框与标注框之间的交并比,通过Softmax函数对预先定义的锚框进行正负样本的判定,并计算锚框的回归偏移量;
通过置信度排序提取修正位置后的正样本,并剔除其中小于设定值的样本,再对剩余正样本进行非极大值抑制操作,确定区域建议框;
将得到的区域候选框统一成相同尺寸。
6.如权利要求1所述的一种基于特征融合的Logo图像检测方法,其特征在于:对区域建议框通过全连接层进行分类和定位,具体为:利用已经获得的区域建议框即为候选框的特征图,通过全连接层与Softmax函数计算每个候选框具体属于类别,输出概率向量;利用候选框回归获得每个候选框的位置偏移量,用于回归更加精确的目标检测框。
7.如权利要求1所述的一种基于特征融合的Logo图像检测方法,其特征在于:还包括对依次级联的特征提取模型、融合多个异构信息路径的特征金字塔网络以及区域生成网络训练的过程,具体步骤如下:
获取Logo图像,构建数据集;
将数据集的图片输入到骨干网络残差网络作为骨干网络进行特征提取,将提取的特征输入至融合多个异构信息路径的特征金字塔网络进行特征融合;
将融合后的特征图输送至采用内卷方式进行构建的区域生成网络获取区域建议框,将感兴趣区域采样至相同尺寸;
通过两个全连接层预测Logo的类别置信度和边框坐标;对区域建议框通过全连接层进行分类和定位;
使用训练集进行训练,计算模型预测值与真实值之间的损失,并通过梯度回传更新网络参数,不断迭代训练并进行优化,得到最优的检测网络模型。
8.一种基于特征融合的Logo图像检测系统,其特征在于,包括:
特征提取模块:被配置为用于将待检测Logo图像进行特征提取;
特征融合模块:被配置为用于将提取的特征输入至融合多个异构信息路径的特征金字塔网络进行特征融合;
建议框生成模块:被配置为用于将融合后的特征图输入至通过内卷的方式构建的区域生成网络,生成区域建议框;
分类定位模块:被配置为用于对区域建议框通过全连接层进行分类和定位,计算获得建议框的类别和最终的位置坐标。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项方法所述的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项方法所述的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210046494.1/1.html,转载请声明来源钻瓜专利网。