[发明专利]一种基于VggNet的显著目标检测方法在审
申请号: | 201810457552.3 | 申请日: | 2018-05-14 |
公开(公告)号: | CN108629789A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 郭炜强;徐绍栋;张宇;郑波 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06T7/13 | 分类号: | G06T7/13;G06T3/40;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于VggNet的显著目标检测方法,该方法是以保留图像底层边缘特征为主要目标,提取高层语义特征为第二目标。通过将图像底层边缘特征与高层语义特征进行卷积,进而获得目标显著图。在确保有效提高检测准确率的同时,通过减少全连接层和增加归一化层大幅度提升网络训练速度。对于任意大小的RGB图像,通过线性插值将图像调整为固定的大小,从而实现不同大小的图像均能得到有效的处理。本发明方法既能快速提取高层语义特征,又能保留图像底层边缘信息,从而有效解决单纯提取特征类的网络结构无法获取图像边缘的问题。 | ||
搜索关键词: | 高层语义特征 图像底层 边缘特征 目标检测 边缘信息 获取图像 快速提取 提取特征 图像调整 网络结构 网络训练 有效解决 固定的 归一化 连接层 显著图 准确率 保留 卷积 图像 检测 | ||
【主权项】:
1.一种基于VggNet的显著目标检测方法,其特征在于:该方法以保留图像底层边缘特征为主要目标,提取高层语义特征为第二目标,通过将图像底层边缘特征与高层语义特征进行卷积,进而获得目标显著图,在确保有效提高检测准确率的同时,通过减少全连接层和增加归一化层大幅度提升网络训练速度,对于任意大小的RGB图像,通过线性插值将图像调整为固定的大小,从而实现不同大小的图像均能得到有效的处理;其包括以下步骤:1)通过线性插值对输入图像进行预处理,使所有图像满足网络输入要求;2)通过卷积操作按层次提取图像特征,根据卷积核大小和步长分别获得多个通道的卷积结果;3)通过下采样操作对卷积结果进行处理,减少数据操作时间及空间消耗;4)通过批量归一化层归一化图像数据,防止出现梯度弥散或梯度爆炸的情况;5)对卷积结果进行反卷积操作将图像矩阵还原至原图像大小,准备生成显著图;6)将反卷积后的结果与底层边缘信息进行卷积,获得最终目标显著图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810457552.3/,转载请声明来源钻瓜专利网。