[发明专利]一种基于注意力机制的阴影检测方法有效
申请号: | 202010446473.X | 申请日: | 2020-05-25 |
公开(公告)号: | CN111639692B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 陈啟超;黄刚;张敏 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 彭雄 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 阴影 检测 方法 | ||
本发明公开了一种基于注意力机制的阴影检测方法,包括:获取用于训练系统的待处理公用阴影数据集;从摄像头设备或本地硬盘上获取待检测阴影图像;公用阴影数据集的预处理并获得对应的训练集与测试集;待检测阴影图像的预处理;系统核心神经网络各模块的搭建与融合,组成基于注意力机制的卷积神经网络;计算网络预测与标签损失,根据损失调整网络参数;深度卷积神经网络的完全训练并向其输入预处理的待检测阴影图像;输出阴影检测结果,对各像素进行阴影属性分类,完成自定义数据的阴影检测流程。本发明增加了阴影特征的提取能力,降低了语义间的关联性,提升了检测系统的泛化性与高效性,使得阴影检测结果更加精确。
技术领域
本发明通过研究阴影模型与注意力模型,结合残差卷积神经网络,提出了一种检测阴影的有效方法。增加了阴影特征的提取能力,提升了检测系统的泛化性与高效性,使得阴影检测结果更加精确,属于阴影检测领域。
背景技术
在图像识别或语义分割等计算机视觉分类任务中,算法需要首先提取图像或视频中的特征,深度学习中通常使用卷积神经网络进行卷积操作,逐像素处理特征语义信息,寻找与标签的似然性。因此,图像的语义构成与各像素间的关联性决定着卷积操作的效率与复杂度。
文件:Hoeim D.Single-image shadow detection and removal using pairedregions[C]//Computer Vision and Pattern Recognition.Colorado Springs:IEEE,2011:2033–2040指出,阴影作为无关背景语义,其中包含的可用关键信息较少,对于分类任务起不到相关作用,但由于其具备与目标前景像素紧密相连且形状近似的特点,通常会对计算机视觉任务的顺利进行产生影响。同时在灰度空间中,阴影对于目标像素语义具备更高的混淆性,导致卷积神经网络不易发掘出两者间的显著区别,从而降低算法训练与预测的准确性与鲁棒性。因此,在常见计算机视觉任务,如智慧驾驶、人脸检测、目标跟踪与识别、姿态估计中,图像的阴影检测工作显得格外重要,一个高效、全面、可泛化的阴影检测模型会提升整个任务的工作效率与能力上限。
目前已有部分学者提出了阴影检测算法,但其中大部分算法没有考虑到注意力机制在此类任务中的适用性以及其本身的高效性,因此最终检测效果往往达不到预期效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010446473.X/2.html,转载请声明来源钻瓜专利网。