[发明专利]一种基于特征动态选择的多任务联合检测方法有效
申请号: | 202010303705.6 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111598107B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 刘姜江;程明明;侯淇彬 | 申请(专利权)人: | 南开大学 |
主分类号: | G06V10/778 | 分类号: | G06V10/778;G06V10/46;G06V10/44;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 侯力 |
地址: | 300071*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 动态 选择 任务 联合 检测 方法 | ||
本发明公开了一种基于特征动态选择的多任务联合检测方法,属于图像处理技术领域。大多数现有的检测模型都是每个不同的任务独立设计一个不同的模型来分别进行处理,需要花费大量的人工精力。本发明创造性地提出一种基于特征动态选择的多任务联合检测模型,该模型能够根据不同任务的特点自适应且动态地从共享的特征集合中选择各任务合适的特征;此外,该模型能够能够被端到端的训练,并且能够一次计算同时输出得到待检测图像的显著性物体检测结果图像、边缘检测结果图像以及骨架检测结果图像。本方法在一个网络模型中同时并且快速地完成了三种不同的图像处理任务,此方法具有结构简单、参数量小和运行速度快的优点,并且具有良好的检测准确率。
技术领域
本发明属于图像处理技术领域,特别涉及到一种基于特征动态选择的多任务联合检测方法。
背景技术
显著性物体检测、边缘检测和骨架检测这三类问题在图像处理技术领域有着重要的研究和应用价值,例如在无人驾驶、机器人导航、目标分割等众多高科技领域均发挥着不可替代的作用。之前的大部分方法都是针对上述问题中的某一个特定问题而专门设计一个深度网络结构,独立地完成这三类检测任务,并且对应于某一类的任务的方法不能在其它类型的方法上发挥效果,这极大提高了此类方法的研发和应用成本,降低了实际应用意义。
对于显著性物体检测,Xi Li等人于2016年提出的方法“Li X,Zhao L,Wei L,etal.DeepSaliency:Multi-task deep neural network model for salient objectdetection[J].IEEE Transactions on Image Processing,2016,25(8):3919-3930.”采用了一种多任务监督的深度网络结构来解决此任务。此方法对深度网络结构进行了大幅修改,且只能应用于显著性物体检测;对于边缘检测,Saining Xie等人于2015年提出了“XieS,Tu Z.Holistically-nested edge detection[C]//Proceedings of the IEEEinternational conference on computer vision.2015:1395-1403.”方法,此方法在深度网络结构中的每一层都加上强监督,一次来得到更精细的边缘信息;对于骨架提取,Wei Ke等人于2017年提出了“Ke W,Chen J,Jiao J,et al.SRN:Side-output Residual Networkfor Object Symmetry Detection in the Wild[J].arXiv preprint arXiv:1703.02243,2017.”,此方法对深度网络结构的多个侧输出上进行了监督学习,并加入了跳层连接来适应骨架提取任务。
上述三种方法都是针对特定的问题而分别设计了一种复杂的网络结构以专门解决此类问题,这些网络结构并不能够被运用到其他类别的任务,研究投入巨大的同时实际使用成本也较高。
此外,名称为“基于新型神经网络的多任务场景语义理解模型及其应用”的201710453745.7号专利申请中提出的网络模型的应用场景为富含具体物体类别信息的语义分割任务,不适合解决一些不关注物体类别信息的低层计算机视觉任务。
名称为“一种基于深度神经网络的多任务语音分类方法”的201710801016.6号专利申请中的多任务方法的领域为语音处理,数据输入类型为一维语音信息,不能解决二维图像信息相关的问题。
发明内容
本发明需要解决的技术问题是,针对已有的显著性物体检测方法、边缘检测方法以及骨架检测方法分别需要设计三种不同的模型,且这三种模型之间的差异明显,因此不能够被运用到其他类别检测任务的问题。这些限制提高了深度网络的应用要求和难度。为此提出了一种基于特征动态选择的多任务联合检测方法,该方法开发了一种新的统一的深度网络模型,能够同时实现显著性物体检测、边缘检测和骨架检测三种不同类别的图像检测功能。这样一个统一的深度网络模型能够大大减少深度网络的推广和量产成本。
本发明的采用的技术方案是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010303705.6/2.html,转载请声明来源钻瓜专利网。