[发明专利]一种基于门控机制的特征融合方法和目标检测网络在审
申请号: | 202110913337.1 | 申请日: | 2021-08-10 |
公开(公告)号: | CN113537396A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 邵振洲;刘超;关永 | 申请(专利权)人: | 北京天时行智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王爱涛 |
地址: | 100023 北京市门头沟区石*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 门控 机制 特征 融合 方法 目标 检测 网络 | ||
本发明涉及一种基于门控机制的特征融合方法和目标检测网络,包括:获取检测目标图像的低层细节特征和高层语义特征;低层细节特征和高层语义特征作为门控融合模块的输入特征;将低层细节特征和高层语义特征进行拼接,执行卷积操作,利用第一激活函数得到更新门控信号和重置门控信号;利用重置门控信号对低层细节特征进行滤除,得到滤除后的低层细节特征;将滤除后的低层细节特征与高层语义特征进行拼接,执行卷积操作,利用第二激活函数得到当前的候选特征;利用更新门控信号对低层细节特征和当前的候选特征进行选择性融合,得到融合特征,融合特征用于目标检测。本发明提高了目标检测的准确率。
技术领域
本发明涉及特征融合领域,特别是涉及一种基于门控机制的特征融合方法和目标检测网络。
背景技术
在利用卷积神经网络进行目标检测的任务中,卷积神经网络的深度对模型的性能至关重要,当增加卷积神经网络层数后,卷积神经网络可以进行更加复杂的特征模式的提取,所以当模型更深时,理论上可以取得更好的结果。但是在实践中,随着卷积神经网络深度的增加,卷积神经网络检测的准确度出现饱和,甚至出现下降,残差网络利用短路连接解决了这个问题,但是残差网络做的是全等映射,会将冗余的特征传递到后面的卷积层,冗余的信息会对检测造成干扰,影响物体的检测,且现有的特征融合方法并没有考虑到特征的选择性,不能充分利用低层的细节特征与高层的语义特征,从而使目标检测的准确率较低。
发明内容
本发明的目的是提供一种基于门控机制的特征融合方法和目标检测网络,以解决现有技术中利用卷积神经网络进行目标检测的准确率低的问题。
为实现上述目的,本发明提供了如下方案:
一种基于门控机制的特征融合方法,包括:
获取检测目标图像的低层细节特征和高层语义特征;所述低层细节特征和所述高层语义特征作为门控融合模块的输入特征;
将所述低层细节特征和所述高层语义特征进行拼接,执行卷积操作,利用第一激活函数得到更新门控信号和重置门控信号;所述第一激活函数为sigmoid函数;
利用所述重置门控信号对所述低层细节特征进行滤除,得到滤除后的低层细节特征;
将所述滤除后的低层细节特征与所述高层语义特征进行拼接,执行卷积操作,利用第二激活函数得到当前的候选特征;所述第二激活函数为Tanh函数;
利用所述更新门控信号对所述低层细节特征和所述当前的候选特征进行选择性融合,得到融合特征,所述融合特征用于目标检测。
可选的,所述将所述低层细节特征和所述高层语义特征进行拼接,执行卷积操作,利用第一激活函数得到更新门控信号和重置门控信号,具体包括:
利用公式z=σ(Wz,(fn,fn-1))对所述低层细节特征和所述高层语义特征进行拼接,执行卷积操作,得到所述更新门控信号;
利用公式r=σ(Wr,(fn,fn-1))对所述低层细节特征和所述高层语义特征进行拼接,执行卷积操作,得到所述重置门控信号;
其中,σ为第一激活函数,z为更新门控信号,0z1,r为重置门控信号,0r1;fn为高层语义特征,fn-1为低层细节特征;Wz和Wr为相应卷积的权重。
可选的,所述利用所述重置门控信号对所述低层细节特征进行滤除,得到滤除后的低层细节特征,具体包括:
利用公式fn-1′=fn-1⊙r对所述低层细节特征进行滤除,得到滤除后的低层细节特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天时行智能科技有限公司,未经北京天时行智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110913337.1/2.html,转载请声明来源钻瓜专利网。