[发明专利]一种基于注意力导向机制的人脸检测方法、系统、存储介质及终端在审
申请号: | 202011425736.5 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112633085A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 赵磊 | 申请(专利权)人: | 特斯联科技集团有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100016 北京市通*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 导向 机制 检测 方法 系统 存储 介质 终端 | ||
1.一种基于注意力导向机制的人脸检测方法,其特征在于,所述方法包括:
获取待检测的目标图像,并将所述待检测的目标图像输入预先训练的人脸检测模型中;其中,所述人脸检测模型中包括卷积块和注意力引导特征增强模块;所述注意力引导特征增强模块包括注意力引导模块和上下文提取模块;
采用所述卷积块中扩展的VGG16对所述待检测的目标图像进行特征提取操作生成特征图序列,并从所述特征图序列中选取6个层作为第一分支原始特征图;
基于所述上下文提取模块对所述第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图;
根据注意力引导模块采集所述拼接后的特征图对应的语义关系和空间信息,生成采集后的特征图;
基于所述第一分支原始特征图与所述采集后的特征图生成第二分支增强特征图;
将所述第二分支增强特征图输入到人脸检测模型的SSD目标检测算法头部后,得到检测出的人脸图像。
2.根据权利要求1所述的方法,其特征在于,所述基于所述上下文提取模块对所述第一分支原始特征图中每个特征图进行通道拼接,生成拼接后的特征图,包括:
上下文提取模块将所述第一分支原始特征图进行通道分组,生成三组特征图序列;
上下文提取模块将所述三组特征图序列进行特征处理,生成三组特征处理后的特征图序列;
上下文提取模块将所述三组空洞卷积后的特征图序列中各特征图通过1*1卷积参数再次特征融合后生成三组再次卷积的特征图序列;
上下文提取模块将所述三组再次卷积的特征图序列进行拼接处理,生成拼接后的特征图。
3.根据权利要求2所述的方法,其特征在于,所述上下文提取模块将所述三组特征图序列进行特征处理,生成三组特征处理后的特征图序列,包括:
上下文提取模块针对所述三组特征通道中的第一组采用不同空洞卷积层提取人脸的多尺度特性信息,生成第一精细化后的特征图序列;其中,所述空洞卷积参数为3*3,所述空洞卷积的卷记率为3;
上下文提取模块针对所述三组特征通道中的第二组采用1*1卷积增加有效特征权重的数量,生成第二精细化后的特征图序列;
上下文提取模块针对所述三组特征通道中的第三组进行全局特征提取,生成全局的特征图序列;
上下文提取模块将所述第一精细化后的特征图序列、第二精细化后的特征图序列以及全局的特征图序列进行通道拼接,生成拼接后的特征图序列;
上下文提取模块采用1*1卷积参数将所述三组空洞卷积后的特征图序列进行特征融合,生成三组特征处理后的特征图序列。
4.根据权利要求3所述的方法,其特征在于,所述上下文提取模块针对所述三组特征通道中的第三组进行全局特征提取,生成全局的特征图序列,包括:
上下文提取模块针对所述三组特征通道中的第三组采用全局平均池化(GAP)处理,生成池化后的特征图序列;
上下文提取模块将所述池化后的特征图序列采用1*1卷积参数改变通道维数,生成改变后的特征图序列;
上下文提取模块将所述改变后的特征图序列上采样到预设阈值的空间维度,生成全局的特征图序列。
5.根据权利要求1所述的方法,其特征在于,所述根据注意力引导模块采集所述拼接后的特征图对应的语义关系和空间信息,生成采集后的特征图,包括:
注意力引导模块提取所述拼接后的特征图中任意两个位置之间的语义关系;
注意力引导模块收集所述拼接后的特征图中任意两个位置之间的空间信息;
注意力引导模块将所述语义关系和所述空间信息进行合并后,生成采集后的特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯联科技集团有限公司,未经特斯联科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011425736.5/1.html,转载请声明来源钻瓜专利网。