[发明专利]基于YOLO-RGGNet的机器人端人脸检测方法在审
申请号: | 202011526494.9 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112464912A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 何志伟;陈志民;董哲康;高明煜 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 yolo rggnet 机器人 端人脸 检测 方法 | ||
1.基于YOLO-RGGNet的机器人端人脸检测方法,其特征在于:具体包括以下步骤:
步骤1、建立数据集
从互联网采集或者拍摄自然场景下的人脸图片,并对图像进行预处理操作扩充数据后划分训练集和验证集,然后标注图像中人脸框的中心点坐标以及4个顶点的坐标;
步骤2、构建分类预测网络模型
s2.1、构建特征提取部分
使用5个RGGBlock残差模块代替YOLOv3网络中原有的5个残差块和下采样模块,构建轻量化的DarkRGGNet-44特征提取网络,网络结构依次为3x3卷积块Conv0和5个RGGBlock残差模块;RGGBlock残差模块包括一个RGGNet下采样残差单元块和多个RGGNet残差单元,5个RGGBlock残差模块中RGGNet残差单元的个数依次为1、2、2、2、1个;RGGNet残差单元的结构为将输入的特征依次经过RGG module1、BN层、RELU激活层、RGG module2和BN层后再与恒等映射后的输入特征进行通道拼接操作;RGGNet下采样残差单元块的结构为在RGGNet残差单元的RELU激活层后依次插入1个步长为2的深度可分离卷积、BN层和RELU激活层;
其中,RGG module将通道数为C的输入特征图Pin特征分离为通道数为εC的特征图Prep和通道数为(1-ε)C的特征图Pred,再使用1x1的卷积块提取特征图Pred的隐含细节信息,将其与使用Group-Ghost module提取Prep得到的重要信息进行通道拼接;Group-Ghost module将Ghost module的本征特征图分为K组后先经过1x1的卷积块得到多样化的特征图后再进行一次Ghost操作生成多个随机特征,再将随机特征与经过恒等映射的本征特征进行拼接;
s2.2、构建预测部分
将YOLOv3原FPN网络中52x52预测层和26x26预测层中的“concat+CBL*5”模块替换为CEC模块,并将52x52预测层中CEC模块的输出输入到26x26预测层的CEC模块中;将26x26预测层的CEC模块的输出与13x13预测层的CBL*5操作的输出一同输入到CEC模块后,再将结果与第5个RGGBlock残差模块的输出经过RFA模块后加权相加,再经过CBL和CONV操作后作为13x13预测层的输出;所述
所述RFA模块通过自适应池化模块将尺度为s的输入特征图更改为不同尺度的N个上下文特征,然后通过1x1的卷积操作对N个不同尺度的上下文特征进行通道降维,再通过上采样模块将其统一放大到s尺度,最后通过ASF模块进行空间融合后输出;
所述ASF模块的结构为:将输入的特征依次经过通道合并操作、1x1的卷积操作、3x3的卷积操作和通道分离操作后与恒等映射后的输入特征进行通道特征增强操作后输出;
步骤3、模型训练与优化
向步骤2中构建的分类预测网络模型输入训练集进行迭代训练,并在每次迭代完成时进行验证,保存当前模型的权重文件与此前训练中最好的模型权重文件,使用Adam算法对模型进行优化,迭代训练start次后,进行学习率衰减,计算公式为:
其中α’表示衰减后的学习率,α表示初始学习率,r表示衰减率,epoch为当前训练的迭代次数,v表示衰减速度;
训练达到设置的迭代次数时,结束训练,并保存最好的模型权重文件;
步骤4、模型测试
使用移动端机器人的摄像头对周围环境进行实时录像,通过步骤3训练优化好的分类预测网络模型对采集的视频帧图像进行分析,输出图像中人脸框的中心点坐标与左上角坐标。
2.如权利要求1所述基于YOLO-RGGNet的机器人端人脸检测方法,其特征在于:步骤一中对图像进行预处理的操作包括几何变换、高斯模糊和亮度对比度随机调节。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011526494.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于MLE和BIC的随机点模式参数估计方法
- 下一篇:一种视频监控装置及系统