[发明专利]基于深度学习的面部运动轮椅控制图像处理方法在审
申请号: | 202210741126.9 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115131860A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 吕文琪;向毅;马骁;雷亮;刘子樊;傅普杰;蒋鸿伟;吴锦洲;何龙;冯小渝;简夜明 | 申请(专利权)人: | 重庆科技学院 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V40/20;G06V10/74;G06V10/764;G06V10/766;G06V10/82;G06N3/04;G06F3/01 |
代理公司: | 北京翔石知识产权代理事务所(普通合伙) 11816 | 代理人: | 王洋洋 |
地址: | 401331 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 面部 运动 轮椅 控制 图像 处理 方法 | ||
1.一种基于深度学习的面部运动轮椅控制图像处理方法,其特征在于,包括如下步骤:
第一步:根据输入图片生成图片金字塔,缩放各种尺度的图片后将所有的图片进行图像预处理,先对其进行形态学上的腐蚀膨胀操作来消除噪点后,之后对图片像素值进行归一化;
第二步:将处理后的图片传送到第一级网络,来获得图片中的人脸候选窗口以及它们的Bounding Box回归向量;
第三步:通过Bounding Box回归的结果矫正候选窗口,最后通过NMS非极大值抑制来合并高度重合的窗口;
第四步:根据上一步输出的所有候选框,进一步拒绝大量错误的候选框后,通过Bounding Box回归进行校准,同样采用NMS非极大值抑制合并窗口后输入到最后一级网络;
第五步:最后一级网络不仅输出检测窗口的置信度以及Bounding Box回归向量,还输出人脸关键点的坐标向量。
2.如权利要求1所述的基于深度学习的面部运动轮椅控制图像处理方法,其特征在于,在第二步中采用全卷积神经网络,通过卷积网络参数共享的特性来实现快速的滑动窗口算法。
3.如权利要求1所述的基于深度学习的面部运动轮椅控制图像处理方法,其特征在于,在人脸判断中将其转化为二分类问题使用交叉熵损失:
4.如权利要求1所述的基于深度学习的面部运动轮椅控制图像处理方法,其特征在于,对于Bounding Box回归与关键点回归,用L2正则化损失:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆科技学院,未经重庆科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210741126.9/1.html,转载请声明来源钻瓜专利网。