[发明专利]一种基于轻量级深度神经网络的视频中人像轮廓探测方法有效
申请号: | 201911216657.0 | 申请日: | 2019-12-03 |
公开(公告)号: | CN111145195B | 公开(公告)日: | 2023-02-24 |
发明(设计)人: | 刘晋;龚沛朱;徐品真 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06T7/12 | 分类号: | G06T7/12 |
代理公司: | 上海互顺专利代理事务所(普通合伙) 31332 | 代理人: | 成秋丽 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轻量级 深度 神经网络 视频 人像 轮廓 探测 方法 | ||
1.一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述方法包括:
在Tensorflow深度学习框架下搭建MobileNet轻量网络,融入空洞卷积,获得通用语义分割模型;
通过Adobe Photoshop扣取人像,进行数据扩充,通过MobileNet检测合成图片中是否包含人像,获得包含人像边缘灰度信息的人像探测数据集;
在MobileNet网络末端加入若干全分辨率的卷积操作和双线性插值恢复细节,获得细节增强模块;
选取设定距离作为损失函数,并将蒙版与其真值的差值和应用了蒙版后的彩图与其真值的差值,均计入细节增强模块的损失函数;
用包含人像边缘灰度信息的人像探测数据集训练所述细节增强模块,固定通用语义分割模型的参数,获得端到端的人像轮廓探测模型;
将批标准化节点与卷积层融合使网络模型轻量化,并调节降采样率,输入尺寸,深度乘数优化模型。
2.根据权利要求1所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述MobileNet轻量级网络损失函数为:
其中,K表示预测种类数,C表示标签种类数,Y表示预测值,表示ground truth,s(Y)c表示softmax的回归值。
3.根据权利要求1所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述在MobileNet网络末端加入若干全分辨率的卷积操作和双线性插值恢复细节,获得细节增强模块的步骤,包括:
在通用语义分割模型的基础上,通过Softmax层对预测值进行归一化后抽取出人像通道;
将得到的人像通道的蒙版进行双线性插值放大到原图大小后与原图RGB三通道拼接,经过两层卷积进行密集预测后,再次与蒙版进行跳接;
对跳接融合结果进行一次卷积并使用Sigmoid作为激活函数,使得输出结果为范围在[0,1]的灰度值。
4.根据权利要求3所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述双线性插值的公式为:
其中,Q为输入图像中值,P为进行插值的点,x为其横坐标,y为其纵坐标。
5.根据权利要求1所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述选取设定距离作为损失函数,并将蒙版与其真值的差值和应用了蒙版后的彩图与其真值的差值,均计入损失函数公式为:
L=Lc+La
其中,W为图像的宽、H为图像的高,I表示彩色图像,Y表示灰度蒙版的预测,表示灰度蒙版的真值,i,j是图像坐标,w(i,j)是误差权重矩阵。
6.根据权利要求1所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述人像轮廓探测模型的精度评价公式如下:
其中,W表示灰度蒙版的宽,H表示灰度蒙版的高,分别表示蒙版的预测值和groundtruth,i,j为其坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911216657.0/1.html,转载请声明来源钻瓜专利网。