[发明专利]一种基于轻量级深度神经网络的视频中人像轮廓探测方法有效

专利信息
申请号: 201911216657.0 申请日: 2019-12-03
公开(公告)号: CN111145195B 公开(公告)日: 2023-02-24
发明(设计)人: 刘晋;龚沛朱;徐品真 申请(专利权)人: 上海海事大学
主分类号: G06T7/12 分类号: G06T7/12
代理公司: 上海互顺专利代理事务所(普通合伙) 31332 代理人: 成秋丽
地址: 201306 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 轻量级 深度 神经网络 视频 人像 轮廓 探测 方法
【权利要求书】:

1.一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述方法包括:

在Tensorflow深度学习框架下搭建MobileNet轻量网络,融入空洞卷积,获得通用语义分割模型;

通过Adobe Photoshop扣取人像,进行数据扩充,通过MobileNet检测合成图片中是否包含人像,获得包含人像边缘灰度信息的人像探测数据集;

在MobileNet网络末端加入若干全分辨率的卷积操作和双线性插值恢复细节,获得细节增强模块;

选取设定距离作为损失函数,并将蒙版与其真值的差值和应用了蒙版后的彩图与其真值的差值,均计入细节增强模块的损失函数;

用包含人像边缘灰度信息的人像探测数据集训练所述细节增强模块,固定通用语义分割模型的参数,获得端到端的人像轮廓探测模型;

将批标准化节点与卷积层融合使网络模型轻量化,并调节降采样率,输入尺寸,深度乘数优化模型。

2.根据权利要求1所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述MobileNet轻量级网络损失函数为:

其中,K表示预测种类数,C表示标签种类数,Y表示预测值,表示ground truth,s(Y)c表示softmax的回归值。

3.根据权利要求1所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述在MobileNet网络末端加入若干全分辨率的卷积操作和双线性插值恢复细节,获得细节增强模块的步骤,包括:

在通用语义分割模型的基础上,通过Softmax层对预测值进行归一化后抽取出人像通道;

将得到的人像通道的蒙版进行双线性插值放大到原图大小后与原图RGB三通道拼接,经过两层卷积进行密集预测后,再次与蒙版进行跳接;

对跳接融合结果进行一次卷积并使用Sigmoid作为激活函数,使得输出结果为范围在[0,1]的灰度值。

4.根据权利要求3所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述双线性插值的公式为:

其中,Q为输入图像中值,P为进行插值的点,x为其横坐标,y为其纵坐标。

5.根据权利要求1所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述选取设定距离作为损失函数,并将蒙版与其真值的差值和应用了蒙版后的彩图与其真值的差值,均计入损失函数公式为:

L=Lc+La

其中,W为图像的宽、H为图像的高,I表示彩色图像,Y表示灰度蒙版的预测,表示灰度蒙版的真值,i,j是图像坐标,w(i,j)是误差权重矩阵。

6.根据权利要求1所述的一种基于轻量级深度神经网络的视频中人像轮廓探测方法,其特征在于,所述人像轮廓探测模型的精度评价公式如下:

其中,W表示灰度蒙版的宽,H表示灰度蒙版的高,分别表示蒙版的预测值和groundtruth,i,j为其坐标。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911216657.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top