[发明专利]一种基于全卷积稠密网络的人像抠图方法在审
申请号: | 202011418101.2 | 申请日: | 2020-12-07 |
公开(公告)号: | CN112529929A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 李丽香;张嘉轩;彭海朋;杨子航 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06T7/194 | 分类号: | G06T7/194;G06N3/08;G06N3/04 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;马敬 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 稠密 网络 人像 方法 | ||
本发明实施例提供的一种基于全卷积稠密网络的人像抠图方法,应用于信息技术领域,用以解决如何提高人像抠图的效果的问题,通过获取样本图像;将输入图和trimap图输入到待训练的GAN网络中的全卷积稠密网络中,得到全卷积稠密网络的第一输出结果;当全卷积稠密网络的第一损失小于第一预设阈值时,将全卷积稠密网络的第一输出结果输入到判别器中,得到判别器的第一输出结果;当判别器的第一损失小于第二预设阈值时,得到训练好的GAN网络。使得得到的训练好的GAN网络在对进行抠图时,可以提高人像抠图的效果。
技术领域
本发明涉及信息技术领域,特别是涉及一种基于全卷积稠密网络的人像抠图方法。
背景技术
目前,人像抠图已经有着广泛的应用,例如海报制作,实时流媒体,电影制作等。通过人像抠图可以去除图像中的背景,提取出图像或视频帧中的人像,从而可以便于通过更换不同背景,将图像变换成不同风格。
然而,在使用图像语义分割来抠图时,一般的硬分割只是对像素点做出二分类,如果待处理图片中存在:蜘蛛网,头发,玻璃等前景,这些前景图像的颜色不只是由前景本身的颜色决定,还与背景的颜色融合有关,从而导致抠图的效果往往不佳。所以就需要软分割算法,即生成alpha蒙版来提取前景对象。
发明内容
本发明实施例的目的在于提供一种基于全卷积稠密网络的人像抠图方法,以实现提高人像抠图的效果。具体技术方案如下:
本发明实施的第一方面,提供了一种基于全卷积稠密网络的人像抠图方法,上述方法包括:
获取样本图像,其中,样本图像包括:RGBA人像图像、输入图像、trimap图,输入图为对应不同透明度的多张人像图像和背景图像合成的图像,trimap图是通过RGBA人像图像构造得到的图像;
将输入图和trimap图输入到待训练的GAN网络中的全卷积稠密网络中,得到全卷积稠密网络的第一输出结果,其中,待训练的GAN网络包括全卷积稠密网络和判别器;
以RGBA人像图像为标准,根据全卷积稠密网络的第一输出结果计算全卷积稠密网络的第一损失;
当全卷积稠密网络的第一损失大于第一预设阈值时,对全卷积稠密网络进行参数的修正,返回执行上述步骤:将输入图和trimap图输入到待训练的GAN网络中的全卷积稠密网络中,得到全卷积稠密网络的第一输出结果;
当全卷积稠密网络的第一损失小于第一预设阈值时,将全卷积稠密网络的第一输出结果输入到判别器中,得到判别器的第一输出结果;
以RGBA人像图像为标准,根据判别器的第一输出结果计算判别器的第一损失;
当判别器的第一损失大于第二预设阈值时,对判别器进行参数的修正,返回执行上述步骤:将全卷积稠密网络的第一输出结果输入到判别器中,得到判别器的第一输出结果;
当判别器的第一损失小于第二预设阈值时,得到训练好的GAN网络。
可选的,当判别器的第一损失小于第二预设阈值时,得到训练好的GAN网络,包括:
当判别器的第一损失小于第二预设阈值时,将输入图和trimap图输入到全卷积稠密网络中,得到全卷积稠密网络的第二输出结果;将全卷积稠密网络的输出结果输入到判别器中,得到判别器的第二输出结果;
以RGBA人像图像为标准,根据全卷积稠密网络的第二输出结果计算全卷积稠密网络的第二损失;以RGBA人像图像为标准,根据判别器的第二输出结果计算判别器的第二损失;
根据预设系数对全卷积稠密网络的第二损失和判别器的第二损失进行加权求和,得到GAN网络损失;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011418101.2/2.html,转载请声明来源钻瓜专利网。