[发明专利]一种基于注意力模型的头肩部分图像分割方法及装置在审
申请号: | 201711375814.3 | 申请日: | 2017-12-19 |
公开(公告)号: | CN107993238A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 李珊如;刘昕;袁基睿;山世光 | 申请(专利权)人: | 中科视拓(北京)科技有限公司 |
主分类号: | G06T7/12 | 分类号: | G06T7/12;G06T7/11;G06T7/194;G06N3/04;G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100086 北京市海淀区科*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 模型 肩部 图像 分割 方法 装置 | ||
技术领域
本发明涉及图像分割技术领域,尤其涉及一种基于注意力模型的头肩部分图像分割方法。
背景技术
头肩分割是特定任务下的一种前景提取技术。前景提取(matting),是计算机图像处理中的一个操作,目的是把一幅图像中人们感兴趣的区域提取出来,以便更换背景或做其他操作。但是确定一个像素属于前景还是背景却是一个病态的问题,这无疑给前景提取带来了巨大的挑战。
前景提取将图像归为3类:确定的前景、确定的背景和未知区域,未知区域中的像素既受到前景像素的影响,也受到背景像素的影响。所以,对于未知像素中一个像素p(x,y),其颜色可以表示为:
C=αF+(1-α)B
F表示(x,y)处前景的颜色,B表示(x,y)处背景的颜色。α可以理解为前景的透明度,取值范围0到1之间。该问题是已知1个方程,来求3个未知数。显而易见,这是一个病态的问题,不存在一个确定的解,这无疑给前景提取带来了巨大的挑战。
现在一般的解决方案有:
1、由用户先标记trimap图或stroke图,再通过概率、统计等方法来计算α、F和B,从而最终提取出前景。
2、先分割得到三分图或二分图再经过微调的到最终的matte。
随着数字图像的发展,使用抠图技术合成更有意义的图片吸引了越来越多的用户需求。随着多媒体、网络的快速发展,影视特效,表情包制作,视频聊天、网络直播、搞怪视频等各个领域对智能抠图的需求越来越强烈。但是如何让计算机自动得将人物精准得提取出来,一直是当前待解决的难题。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种基于注意力模型的头肩部分图像分割方法及装置。
为了解决以上技术问题,本发明采用的技术方案是:一种基于注意力模型的头肩部分图像分割方法,包括以下步骤:
步骤一、获取用于训练的图片数据集,并对图片进行标注;
步骤二、对训练样本进行数据拓充,得到的数据集;
步骤三、设计神经网络结构,将步骤二得到的数据集作为训练样本,进行网络训练;
步骤四、待测试的图片进行人脸区域检测,得到二维图谱;并将原图以及得到的二维图谱输入步骤三训练后的网络模型进行前向计算,通过端到端的提取方式将待测试图片中的头肩部分图像分割出来,得到分割结果图。
进一步地,上述图像分割方法,还包括以下步骤:步骤五、对步骤四得到的分割结果图运用导向滤波对细节进行优化。
进一步地,所述步骤一中的标注的方法为:手动勾勒人物边缘,得到三分图;将原图和三分图两张图作为输入,使用KNN算法得到其蒙版图;同时,对原图的人脸区域进行定位,将头部区域赋值为1,其他区域赋值为0,存储为灰度图像。
进一步地,步骤二中的数据拓充方法为:对已经标注好的图片进行背景切换;和对已经标注好的图片进行变化光照、增加遮挡以及添加噪声。
进一步地,步骤三中的神经网络为轻量级分割网络,在网络中以人物的脸部关键信息为注意力进行网络模型建模,所述神经网络包括6个依次级联的卷积网络基本单元,每个单元由依次连接的卷积层、局部响应归一化层、修正线性激活层、卷积层之间的残差连接、反卷积层和裁剪层组成。
进一步地,步骤五具体为,利用原图对分割结果进行滤波处理。通过原图G对网络得到的二类分割结果图P进行滤波处理,使得最后的输出图像大体上与目标图像P相似,即二分类黑白图像,但是纹理部分与引导图G相似的分割结果图,即细化出边缘纹理,使得分割边缘的细节信息更加清晰。
本发明的内容还保留一种头肩部分图像分割装置,其特征在于,包括:
一个或多个计算机可读介质,其上具有多个模块、源图像储存库、目标图像储存库;
处理单元,其可操作地耦合到计算机可读介质,所述处理单元适于执行包括以下所述的模块:
图像输入模块,用于输入原始图像;
人脸识别模块,用于对待测试的图片进行人脸区域检测,得到二维图谱;
图像分割模块,用于基于训练好的神经网络对原始图像和二维图谱进行处理,以得到各个像素是头肩部分的分割结果图。
进一步地,神经网络的训练方法为:获取用于训练的图片数据集,并对图片进行标注;对训练样本进行数据拓充;设计神经网络结构,将拓充后的数据集作为训练样本,进行网络训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科视拓(北京)科技有限公司,未经中科视拓(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711375814.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:地电位带电作业玻璃绝缘子R销拔销器
- 下一篇:插拔式绝缘操作杆