[发明专利]视频处理方法及装置、神经网络的训练方法及装置有效
申请号: | 202111296799.X | 申请日: | 2021-11-04 |
公开(公告)号: | CN113723385B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 陈奕名;王麒铭;栾鹏龙;兰永亮;贾兆柱 | 申请(专利权)人: | 新东方教育科技集团有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/40;G06V10/44;G06V10/75;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 彭久云 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 处理 方法 装置 神经网络 训练 | ||
1.一种视频处理方法,包括:
获取至少一个帧图像和音频片段,其中,每个帧图像包括至少一个对象,每个对象包括面部区域;
对所述至少一个帧图像进行预处理,得到所述面部区域的嘴部特征信息;
基于所述嘴部特征信息和所述音频片段,使用视频处理网络对所述至少一个帧图像进行处理,得到目标视频,
其中,所述目标视频中的对象具有与所述音频片段同步的嘴型变化,所述嘴部特征信息至少用于向所述视频处理网络提供所述每个对象的面部区域和嘴部的基本轮廓,以及所述每个对象的所述面部区域和所述嘴部的位置关系,
其中,对所述至少一个帧图像进行预处理,得到所述面部区域的嘴部特征信息,包括:
利用嘴部模糊模型对所述每个帧图像中的对象的嘴部进行模糊处理,得到所述每个帧图像对应的嘴部模糊图片,其中,所述嘴部模糊图片包括执行所述模糊处理的模糊区域和所述帧图像中未执行所述模糊处理的非模糊区域,所述嘴部特征信息包括所述至少一个帧图像分别对应的至少一个嘴部模糊图片。
2.根据权利要求1所述的视频处理方法,其中,利用嘴部模糊模型对所述每个帧图像中的对象的嘴部进行模糊处理,得到所述每个帧图像对应的嘴部模糊图片,包括:
对所述帧图像进行第一色彩空间转换,得到第一转换图像;
提取所述第一转换图像中的嘴部区域,对所述嘴部区域进行第一滤波处理,得到所述帧图像对应的嘴部模糊图片。
3.根据权利要求1所述的视频处理方法,其中,利用嘴部模糊模型对所述每个帧图像中的对象的嘴部进行模糊处理,得到所述每个帧图像对应的嘴部模糊图片,包括:
对所述帧图像进行第一色彩空间转换,得到第一转换图像;
提取所述第一转换图像中的嘴部区域,对所述嘴部区域进行第一滤波处理,得到第一中间模糊图像;
对所述帧图像进行第二色彩空间转换,得到第二转换图像;
提取所述第二转换图像中的皮肤区域,从所述皮肤区域中选择包括嘴部的预设区域;
对所述预设区域进行第二滤波处理,得到第二中间模糊图像;
对所述第一中间模糊图像和所述第二中间模糊图像进行合成处理,得到所述帧图像对应的嘴部模糊图片。
4.根据权利要求3所述的视频处理方法,其中,所述第一色彩空间为HSI色彩空间,所述第二色彩空间为YCbCr色彩空间。
5.根据权利要求1所述的视频处理方法,其中,对所述至少一个帧图像进行预处理,得到所述面部区域的嘴部特征信息,还包括:
对所述至少一个嘴部模糊图片进行梯度特征提取,得到每个嘴部模糊图片对应的梯度特征图,其中,所述嘴部特征信息还包括所述至少一个嘴部模糊图片分别对应的至少一个梯度特征图。
6.根据权利要求5所述的视频处理方法,其中,对所述至少一个嘴部模糊图片进行梯度特征提取,得到每个嘴部模糊图片对应的梯度特征图,包括:
获取所述每个嘴部模糊图片对应的灰度图;
获取第一卷积核和第二卷积核,其中,所述第一卷积核的尺寸小于所述第二卷积核的尺寸,所述第一卷积核中的所有元素之和为0,所述第二卷积核中的所有元素之和为0;
将所述灰度图与所述第一卷积核和所述第二卷积核进行卷积处理,得到所述每个嘴部模糊图片对应的梯度图。
7.根据权利要求1所述的视频处理方法,其中,对所述至少一个帧图像进行预处理,得到所述面部区域的嘴部特征信息,还包括:
利用面部关键点检测模型对所述每个帧图像进行处理,得到多个面部关键点;
提取所述多个面部关键点中与嘴部相关的多个嘴部关键点,其中,所述嘴部特征信息还包括所述多个嘴部关键点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新东方教育科技集团有限公司,未经新东方教育科技集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111296799.X/1.html,转载请声明来源钻瓜专利网。