[发明专利]一种视频通话处理方法、系统、电子设备及存储介质有效
申请号: | 202210987630.7 | 申请日: | 2022-08-17 |
公开(公告)号: | CN115376188B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 肖冠正 | 申请(专利权)人: | 天翼爱音乐文化科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/40;G06T3/40;G06V10/25;G06V10/26;G06V10/82;G06N3/08;G06N3/082;G06N3/0464 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 郑宏谋 |
地址: | 510060 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 通话 处理 方法 系统 电子设备 存储 介质 | ||
1.一种视频通话处理方法,其特征在于,所述方法包括:
获取待处理通话视频;
对所述待处理通话视频进行人脸检测处理,确定裁剪视频;
对所述裁剪视频进行数据预处理,确定预处理数组;
将所述预处理数组输入预先训练的人脸超分辨率模型进行超分辨率处理,确定超分辨率通话视频。
2.根据权利要求1所述的方法,其特征在于,所述对所述待处理通话视频进行人脸检测处理,确定裁剪视频,包括:
根据人脸检测算法对所述待处理通话视频进行人脸检测处理,确定人脸区域;
对所述人脸区域进行裁剪处理,确定裁剪视频。
3.根据权利要求1所述的方法,其特征在于,所述对所述裁剪视频进行数据预处理,确定预处理数组,包括:
对所述裁剪视频进行逐帧解码处理,确定解码数据;
对所述解码数据进行数据转换处理,确定预处理数组。
4.根据权利要求1所述的方法,其特征在于,所述人脸超分辨率模型包括生成器模型和鉴别器模型,所述鉴别器模型包括全局图像鉴别器、眼睛区域鉴别器和嘴巴区域鉴别器。
5.根据权利要求4所述的方法,其特征在于,所述生成器模型包括普通卷积层、深度可分离卷积层、残差相加层和子像素卷积层。
6.根据权利要求4所述的方法,其特征在于,在所述将所述预处理数组输入预先训练的人脸超分辨率模型进行超分辨率处理,确定超分辨率通话视频之前,所述方法还包括预先训练所述人脸超分辨率模型,具体包括:
获取训练数据集;
将所述训练数据集输入到所述生成器模型,确定生成数据;
将所述生成数据输入到所述鉴别器模型,确定鉴别结果;
根据所述鉴别结果对所述人脸超分辨率模型的参数进行更新。
7.根据权利要求6所述的方法,其特征在于,在所述根据所述鉴别结果对所述人脸超分辨率模型的参数进行更新之后,所述方法还包括:
对更新后的所述人脸超分辨率模型进行剪枝处理,确定剪枝模型;
对所述剪枝模型进行二次训练处理,确定训练模型;
对所述训练模型进行量化处理,确定所述人脸超分辨率模型。
8.一种视频通话处理系统,其特征在于,所述系统包括:
第一模块,用于获取待处理通话视频;
第二模型,用于对所述待处理通话视频进行人脸检测处理,确定裁剪视频;
第三模型,用于对所述裁剪视频进行数据预处理,确定预处理数组;
第四模型,用于将所述预处理数组输入预先训练的人脸超分辨率模型进行超分辨率处理,确定超分辨率通话视频。
9.一种电子设备,其特征在于,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现如权利要求1至7任一项所述的方法的步骤。
10.一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1至7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼爱音乐文化科技有限公司,未经天翼爱音乐文化科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210987630.7/1.html,转载请声明来源钻瓜专利网。