[发明专利]视频处理方法、装置、终端设备及存储介质在审

申请号：	201910511183.6	申请日：	2019-06-13
公开（公告）号：	CN110400251A	公开（公告）日：	2019-11-01
发明（设计）人：	马凯;杨国基	申请（专利权）人：	深圳追一科技有限公司
主分类号：	G06T3/00	分类号：	G06T3/00;G06T13/20;G06T13/80;G06N20/00;G06F16/332;G06F16/33
代理公司：	深圳市智圈知识产权代理事务所(普通合伙) 44351	代理人：	苗燕
地址：	518057 广东省深圳市粤海街***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请公开了一种视频处理方法、装置、终端设备及存储介质，该方法包括：获取用户输入的交互信息；对交互信息进行识别，获取与交互信息对应的特定音频信息；将特定音频信息输入至第一机器学习模型，获得与特定音频信息对应的面部特征点；将面部特征点输入至第二机器学习模型，获得与面部特征点对应的模拟人脸图像；将预设视频中的预设人脸图像替换为模拟人脸图像，并获得替换人脸图像后的包含模拟人脸图像的答复视频；输出针对交互信息的答复视频，答复视频中包含特定音频信息。本申请可以在用户与机器人对话时，针对用户的对话内容，提供模拟真人的答复视频，实现多模态交互，可适用于企业级应用，提供客服型机器人，优化客服体验。
搜索关键词：	交互信息音频信息视频面部特征模拟人脸答复机器学习模型存储介质人脸图像视频处理终端设备图像客服预设机器人替换多模态交互企业级应用对话内容申请输出对话优化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种视频处理方法，其特征在于，所述方法包括：获取用户输入的交互信息；对所述交互信息进行识别，获取与所述交互信息对应的特定音频信息；将所述特定音频信息输入至第一机器学习模型，获得与所述特定音频信息对应的面部特征点；将所述面部特征点输入至第二机器学习模型，获得与所述面部特征点对应的模拟人脸图像，所述第二机器学习模型为生成对抗网络模型，所述模拟人脸图像为二维人脸图像；将预设视频中的预设人脸图像替换为所述模拟人脸图像，并获得替换人脸图像后的包含所述模拟人脸图像的答复视频，所述预设人脸图像为二维人脸图像，所述将预设视频中的预设人脸图像替换为所述模拟人脸图像为基于二维图像处理的图像替换；输出针对所述交互信息的所述答复视频，所述答复视频中包含所述特定音频信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳追一科技有限公司，未经深圳追一科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910511183.6/，转载请声明来源钻瓜专利网。

上一篇：基于AI的智能图像预处理方法及系统
下一篇：料场等高线数字化方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T3-00 在图像平面内的图形图像转换，例如，从位像到位像地建立一个不同图像
G06T3-20 .整个或部分图形的线性转换，如面位显示
G06T3-40 .整个或部分图形的定标
G06T3-60 .整个或部分图形的旋转

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]视频处理方法、装置、终端设备及存储介质在审

专利文献下载