[发明专利]基于虚拟人脸表情进行视频通话的方法及装置有效
申请号: | 201711262683.8 | 申请日: | 2017-12-04 |
公开(公告)号: | CN107911644B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 吕庆祥 | 申请(专利权)人: | 吕庆祥 |
主分类号: | H04N7/14 | 分类号: | H04N7/14;H04N21/4788;G06T13/00 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 朱健;陈国军 |
地址: | 252000 山东省聊*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 虚拟 表情 进行 视频 通话 方法 装置 | ||
本发明提供了一种基于虚拟人脸表情进行视频通话的方法及装置,其中,该方法包括:实时连续获取第一用户基于通话终端发送的第一视频帧数据和与第一视频帧数据相对应的第一音频数据,第一视频帧数据包括第一用户的第一人脸特征值;选择虚拟人脸模型,并根据第一视频帧数据生成与虚拟人脸模型相对应的虚拟人脸表情;实时连续播放虚拟人脸表情,同时解码并播放相对应的第一音频数据。该方法中的视频通话的另一方只需要提供包含人脸特征值的数据即可,之后本地的终端根据该人脸特征值以及虚拟人脸模型重新生成只包含另一侧用户表情信息的虚拟人脸表情,从而可以避免另一侧用户的信息泄露,保证信息安全,可以提高隐私性。
技术领域
本发明涉及视频通话技术领域,特别涉及一种基于虚拟人脸表情进行视频通话的方法及装置。
背景技术
目前,用户在进行视频通话时,一般选择计算机、手机、或者其他的有摄像头的电子设备,通过互联网传输上述电子设备采集的视频信号,进而实现视频通话。具体的,视频通话的双方均使用电子设备的前置摄像头来捕捉人脸或者物体的信息,并通过电子设备的听筒来获取声音信息,从而实现视频通话。
发明人在实现发明创造的过程中,发现现有方案至少存在以下缺陷:
现有的视频通话方式会使用原始的视频图像以及用户的原始声音,隐私性较差;同时,原始的视频图像所需较大的存储空间,在传输原始的视频图像时会占用过高的传输带宽,在网络信号不强、信道状况不好的情况下视频通信效果较差。
发明内容
本发明提供一种基于虚拟人脸表情进行视频通话的方法及装置,用以解决现有视频通话隐私性较差的缺陷。
本发明实施例提供的一种基于虚拟人脸表情进行视频通话的方法,包括:
实时连续获取第一用户基于通话终端发送的第一视频帧数据和与所述第一视频帧数据相对应的第一音频数据,所述第一视频帧数据包括所述第一用户的第一人脸特征值;
选择虚拟人脸模型,并根据所述第一视频帧数据生成与所述虚拟人脸模型相对应的虚拟人脸表情;
实时连续播放所述虚拟人脸表情,同时解码并播放相对应的所述第一音频数据。
在一种可能的实现方式中,所述根据所述第一视频帧数据生成与所述虚拟人脸模型相对应的虚拟人脸表情包括:
根据所述第一视频帧数据确定所述第一用户的人脸特征点的位置坐标,并确定所述第一用户的人脸特征点之间的相对位置;
根据所述第一用户的人脸特征点之间的相对位置调整所述虚拟人脸模型的人脸特征点的位置,并将调整后的虚拟人脸模型作为与所述第一视频帧数据相对应的虚拟人脸表情。
在一种可能的实现方式中,所述确定所述第一用户的人脸特征点之间的相对位置包括:
对所述人脸特征点进行分组,并确定每组中的关键人脸特征点;
分别确定每组中相邻的人脸特征点之间的相对位置,并确定不同组的关键人脸特征点之间的相对位置。
在一种可能的实现方式中,该方法还包括:
实时采集第二用户的人脸图像和原始声音数据;
根据所述人脸图像确定所述第二用户的第二人脸特征值,生成第二视频帧数据,并根据所述原始声音数据确定与所述第二视频帧数据相对应的第二音频数据;
将所述第二视频帧数据和所述第二音频数据发送至所述第一用户的通话终端。
在一种可能的实现方式中,所述第一音频数据为经过变声处理的音频数据;
所述根据所述原始声音数据确定与所述第二视频帧数据相对应的第二音频数据包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吕庆祥,未经吕庆祥许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711262683.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:密炼机加料门密封结构
- 下一篇:一种压延机调距部装置