[发明专利]图像处理方法、装置和电子设备有效
申请号: | 202010096887.4 | 申请日: | 2020-02-17 |
公开(公告)号: | CN111277912B | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 彭哲;鲍冠伯;刘玉强;贾磊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | H04N21/81 | 分类号: | H04N21/81 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 电子设备 | ||
本申请公开了图像处理方法、装置和电子设备,涉及图像处理技术领域。具体实现方案为:获取第一合成音频;将所述第一合成音频输入至预测模型中,获得预测唇形索引;所述预测模型的训练样本包括第二合成音频,以及与所述第二合成音频对应的唇形索引,所述唇形索引根据对发音对象的唇部采集的唇形图像获得;根据所述预测唇形索引,获得目标唇形图像;将所述目标唇形图像,投影到预获取的目标面部上,获得合成面部图像。由于根据预测模型可获取到与第一合成音频对应的预测唇形索引,并进一步的根据预测唇形索引获得目标唇形图像,使得合成的合成面部图像的唇形与第一合成音频的匹配度更高,提高了真人虚拟形象的合成效果。
技术领域
本申请涉及计算机技术领域中的图像处理技术,尤其涉及一种图像处理方法、装置和电子设备。
背景技术
真人虚拟形象合成技术是指根据给定的文本或者语音合成一段真人形象的合成视频,合成的虚拟形象的唇形动作与输入声音或文本匹配,可以应用到直播解说、智能客服以及应对突发的新闻事件的播报等需要人物形象的场景里。
目前,合成的真人虚拟形象的唇动与声音的匹配度较差,导致真人虚拟形象的合成效果较差。
发明内容
本申请实施例提供一种图像处理方法、装置和电子设备,以解决现有真人虚拟形象的合成效果较差的问题。
为解决上述技术问题,本申请是这样实现的:
本申请第一方面提供一种图像处理方法,包括:
获取第一合成音频;
将所述第一合成音频输入至预测模型中,获得预测唇形索引;所述预测模型的训练样本包括第二合成音频,以及与所述第二合成音频对应的唇形索引,所述唇形索引根据对发音对象的唇部采集的唇形图像获得;
根据所述预测唇形索引,获得目标唇形图像;
将所述目标唇形图像,投影到预获取的目标面部上,获得合成面部图像。
进一步的,所述根据所述预测唇形索引,获得目标唇形图像,包括:
根据所述预测唇形索引,获取所述唇形图像中与所述预测唇形索引匹配的第一候选唇形图像;
根据所述第一候选唇形图像,获得所述目标唇形图像。
进一步的,所述将所述目标唇形图像,投影到预获取的目标面部上,获得合成面部图像,包括:
将所述目标唇形图像与预获取的所述发音对象的下巴图像进行拼接,获得合成下巴图像;
提取所述合成下巴图像的第一特征点,以及所述目标面部下巴图像的第二特征点;
对所述合成下巴图像进行调整,使得所述第一特征点与所述第二特征点之间的误差小于第一预设阈值;
将调整后的所述合成下巴图像投影到所述目标面部上,获得合成面部图像。
进一步的,所述预测模型获取过程包括:
获取所述预设时间段内的原始语音;
获取与所述原始语音对应的文本;
根据所述文本获取所述第二合成音频;
获取所述预设时间段内对所述发音对象的唇部采集的唇形图像;
对所述第二合成音频按照音素进行切分,获取所述唇形图像中与所述音素对应的第二候选唇形图像;
对所述第二候选唇形图像的唇形索引进行超采样插值,使得所述第二合成音频的每一帧语音对应一个唇形索引;
将所述第二合成音频的每一帧语音,以及所述语音对应的唇形索引作为训练样本,对基础模型进行训练,获得所述预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010096887.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多晶硅薄膜的制备方法及系统
- 下一篇:一种视频的播放控制方法、装置及计算设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序