[发明专利]一种虚拟形象的生成方法和装置在审
申请号: | 202310479043.1 | 申请日: | 2023-04-28 |
公开(公告)号: | CN116524086A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 王茜莺;郑爱国;张晓平 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06T13/40 | 分类号: | G06T13/40;G06T1/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘翠香 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 虚拟 形象 生成 方法 装置 | ||
本申请公开了一种虚拟形象的生成方法和装置,包括:启动目标应用;调用图像采集装置和音频采集装置;基于所述图像采集装置实时采集的至少两帧第一图像信息和所述音频采集装置实时采集的第一音频信息构建目标模型;将所述图像采集装置实时采集的至少两帧第二图像信息输入所述目标模型,生成目标虚拟形象,所述目标虚拟形象对应于人体的至少部分区域,所述第二图像信息的采集时刻晚于所述第一图像信息的采集时刻;通过所述目标应用输出所述目标虚拟形象。
技术领域
本申请涉及信息技术领域,更具体的说,是涉及一种虚拟形象的生成方法和装置。
背景技术
在会议系统中,用户希望能够使用会议数字人分身来解决一些不方便的场景下进行会议的问题,该分身以真人视频作为模型,以语音驱动视频人物进行唇部和表情变化。
但是,由于数字人分身和真人相似度极高,因此会存在安全隐私风险。
发明内容
有鉴于此,本申请提供了一种虚拟形象的生成方法和装置,如下:
一种虚拟形象的生成方法,包括:
启动目标应用;
调用图像采集装置和音频采集装置;
基于所述图像采集装置实时采集的至少两帧第一图像信息和所述音频采集装置实时采集的第一音频信息构建目标模型;
将所述图像采集装置实时采集的至少两帧第二图像信息输入所述目标模型,生成目标虚拟形象,所述目标虚拟形象对应于人体的至少部分区域,所述第二图像信息的采集时刻晚于所述第一图像信息的采集时刻;
通过所述目标应用输出所述目标虚拟形象。
可选的,上述的方法,所述通过所述目标应用输出所述目标虚拟形象,包括:
通过所述目标应用的图像输出界面输出所述目标虚拟形象;
获得所述音频采集装置实时采集的第二音频信息;
基于所述第二音频信息驱动所述目标虚拟形象,且通过所述目标应用调用的音频输出装置输出所述第二音频信息。
可选的,上述的方法,所述基于所述第二音频信息驱动所述目标虚拟形象,包括:
基于所述第二音频信息驱动所述目标虚拟形象中目标区域,所述目标区域对应于人体的嘴部。
可选的,上述的方法,所述通过所述目标应用输出所述目标虚拟形象之后,还包括:
获得所述图像采集装置实时采集的至少两帧第三图像信息以及所述音频采集装置实时采集的第二音频信息;
基于至少两帧所述第三图像信息中第一区域的目标内容以及所述第二音频信息中对应音频内容,调整所述目标虚拟形象中目标区域的显示方式,所述目标内容与所述目标区域对应。
可选的,上述的方法,所述获得所述音频采集装置实时采集的第二音频信息之后,还包括:
基于所述第二音频信息与目标模型中的音频特征信息匹配,确定所述第二音频信息对应的采集对象满足第一预设条件,执行所述基于所述第二音频信息驱动所述目标虚拟形象步骤,所述目标模型中的音频特征信息基于所述第一音频信息确定。
可选的,上述的方法,还包括:
基于所述第二音频信息与目标模型中的音频特征信息不匹配,确定所述第二音频信息对应的采集对象不满足第一预设条件,禁止基于所述第二音频信息驱动所述目标虚拟形象。
可选的,上述的方法,所述调用图像采集装置以及音频采集装置之后,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310479043.1/2.html,转载请声明来源钻瓜专利网。