[发明专利]语音驱动头部图像合成影音文件的方法有效
申请号: | 200510093269.X | 申请日: | 2005-08-23 |
公开(公告)号: | CN1731833A | 公开(公告)日: | 2006-02-08 |
发明(设计)人: | 孙丹;王维国 | 申请(专利权)人: | 孙丹;王维国 |
主分类号: | H04N5/265 | 分类号: | H04N5/265 |
代理公司: | 北京连和连知识产权代理有限公司 | 代理人: | 王昕 |
地址: | 100044北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种语音驱动头部图像合成影音文件的方法。它包括取静态头部数码图像;提取头部、脸部及五官轮廓特征点数据坐标,并计算图像动画模式数据;生成包括口形闭合帧、口形张开帧、表情帧以及三种类型图像帧的各自数目在内的图像特征数据文件;采集语音数码信息;分析、提取语音特征数据,生成包括有声音语音帧和无声音语音帧在内的语音特征数据文件;将图像特征数据文件和语音特征数据文件同步合成,使得有声音语音帧对应口形张开帧,无声音语音帧对应口形闭合帧,然后输出。本发明具有图像逼真、可实现人脸及动物脸部表情的动画,制作方便简单,便于推广使用等特点。 | ||
搜索关键词: | 语音 驱动 头部 图像 合成 影音文件 方法 | ||
【主权项】:
1.一种语音驱动头部图像合成影音文件的方法,其特征是包括下列步骤:步骤1、取静态头部数码图像;步骤2、提取头部、脸部及五官轮廓特征点数据坐标,并计算图像动画模式数据,用以确定口形闭合帧帧数、口形张开帧帧数以及表情帧帧数;步骤3、生成包括口形闭合帧、口形张开帧、表情帧以及三种类型图像帧的各自数目在内的图像特征数据文件;步骤4、采集语音数码信息;步骤5、分析语音数码信息,提取语音特征数据;步骤6、生成包括有声音语音帧和无声音语音帧在内的语音特征数据文件;步骤7、上述图像特征数据文件和语音特征数据文件同步合成,使得有声音语音帧对应口形张开帧,无声音语音帧对应口形闭合帧,然后输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于孙丹;王维国,未经孙丹;王维国许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510093269.X/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序