[发明专利]基于动态基元选取的语音驱动三维人脸动画方法无效

申请号：	200510086646.7	申请日：	2005-10-20
公开（公告）号：	CN1952850A	公开（公告）日：	2007-04-25
发明（设计）人：	陶建华;尹潘嵘	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G06F3/00	分类号：	G06F3/00
代理公司：	中科专利商标代理有限责任公司	代理人：	段成云
地址：	100080北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于动态基元选取的语音驱动人脸动画方法，将输入的任何用户的任何语言的语音转换成语音和三维人脸动画的同步输出。此方法基于采用运动实时捕获系统建立的多模态数据库，对多模态数据进行音视频分析，分别获得相应的特征向量；以音素为基元单位对多模态数据进行同步分割；对用户给定的语音序列，计算每个基元的音频匹配误差和前后基元间的视觉匹配误差，最后在候选的基元中动态地选择一条最佳路径，输出与语音序列同步的人脸动画参数序列，以驱动三维人脸动画模型。本发明的方法，使得系统输出的动画序列保持较好的真实度和自然度，并适用于多用户和多语言的语音驱动。
搜索关键词：	基于动态选取语音驱动三维动画方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于动态基元选取的语音驱动人脸动画方法，其特征是：使用运动实时捕获设备，建立多模态数据库；同时运用语音分析、运动分析技术提取语音视频特征；以音素为基元单位对多模态数据进行同步分割；对用户给定的语音序列，计算每个基元的音频匹配误差和前后基元间的视觉匹配误差，最后在候选的基元中动态地选择一条最佳路径，输出与语音序列同步的人脸动画参数序列，以驱动三维人脸动画模型，将输入的任何用户的任何语言的语音转换成语音和三维人脸动画的同步输出，包括步骤：A.采用运动实时捕获系统创建多模态数据库；B.对多模态数据进行音视频分析，分别获得相应的特征向量；C.以音素为基元单位对多模态数据进行同步分割；D.采用动态基元选取方法，输出与用户输入语音同步的人脸动画参数序列。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所，未经中国科学院自动化研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200510086646.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F3-00 用于将所要处理的数据转变成为计算机能够处理的形式的输入装置；用于将数据从处理机传送到输出设备的输出装置，例如，接口装置
G06F3-01 .用于用户和计算机之间交互的输入装置或输入和输出组合装置
G06F3-05 .在规定的时间间隔上，利用模拟量取样的数字输入
G06F3-06 .来自记录载体的数字输入，或者到记录载体上去的数字输出
G06F3-09 .到打字机上去的数字输出
G06F3-12 .到打印装置上去的数字输出

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于动态基元选取的语音驱动三维人脸动画方法无效

专利文献下载