[发明专利]基于协同过滤算法的实时语音驱动人脸唇部同步动画系统无效

申请号：	201010263097.7	申请日：	2010-08-25
公开（公告）号：	CN101930619A	公开（公告）日：	2010-12-29
发明（设计）人：	陶建华;穆凯辉;车建峰	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G06T13/00	分类号：	G06T13/00;G10L19/00;G10L15/28;H04N7/26
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	梁爱荣
地址：	100080 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明是基于协同过滤算法的实时语音驱动人脸唇部同步动画系统，通过实时录入语音，使得人物头部模型做出与输入语音同步的唇部动画。系统包含有音视频编码模块，该模块对采集到的语音和人脸三维特征点运动信息分别进行Mel频率倒谱参数编码和“动态图像专家组”(MPEG-4)标准中的人脸动画参数编码，由音视频编码模块得到Mel频率倒谱参数和人脸动画参数多模态同步库；协同过滤模块使用协同过滤算法，由新输入语音的Mel频率倒谱参数编码结合Mel频率倒谱参数和人脸动画参数多模态同步库求出与语音同步的人脸动画参数；动画模块由人脸动画参数驱动人脸模型进行动画。本发明系统有较好的真实感，实时性以及更广泛的应用环境。
搜索关键词：	基于协同过滤算法实时语音驱动唇部同步动画系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于协同过滤算法的实时语音驱动人脸唇部同步动画系统，其特征在于包括音视频编码模块、协同过滤模块和人脸动画模块，其中：利用数字录音设备，实时地接收输入的语音信号，并实时地输出与语音同步的人脸唇部动画，在生成多模态同步库时不需要手工标注，可任意输入男女语音进行语音驱动的唇部动画；在离线过程中，首先利用多模态数据采集设备同步地采集录制说话人在说话中语音和人脸三维特征点运动信息；音视频编码模块的输入端接收来自多模态数据采集设备采集到的语音和人脸三维特征点运动信息，对其中的语音信息和人脸三维特征点运动信息分别进行Mel频率倒谱参数(MFCC)编码和人脸动画参数(FAP)编码；在实时过程中，音视频编码模块的输入端接收来自数字录音设备实时录制的语音信息；音视频编码模块具有一输出端，在离线过程中输出MFCC FAP多模态同步库；在实时过程中输出语音的Mel频率倒谱参数；协同过滤模块与音视频编码模块连接，协同过滤模块输入端接收来自于音频编码模块生成的Mel频率倒谱参数、音视频编码模块生成Mel频率倒谱参数和人脸动画参数多模态同步库中的多模态数据；协同过滤模块具有一输出端输出使用协同过滤算法实时生成与输入语音同步的人脸动画参数；人脸动画模块与协同过滤模块连接，人脸动画模块输入端接收来自于协同过滤模块生成的人脸动画参数，将这些人脸动画参数转化成人脸模型的运动信息；人脸动画模块具有一输出端输出人脸动画参数，并由人脸动画参数驱动二维或三维人脸模型进行人脸唇部动画。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所，未经中国科学院自动化研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201010263097.7/，转载请声明来源钻瓜专利网。

上一篇：防刺探取款机键盘
下一篇：基于变形垂足曲线的人脸轮廓提取方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T13-00 动画制作
G06T13-20 .3D［三维］动画
G06T13-80 .2D［二维］动画，如使用精灵sprites
G06T13-40 ..关于角色的，例如：人类、动物或虚幻人物
G06T13-60 ..关于自然景观的，例如：雨、雪、水或植物

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于协同过滤算法的实时语音驱动人脸唇部同步动画系统无效

专利文献下载