[发明专利]在基于3维模型的编码系统中产生唇部活动参数的方法及装置无效
申请号: | 97122076.X | 申请日: | 1997-12-22 |
公开(公告)号: | CN1167276C | 公开(公告)日: | 2004-09-15 |
发明(设计)人: | 李敏燮 | 申请(专利权)人: | 株式会社大宇电子 |
主分类号: | H04N7/30 | 分类号: | H04N7/30;G06T17/00 |
代理公司: | 永新专利商标代理有限公司 | 代理人: | 韩宏 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 在基于3维模型的编码系统中,首先,通过将一3维唇部模型匹配至单独个人的基本唇部而生成根据该单独个人的特征化的3维唇部模型。接着,将其转换成一2维唇部模型并根据实际唇部图象而进行转动,如果该人正在讲话,则根据一识别出的音节而被重构。最后,计算该2维唇部模型与该实际唇部图象之间的差别。由于只传送该所述差别而非整个实际唇部图象,传输数据量可被减少。 | ||
搜索关键词: | 基于 模型 编码 系统 产生 唇部 活动 参数 方法 装置 | ||
【主权项】:
1、一种用于在基于3维模型的编码系统中通过使用声音信号及图象信号产生唇部活动参数的方法,其中每个唇部活动参数是一实际唇部模型与一变换后的2维唇部模型之间的差别,该实际唇部图象是一被显示的一人连续变化的唇部图象,该方法包括有步骤:(a)根据该人的一基本唇部的位置从该人的基本脸部图象来提供该人的基本唇部图象,并根据该人的该基本唇部图象修改一通用的3维唇部模型以提供一特征化的3维唇部模型,其中该基本脸部图象是该人的无表情且沉默的正面脸部图象;(b)从该人的声音信号中识别出音节,并在该音节的沿一时间轴和一频率轴的活动量大于一预定阈值时提供一第一选择信号,并在该音节的活动量开始低于该预定阈值时提供一第二选择信号;(c)从这些图象信号中抽取该人的实际唇部图象;(d)给出一根据一转动角度和该音节的一重构的2维唇部模型,其中该转动角度是通过比较该实际唇部图象和由该特征化的3维唇部模型转换得到的一特征化的2维唇部模型来计算的;及(e)将该唇部活动参数、声音信号和转动角度发送给一解码器,其中该唇部移动参数是根据该实际唇部图象和该重构的2维唇部模型之间的移动量来计算的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社大宇电子,未经株式会社大宇电子许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/97122076.X/,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法
- 下一篇:带有运动预测段的图像编码