[发明专利]实时动态嘴唇跟踪方法无效

专利信息
申请号: 201010571128.5 申请日: 2010-12-03
公开(公告)号: CN102013103A 公开(公告)日: 2011-04-13
发明(设计)人: 王士林;李建华;刘功申;李翔;李生红 申请(专利权)人: 上海交通大学
主分类号: G06T7/20 分类号: G06T7/20;G06K9/62
代理公司: 上海交达专利事务所 31201 代理人: 王锡麟;王桂忠
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实时 动态 嘴唇 跟踪 方法
【说明书】:

技术领域

发明涉及的是一种图像处理和模式识别技术领域的方法,特别是一种实时动态嘴唇跟踪方法。

背景技术

近年来,自动化语音识别技术(Automatic speech recognition,ASR)取得了长足的进步,并形成了一系列较为成熟的产品,能够在信噪比较高的环境下得到较好的识别效果。然而,这些系统的性能往往受制于背景噪声的程度,在重噪声环境下,如车内、工厂、机场等等,这些系统所取得的效果常常不能令人满意。于是,越来越多的学者从音频以外的信源寻求提高语音识别效果的方法。McGurk效应(the McGurk effect)揭示了说话人讲述过程中声/视觉信息之间存在着密不可分的内在联系。因此,人们想到通过引入嘴唇运动这一视觉信息,辅助完成对于讲述内容的理解,该类语音识别系统称为自动化唇读系统。在上述系统中,首要并且最为关键的一个步骤是准确、快速地从视频中获取嘴唇运动变化情况,即实时嘴唇跟踪方法。其准确性和可靠性往往直接决定了一个唇读系统的性能优劣。

经过对现有技术文献的检索发现,A.Caplier在第11届国际图像分析和处理大会(Proceedings of 11th International Conference on Image Analysis and Processing,page 8-13)上发表的“嘴唇区域检测和跟踪”(Lip detection and tracking),该文采用亮度边缘强度为检测嘴唇轮廓的标准,通过迭代的方法将嘴唇边缘收敛至最强边缘处。同时在合理嘴唇模型的限定下,保证了最终得到嘴唇模型的合理性。该技术的不足在于:第一,这是一种针对灰度(亮度)图像的嘴唇跟踪技术,由于缺乏色度信息,受光照情况影响较大;第二,该技术是依据嘴唇图像的亮度边缘,而边缘信息取决于图像的对比度,并且未化妆的嘴唇图像往往是低对比度的,造成边缘信息的不稳定。基于以上两点,该技术的准确性和鲁棒性都有待提高。

发明内容

本发明的目的在于克服现有技术的不足,提出一种实时动态嘴唇跟踪方法,使其实现对于讲话人嘴唇运动的获取和跟踪,在获取较高匹配准确率的同时,保证实时的处理速度。

本发明通过以下技术方案实现的:

本发明包括如下步骤:

步骤一,通过数码摄像机拍摄并获取包含嘴唇区域在内的图像序列。由于常用数码摄像机采集的颜色空间为RGB颜色空间,而该空间并非符合人眼色差视觉的均匀色彩空间。因此,需要将其转化为CIE-LAB均匀色彩空间,具体如下:

XYZ=0.4900.3100.2000.1770.8130.0110.0000.0100.990RGB]]>

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010571128.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top