[发明专利]实时动态嘴唇跟踪方法无效
申请号: | 201010571128.5 | 申请日: | 2010-12-03 |
公开(公告)号: | CN102013103A | 公开(公告)日: | 2011-04-13 |
发明(设计)人: | 王士林;李建华;刘功申;李翔;李生红 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06T7/20 | 分类号: | G06T7/20;G06K9/62 |
代理公司: | 上海交达专利事务所 31201 | 代理人: | 王锡麟;王桂忠 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实时 动态 嘴唇 跟踪 方法 | ||
技术领域
本发明涉及的是一种图像处理和模式识别技术领域的方法,特别是一种实时动态嘴唇跟踪方法。
背景技术
近年来,自动化语音识别技术(Automatic speech recognition,ASR)取得了长足的进步,并形成了一系列较为成熟的产品,能够在信噪比较高的环境下得到较好的识别效果。然而,这些系统的性能往往受制于背景噪声的程度,在重噪声环境下,如车内、工厂、机场等等,这些系统所取得的效果常常不能令人满意。于是,越来越多的学者从音频以外的信源寻求提高语音识别效果的方法。McGurk效应(the McGurk effect)揭示了说话人讲述过程中声/视觉信息之间存在着密不可分的内在联系。因此,人们想到通过引入嘴唇运动这一视觉信息,辅助完成对于讲述内容的理解,该类语音识别系统称为自动化唇读系统。在上述系统中,首要并且最为关键的一个步骤是准确、快速地从视频中获取嘴唇运动变化情况,即实时嘴唇跟踪方法。其准确性和可靠性往往直接决定了一个唇读系统的性能优劣。
经过对现有技术文献的检索发现,A.Caplier在第11届国际图像分析和处理大会(Proceedings of 11th International Conference on Image Analysis and Processing,page 8-13)上发表的“嘴唇区域检测和跟踪”(Lip detection and tracking),该文采用亮度边缘强度为检测嘴唇轮廓的标准,通过迭代的方法将嘴唇边缘收敛至最强边缘处。同时在合理嘴唇模型的限定下,保证了最终得到嘴唇模型的合理性。该技术的不足在于:第一,这是一种针对灰度(亮度)图像的嘴唇跟踪技术,由于缺乏色度信息,受光照情况影响较大;第二,该技术是依据嘴唇图像的亮度边缘,而边缘信息取决于图像的对比度,并且未化妆的嘴唇图像往往是低对比度的,造成边缘信息的不稳定。基于以上两点,该技术的准确性和鲁棒性都有待提高。
发明内容
本发明的目的在于克服现有技术的不足,提出一种实时动态嘴唇跟踪方法,使其实现对于讲话人嘴唇运动的获取和跟踪,在获取较高匹配准确率的同时,保证实时的处理速度。
本发明通过以下技术方案实现的:
本发明包括如下步骤:
步骤一,通过数码摄像机拍摄并获取包含嘴唇区域在内的图像序列。由于常用数码摄像机采集的颜色空间为RGB颜色空间,而该空间并非符合人眼色差视觉的均匀色彩空间。因此,需要将其转化为CIE-LAB均匀色彩空间,具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010571128.5/2.html,转载请声明来源钻瓜专利网。