[发明专利]一种视频或图像视点类型的识别方法有效
申请号: | 201310057656.2 | 申请日: | 2013-02-22 |
公开(公告)号: | CN103198294A | 公开(公告)日: | 2013-07-10 |
发明(设计)人: | 桂海田;刘礼丰 | 申请(专利权)人: | 广州市朗辰电子科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 杨晓松 |
地址: | 510663 广东省广州市科学*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 图像 视点 类型 识别 方法 | ||
技术领域
本发明涉及视频处理与识别研究领域,特别涉及一种视频或图像视点类型的识别方法。
背景技术
随着显示技术和数字多媒体技术的发展,人们越来越倾向于真实的视觉体验,立体显示技术被看作是下一代显示技术,立体显示是利用人的左右眼观看到的场景具有一定的视差而形成3D模型,进而感受到物体具有远近之分,像是真实的立体场景。目前3D显示器可以显示2个、8个、9个等各种视点视频的视频源,有些3D显示器甚至可以对2D/3D进行切换。视频种类多样,极大的丰富了3D世界,快速的推动3D显示技术的应用。
2D平面显示是现在视频的主流,对于3D显示器而言,兼容2D无疑是明智的选择,两视点即左右图格式视频源,包括各种偏振光形式,红蓝形式是目前各种3D显示器的主流视频格式,能较轻易的实现,用户只需要带着红蓝眼镜就能看到3D效果,但此类视频需要戴着眼镜,体验效果相对较差,也只能是从单一的角度看到立体效果,相对而言,8视点、9视点等格式的多视点技术是未来发展的主要方向,能在裸眼3D上展示出较好的效果,对于未来的立体显示设备,如果能够全部兼容2D、两视点、多视点则其应用范围将大大扩大。对此,如何能快速智能地识别各种视频源,从而做出相应的排图显示,无疑是非常重要的。
对此,目前的视频格式还没有形成统一的标准,因此视频格式的自动识别成了一个难题,已有的方法有通过加入额外的识别码进行识别等,但是由于不同视点的视频排图格式不同,同时不同公司的内部规则也不尽相同,因此效率较低,操作复杂,不能形成一个统一的标准。
因此,能够针对各视点不同的视频进行自动识别成为一个极具实际研究意义的课题。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种视频或图像视点类型的识别方法,该识别方法能够根据图像相似度和排图规则的不同对所有类型的2D/3D视频源的类型进行识别,识别效率高,准确性高。
本发明的目的通过以下的技术方案实现:一种视频或图像视点类型的识别方法,包括以下步骤:
(1)预先通过训练获得直方图相关性阈值、区域相似性特征值阈值;
(2)对于输入的视频或图像,根据排图规则提取出需要检测相似性的两个区域;
(3)对这两个区域先进行直方图相似性特征值提取,如果该特征值大于直方图相关性阈值,则说明两个区域相似,然后进入步骤(5);如果否,进入步骤(4);
(4)将这两个区域均对应分为若干块,两个区域对应的每一块之间进行宏块似然率提取,将两个区域中所有对应块的宏块似然率求平均作为区域相似性特征值,与区域相似性特征值阀值比较,如果小于阀值则判定此两个区域相似,否则判定是不相似,然后进入步骤(5);
(5)判断结束,重回步骤(2),继续根据排图规则提取出需要检测相似性的两个区域,直到判断出视频或图像的视点类型。
具体的,所述步骤(1)中,直方图相关性阈值、区域相似性特征值阈值均可以通过大量的实验或根据实际操作经验进行设定,但是为了尽量避免人为的参与,减少对操作人员的依赖性,可以采用如下的获取过程得到。
所述步骤(1)中,直方图相关性阈值的获取过程如下:
(1-1-1)建立训练数据库,训练数据库中包括相似图像组和非相似图像组,相似图像组为属于同一场景的不同视点的图像组,非相似图像组为不是同一场景的两个图像序列;初始化阈值K1、K2,K1>K2;
(1-1-2)对数据库中已知是否相似的两幅图像进行直方图相似性特征值提取,记为r2;如果训练用两幅图像为相似图像,且r2<K1,则将r2赋值给阈值K1,如果训练用两幅图像为非相似图像,且r2>K2,则将r2赋值给阈值K2;
(1-1-3)重复步骤(1-1-2),直到数据库中样本数据训练结束,得到最终的K1′和K2';
(1-1-4)对最后得到的阈值K1'和K2'之间的值进行训练,采用训练数据库中已知是否相似的两幅图像进行判断,判断准确率最高的值K即为单个训练最优阀值。
所述步骤(1)中,区域相似性特征值阈值的获取过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市朗辰电子科技有限公司,未经广州市朗辰电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310057656.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序