[发明专利]一种基于GPU实现的媒资特征识别的系统及方法无效
申请号: | 200910193297.7 | 申请日: | 2009-10-26 |
公开(公告)号: | CN101706870A | 公开(公告)日: | 2010-05-12 |
发明(设计)人: | 王召福;罗笑南;许晓伟 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510006 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gpu 实现 特征 识别 系统 方法 | ||
技术领域
本发明涉及计算机网络技术领域,特别涉及一种基于GPU实现的媒资特征识别的系统及方法。
背景技术
目前,媒体特征识别对于互联网上各类媒资的管理十分重要。媒体特征识别从数据处理的层面来考虑,可以分为:像素级处理、特征级处理和目标级处理三个层次,视频图像中的特征识别是目标级的图像处理,是对任意一系列播放画面产生的视频目标进行特征抽取和比对。由于目标信息具有数据复杂性,通常是利用相关知识进行抽象,然后根据抽象的特征进行推理,得到对特征相似性的结论。
PCA即主成分分析,是视频特征抽象的常用方法,但线型变换的收缩较慢,线性判别分析(LDA),是基于样本的类别进行整体特征提取的有效方法,在模式识别中也有着广泛的应用。
可编程图形处理器(Programmable Graphic Process Unit,GPU)是目前计算机上普遍采用的图形图像处理专用器件,具有单指令流多数据流(SIMD)的并行处理特性,而且提供了完全支持向量操作指令和符合IEEE32位浮点格式的顶点处理能力和像素处理能力,已经成为了一个强大的并行计算单元。
发明内容
本发明提供一种基于GPU实现的媒资特征识别的系统及方法,能够更好的实现媒资特征识别。
本发明提供一种基于GPU实现的媒资特征识别的系统:
该系统包括播放端和服务器端,播放端包括图像处理模块、特征抽取模块、移动检测模块、色调检测模块、特征描述模块;
所述图像处理模块负责在媒体播放过程中截取画面,把画面信息存储在临时处理区,图像截取不影响媒体资源的正常播放;
所述特征抽取模块采用高斯变换的方法,负责对图像截取模块的内容进行矩形特征化抽象;
所述移动检测模块根据相临图像的变化情况,对画面之间的运动进行概化,形成运动特征表述;
所述色调检测模块根据特征图像的色调变化情况,对画面的色调特征进行概化,形成色调特征表述;
所述特征描述模块综合所述图像特征抽取模块、移动检测模块和色调检测模块的计算结果,综合形成媒资的特征描述串,并负责联系媒资特征识别的服务器端;
服务器端包括样品库投射模块、特征库管理模块和神经网络推理模块;
所述样品库投射模块,对标准媒资文件的播放特征进行特征投射,其处理过程在高性能服务器上进行;
所述特征库管理模块,对海量媒资文件的特征进行管理,采用GPU并行加速计算的方法,采用哈希表散列的管理方法;
所述神经网络推理模块,将客户端上传的特征描述串模糊匹配样本特征库中的样本信息。
本发明提供一种基于GPU实现的媒资特征识别的方法,包括:
播放端的图像处理模块在媒体播放过程中截取画面,把画面信息存储在临时处理区,图像截取不影响媒体资源的正常播放;
播放端的特征抽取模块采用高斯变换的方法,对图像截取模块的内容进行矩形特征化抽象;
播放端的移动检测模块根据相临图像的变化情况,对画面之间的运动进行概化,形成运动特征表述;
播放端的色调检测模块根据特征图像的色调变化情况,对画面的色调特征进行概化,形成色调特征表述;
播放端的特征描述模块综合所述图像特征抽取模块、移动检测模块和色调检测模块的计算结果,综合形成媒资的特征描述串,并负责联系媒资特征识别的服务器端;
服务器端的样品库投射模块,对标准媒资文件的播放特征进行特征投射,其处理过程在高性能服务器上进行;
服务器端的特征库管理模块,对海量媒资文件的特征进行管理,采用GPU并行加速计算的方法,采用哈希表散列的管理方法;
服务器端的神经网络推理模块,将客户端上传的特征描述串模糊匹配样本特征库中的样本信息。
本发明的有益效果主要体现如下:
1、采用播放平台与媒资管理平台相结合的方法,实现分布式的媒资播放统计的管理。
在互联网中,有多个格式的同一媒资源在播放是非常常见的,通过最直接的画面特征抽取的方法来管理媒资播放情况的统计是最准确的方法。
2、采用GPU加速,降低对正常播放过程的影响。
本发明在媒体播放端采用GPU加速的方法来处理视频特征的抽取计算,降低对正常播放过程的影响。
3、结合画面特征、运动特征和色调特征,采用神经网络的方法进行模糊匹配,可以提高媒资匹配的准确度。
本发明在媒体播放10秒钟的情况下即可95%以上的媒体识别准确率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910193297.7/2.html,转载请声明来源钻瓜专利网。