[发明专利]一种确定视频哈希有效长度的方法在审
申请号: | 201510385250.6 | 申请日: | 2015-06-30 |
公开(公告)号: | CN104933182A | 公开(公告)日: | 2015-09-23 |
发明(设计)人: | 李静 | 申请(专利权)人: | 山东管理学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南瑞宸知识产权代理有限公司 37268 | 代理人: | 徐健 |
地址: | 250100 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种确定视频哈希有效长度的方法。该方法能够在大数据集的环境中,仅通过部分数据的训练就能确定全部数据集中近似最佳的哈希长度,为哈希长度的确定提供了一种更快捷且参考依据的方式。实验结果表明本发明所确定的哈希码长是可信的。 | ||
搜索关键词: | 一种 确定 视频 希有 长度 方法 | ||
【主权项】:
1.一种确定视频哈希有效长度的方法,包括以下步骤:1)从视频库的每类中随机选取数量相同的部分视频作为训练样本,然后将训练样本的特征映射为一定长度的哈希比特:假设训练集中包含a类视频,每类视频包括一种原始视频和另外b种经过不同处理的视频,对所有视频做相同的特征提取得到F,F=[f10 ,f11 ,...,f1b ,..,fa0 ,fa1 ,...,fab ]′,fij 表示第i类视频中经过第j种处理的视频对应的特征,fi0 表示第i类视频的原始视频的特征,然后将特征映射成r长度的哈希H(r) , 各个不同长度的哈希组成H,H=[H(1) ,H(2) ,...,H(L) ]′,其中 表示第i类视频中经过第j种处理的视频对应r长度的哈希;2)对于一定长度r=rm 的哈希 进行如下操作:2-1)对于训练样本,将每一类中原始视频得到的哈希与其余所有类的所有视频对应的哈希进行匹配,通过设定阈值T来判断其余视频是否为原视频的拷贝视频;如果原视频哈希与其余视频哈希之间不同位数的比例小于这个阈值T,即误码率小于阈值T,则认为该视频为拷贝视频,反之,不是拷贝视频;2-2)分别计算拷贝视频的误码率和非拷贝视频的误码率,然后分别估计出拷贝视频的误码率概率分布和非拷贝视频的误码率概率分布;2-3)采用函数f1 (x)对所述拷贝视频的误码率概率分布进行拟合,采用函数f2 (x)对所述非拷贝视频的误码率概率分布进行拟合,x表示误码率;2-4)根据上述两个拟合函数,利用f1 (x)=f2 (x),求出二者的交点坐标x0 ;同时,将拷贝视频误码率曲线和非拷贝视频误码率曲线的交叉区域的面积,称作碰撞概率,计算出一定哈希长度rm 对应的碰撞概率p(rm );3)对于不同长度r对应的哈希H(r) 都进行上述步骤2)的操作,得到不同哈希长度r对应的碰撞概率p(r),通过统计分析得到训练集中的碰撞概率p(r)与哈希长度r的关系,选取碰撞概率收敛时所对应的哈希长度rtrain 作为哈希的最佳长度;最后,根据总数据集与训练数据集在数量级上的差别,Nall 表示总数据集的数量,Ntrain 表示训练集的数量,根据差别的二进制表示,可以通过增加一定长度的比特位来确定总数据集上的最佳哈希长度rall , 其中符号 表示向上取整函数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东管理学院,未经山东管理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510385250.6/,转载请声明来源钻瓜专利网。