[发明专利]一种云存储环境下基于音频字的盗版视频检测方法与系统有效
申请号: | 201810258659.5 | 申请日: | 2018-03-27 |
公开(公告)号: | CN108447501B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 段桂华;滕明英;王琰;张振宇 | 申请(专利权)人: | 中南大学 |
主分类号: | G10L25/24 | 分类号: | G10L25/24;G10L25/45;H04N21/233;H04N21/81;H04N21/854;G06K9/62 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 龚燕妮 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存储 环境 基于 音频 盗版 视频 检测 方法 系统 | ||
本发明公开了一种云存储环境下基于音频字的盗版检测方法和系统,通过多维聚类构建的音频字典,对版权资源分割后的短时音频段进行特征提取,音频段转换为可以表征音频内容的音频字序列后,建立倒排索引。检索时,将用户提交的查询转换为音频字后直接定位候选段落,并根据候选段落与查询的内容相似度与阈值的关系确定视频是否为盗版。充分利用了音频特征在传统音视频媒体文件中的稳定性,以及静默片段等特征,检测结果高效而准确,以极低的本地计算成本和较少的网络带宽,较容易的为正版资源提供了一种版权鉴定保护方案。
技术领域
本发明属于版权检测领域,特别涉及一种云存储环境下基于音频字的盗版视频检测方法与系统。
背景技术
云计算时代,当云存储和各类UGC(User Generated Content)视频网站服务商的兴起,多媒体信息呈现爆炸式增长。数字音视频具有传播速度快、覆盖范围广、盗版成本低等特点,这都对数字版权形成了巨大的挑战。我们常常可以看到,一部影片,在不同视频网站的版本各不相同,甚至在同一网站,能搜索到一部影片的多个版本,通过而这些所谓的“山寨”版本,大多是由个人或团体从各种渠道获得的正版或盗版片源,经过翻录等手段获得盗版的视频副本,再使用私人账号将其上传到视频网站而来。这些盗版视频,严重地侵犯了视频制作方和发行方的合法权利与利益,对多媒体产业的发展以及社会价值取向的形成具有不良影响。
面对这种情况,目前主流网站多在用户上传视频后、视频发布前,预先通过机器检测或人工审核等方式对视频内容进行预先审核,在视频发布后接受用户举报,查实后删除违规视频并视情节对账号进行封号处理。网站平台的数据流量大且时效性高,目前的机器检测大多采用图像识别技术,这项技术漏判、误判的情况时有发生。而且对海量视频帧进行画面识别导致处理效率相对低下,如果发布者通过降低清晰度、加快或放慢视频播放速度等方式,对图像识别进行干扰,进一步降低图像识别的准确度。人工审核的准确度很高,但耗费的审核时间相当长。举报封删的方法是建立在观众举报的基础之上的,观众可能出于各种原因并不举报违规视频,同时审核举报信息也会耗费一定时间。举报封删是一种事后补救措施,即便删除违规视频能阻止进一步扩散,但其已造成的负面影响是难以消除的。
由于目前盗版检测的方式还存在上诉缺点,因此有必要设计一种新的云存储环境下的盗版检测方案,能够满足以下要求:(i)准确性。不仅可以检测出翻录的视频,对经过噪声和变速处理的视频也应该起到较为准确的检测作用。(ii)低成本。更少的数据存储空间和I/O开销。(iii)实时性。检测速度应该满足网站的高实时性要求。
发明内容
本发明提供了一种云存储环境下基于音频字的盗版视频检测方法与系统,其目的在于,克服现有技术中盗版资源人工审核周期长或图像识别准确度较低的问题。
一种云存储环境下基于音频字的盗版视频检测方法,包括以下步骤:
步骤1:提取音效,并进行音频字标记;
提取各种视频中的音轨,从音轨中提取各种常见音效,对所提取的不同音效依次进行标号,获得每种音效的音频字;
步骤2:提取各音频帧超向量;
先提取每帧音频的多维特征,并对多维特征分别进行归一化处理,构建音频帧的超向量;
所述每帧音频的多维特征包括宏观声学特征、时域特征、频域特征以及倒谱特征,所述音效超向量是指对音频多维特征分别进行归一化处理后得到的特征形成的一维向量;
其中,宏观声学特征包括音调、音高、带宽,时域特征包括短时能量、短时平均幅度、短时平均过零率、短时自相关系数,频域特征包括谱能量、子带能量比、谱质心、谱带宽、谱密度,倒谱特征包括Delta倒谱系数、LPC倒谱系数、梅尔倒谱系数;
步骤3:构建音频字典;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810258659.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音增强的方法与装置
- 下一篇:一种基于语音信息的备忘方法及终端