[发明专利]数据处理方法、装置、介质和计算设备在审
申请号: | 201811342316.3 | 申请日: | 2018-11-12 |
公开(公告)号: | CN109492127A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 向博仁;许盛辉;刘彦东 | 申请(专利权)人: | 网易传媒科技(北京)有限公司 |
主分类号: | G06F16/71 | 分类号: | G06F16/71;G06F16/73 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕雁葭 |
地址: | 100084 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引 倒排索引 视频数据 帧数据 视频 计算设备 数据处理 数据处理装置 快速查找 视频查找 计算量 视频帧 | ||
本发明实施方式提供了一种数据处理方法,包括:获取视频数据;对所述视频数据中的帧数据进行处理,得到所述帧数据对应的特征值,其中,所述特征值能够表征对应的帧数据;获取倒排索引,所述倒排索引中包括多个索引特征值,每个索引特征值对应至少一个具有该索引特征值的其他视频数据;基于所述倒排索引,确定第一索引特征值对应的相似视频数据,其中,所述第一索引特征值为与所述特征值中的特定特征值相同的索引特征值。本发明的方法可以通过倒排索引在其他视频中确定与当前视频具有相同视频帧的相似视频,从而显著地降低了相似视频查找的计算量,实现了快速查找相似视频的效果。此外,本发明实施方式还提供了一种数据处理装置、计算设备和介质。
技术领域
本发明的实施方式涉及计算机技术领域,更具体地,本发明的实施方式涉及一种数据处理方法、装置、介质和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着科学技术的快速发展,越来越多地视频软件应用于生活和工作等诸多场景。例如,随着视频分享、视频直播、视频点播、视频推荐等网络视频服务的兴起和发展,越来越多的用户将自己拍摄或者编辑的视频上传到视频网站上用以分享。然而,由于网络上的视频内容很容易被复制或编辑,导致视频网站上会出现大量的由不同用户上传的相同或相似的视频。因此,如何有效地对网站上的视频进行管理,对上传的视频进行有效筛选以剔除相同或相似的视频成为亟待解决的问题。
目前,已经出现一些全局特征检索或者局部特征检索的视频筛选方法,例如,先通过颜色直方图、累计直方图或者sift特征等方法获取视频帧特征,然后基于全部帧特征或者关键帧对应的帧特征构建正排索引,上传的视频可以依次与正排索引中的各个视频对应的帧特征进行相似度比较,从而实现视频筛选。
发明内容
但是,在现有技术中,获取帧特征的方法计算量普遍非常大,同时正排索引的构建异常麻烦,在正排索引中查找相似视频的计算量也十分大,无法实现快速查找。同时,在构建索引时,如果基于全部帧特征构建索引则需要极大的存储空间,如果基于关键帧特征构建索引则对关键帧选取的要求又很高,经常出现漏选关键帧或者关键帧错位等问题。
为此,非常需要一种改进的数据处理方法,以实现快速准确地视频查找。
在本上下文中,本发明的实施方式期望提供一种数据处理方法、装置、介质和计算设备。
在本发明实施方式的第一方面中,提供了一种数据处理方法,包括:获取视频数据,对所述视频数据中的帧数据进行处理,得到所述帧数据对应的特征值,其中,所述特征值能够表征对应的帧数据,获取倒排索引,所述倒排索引中包括多个索引特征值,每个索引特征值对应至少一个具有该索引特征值的其他视频数据,以及基于所述倒排索引,确定第一索引特征值对应的相似视频数据,其中,所述第一索引特征值为与所述特征值中的特定特征值相同的索引特征值。
在本发明的一个实施例中,上述对所述视频数据中的帧数据进行处理,得到所述帧数据对应的特征值,包括:对所述视频数据中的帧数据进行感知哈希计算,得到的哈希值作为所述帧数据对应的特征值。
在本发明的一个实施例中,上述方法还包括:根据预设规则对所述特征值进行采样处理,得到采样后的采样特征值,以及以所述采样特征值作为所述特征值中的特定特征值。
在本发明的一个实施例中,上述根据预设规则对所述特征值进行采样处理,包括:确定所述特征值对应的MD5值,对所述MD5值进行取余处理,满足第一结果的MD5值对应的特征值作为所述采样特征值。
在本发明的一个实施例中,上述方法还包括:确定所述相似视频数据中满足预设条件的视频作为备选视频,其中,所述满足预设条件包括所述相似视频数据对应的特征值与所述视频数据对应的特征值相同的数量大于预设阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易传媒科技(北京)有限公司,未经网易传媒科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811342316.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能交互方法及装置
- 下一篇:用于生成模型的方法和装置