[发明专利]视频识别方法和装置有效
申请号: | 201810359754.4 | 申请日: | 2018-04-20 |
公开(公告)号: | CN108520078B | 公开(公告)日: | 2020-03-20 |
发明(设计)人: | 王知践;钱胜 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/71;G06F16/783 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 张臻贤;王珺 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 识别 方法 装置 | ||
本发明实施例提出一种视频识别方法和装置。该方法包括:从目标视频中提取目标音频;从目标音频中提取第一音频特征;查询索引库中是否存在与第一音频特征匹配的第二音频特征,所述索引库中包括各音频特征与其所属的视频的索引关系;如果查询到与第一音频特征匹配的第二音频特征,则获取第二音频特征所属的候选视频。本发明实施例根据索引库中各音频特征与其所属的视频的索引关系,能够根据目标视频的音频特征查找匹配的候选视频,从而有利于识别出于目标视频相似的视频,以便于后续对重复视频进行去除、筛选等处理。
技术领域
本发明涉及视频技术领域,尤其涉及一种视频识别方法和装置。
背景技术
采用feed(馈送)流可以将广告等插入要发布的信息中同时发布。在feed流的视频中,有很多非原创的重复视频。
去除重复视频的方式可以是,通过对视频进行图像识别,以检索是否有重复的视频。但图像识别的方式,需要比对的视频的帧图像数据量大,识别效率低,不能很好的处理掉重复视频。
发明内容
本发明实施例提供一种视频识别装置,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种视频识别方法,其特征在于,包括:
从目标视频中提取目标音频;
从目标音频中提取第一音频特征;
查询索引库中是否存在与第一音频特征匹配的第二音频特征,所述索引库中包括各音频特征与其所属的视频的索引关系;
如果查询到与第一音频特征匹配的第二音频特征,则获取第二音频特征所属的候选视频。
结合第一方面,本发明实施例在第一方面的第一种实现方式中,还包括:
根据目标视频包括的各音频特征与候选视频包括的各音频特征,比较候选视频与目标视频是否相似。
结合第一方面的第一种实现方式,本发明实施例在第一方面的第二种实现方式中,根据目标视频包括的各音频特征与候选视频包括的各音频特征,比较候选视频与目标视频是否相似,包括:
如果候选视频与目标视频的相同音频特征在目标视频的音频特征中所占的比例大于设定阈值,则确定候选视频与目标视频相似。
结合第一方面,本发明实施例在第一方面的第三种实现方式中,查询索引库中是否存在与第一音频特征匹配的第二音频特征,包括:
向各服务器分发查询请求,所述查询请求中包括第一音频特征,所述查询请求用于指示各所述服务器在自身保存的索引库中查询是否存在与第一音频特征匹配的第二音频特征;
接收各服务器返回的查询结果,所述查询结果中包括与第一音频特征匹配的第二音频特征。
结合第一方面或第一方面的任意一种实现方式中,本发明实施例在第一方面的第四种实现方式中,还包括:
从各样本视频中提取样本音频;
从各样本音频中提取样本音频特征;
在各服务器的索引库中,分布式地保存各样本视频与各样本音频特征之间的索引关系。
第二方面,本发明实施例提供了一种视频识别装置,包括:
第一音频提取模块,用于从目标视频中提取目标音频;
第一特征提取模块,用于从目标音频中提取第一音频特征;
特征查询模块,用于查询索引库中是否存在与第一音频特征匹配的第二音频特征,所述索引库中包括各音频特征与其所属的视频的索引关系;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810359754.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种避免重复下载的方法和装置
- 下一篇:一种Migo搜索引擎