[发明专利]一种低质量视频识别方法及装置有效
申请号: | 201811532655.8 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109684513B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 胡军;陈英傑;吴桂林 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/73;G06K9/00;G06K9/66 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 质量 视频 识别 方法 装置 | ||
本发明公开了一种低质量视频识别方法及装置,获取用户反馈的负反馈日志集,基于从负反馈日志集获取低质量视频标签数据中的包含的各个视频ID,从视频特征库中筛选对每个视频ID对应的低质量视频特征,并从视频特征库中除了作为低质量视频特征以外的视频特征信息随机选取非低质量视频特征,将筛选出的低质量视频特征和随机抽取的非低质量视频特征作为训练样本,以低质量视频特征对应的视频标签ID和非低质量视频特征对应的视频标签ID为样本标签进行训练得到低质量视频识别模型,以进行低质量视频识别。本发明采用负反馈日志的方式来对低质量视频进行标注,实现了以低成本获取海量的标签数据,节约了人工标注的时间和人力成本。
技术领域
本发明涉及视频识别技术领域,更具体的说,涉及一种低质量视频识别方法及装置。
背景技术
在视频搜索和视频推荐等场景中,如何对低质量视频,比如,低俗视频、色情视频、视频图像质量不高、不相关视频等进行识别,以便为用户提供高质量视频成为了一项非常重要的工作。
现有识别低质量视频的一种方法为:提取视频的特征信息,然后采用启发式方法进行识别,缺点为对低质量视频识别的效果不佳;因此,现有技术又提供了另一种低质量视频识别方法,具体为:人工标注大量的低质量视频,基于人工标注的低质量视频构建训练数据集,采用机器学习方法进行识别。虽然该方法提高了对低质量视频的识别效果,但是,人工标注需要制定严格的标注标准,且需要耗费大量的人力对低质量视频进行标注,同时还存在着标注人员与用户对视频质量高低反馈不一致的情况。
发明内容
有鉴于此,本发明公开一种低质量视频识别方法及装置,以采用负反馈日志的方式来对低质量视频进行标注,实现以低成本获取海量高质量的标签数据,不仅节约了人工标注的时间成本和人力成本,而且,还有效避免了标注人员与用户对视频质量高低反馈不一致的情况,同时,还提高了低质量视频识别模型的识别精度。
一种低质量视频识别方法,包括:
获取预设时间段内,用户对低质量视频的反馈的负反馈日志集,所述负反馈日志集包括多个负反馈日志,每个所述负反馈日志包括:用户ID、视频ID和视频标签ID,所述视频标签ID所属的标签类型对应一个或多个投诉原因;
基于从所述负反馈日志集中获取的低质量视频标签数据中的各个视频ID,从预先建立的视频特征库中,筛选出每个视频ID对应的视频特征作为低质量视频特征;
从所述视频特征库中除了作为所述低质量视频特征以外的视频特征信息中,随机抽取预设数量的视频ID对应的视频特征作为非低质量视频特征;
将筛选出的所述低质量视频特征和随机抽取的所述非低质量视频特征作为训练样本,以所述低质量视频特征对应的视频标签ID和所述非低质量视频特征对应的视频标签ID作为样本标签进行训练得到低质量视频识别模型;
基于所述低质量视频识别模型进行低质量视频识别。
可选的,从所述负反馈日志集中获取所述低质量视频标签数据的过程包括:
将预设时间段内同一用户ID的负反馈日志进行汇总;
判断是否存在同一用户ID在所述预设时间段内的投诉次数大于第一设定阈值;
将投诉次数大于所述第一设定阈值的用户ID对应的视频标签ID进行滤除;
将所述预设时间段内同一视频ID对应的视频标签ID的数量进行汇总,得到同一视频ID的被投诉次数;
将被投诉次数不大于第二设定阈值的视频ID及其对应的视频标签ID进行滤除,保留被投诉次数大于所述第二设定阈值的视频ID及其对应的视频标签ID;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811532655.8/2.html,转载请声明来源钻瓜专利网。