[发明专利]一种低质量视频识别方法及装置有效
申请号: | 201811532655.8 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109684513B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 胡军;陈英傑;吴桂林 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/73;G06K9/00;G06K9/66 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 质量 视频 识别 方法 装置 | ||
1.一种低质量视频识别方法,其特征在于,包括:
获取预设时间段内,用户对低质量视频的反馈的负反馈日志集,所述负反馈日志集包括多个负反馈日志,每个所述负反馈日志包括:用户ID、视频ID和视频标签ID,所述视频标签ID所属的标签类型对应一个或多个投诉原因;
基于从所述负反馈日志集中获取的低质量视频标签数据中的各个视频ID,从预先建立的视频特征库中,筛选出每个视频ID对应的视频特征作为低质量视频特征,所述视频特征库中存储有各个视频ID以及相对应的视频特征;
从所述视频特征库中除了作为所述低质量视频特征以外的视频特征信息中,随机抽取预设数量的视频ID对应的视频特征作为非低质量视频特征;
将筛选出的所述低质量视频特征和随机抽取的所述非低质量视频特征作为训练样本,以所述低质量视频特征对应的视频标签ID和所述非低质量视频特征对应的视频标签ID作为样本标签进行训练得到低质量视频识别模型;
基于所述低质量视频识别模型进行低质量视频识别,包括:针对待识别视频,获取所述待识别视频的视频特征,将所述视频特征作为输入信息输入至所述低质量视频识别模型进行低质量视频识别;其中,所述低质量视频识别模型用于输出视频标签ID,低质量视频特征对应的视频标签ID和所述非低质量视频特征对应的视频标签ID不同,低质量视频特征对应的视频标签ID为负反馈日志中包含的视频标签ID,非低质量视频特征对应的视频标签ID为预先定义的视频标签ID。
2.根据权利要求1所述的方法,其特征在于,从所述负反馈日志集中获取所述低质量视频标签数据的过程包括:
将预设时间段内同一用户ID的负反馈日志进行汇总;
判断是否存在同一用户ID在所述预设时间段内的投诉次数大于第一设定阈值;
将投诉次数大于所述第一设定阈值的用户ID对应的视频标签ID进行滤除;
将所述预设时间段内同一视频ID对应的视频标签ID的数量进行汇总,得到同一视频ID的被投诉次数;
将被投诉次数不大于第二设定阈值的视频ID及其对应的视频标签ID进行滤除,保留被投诉次数大于所述第二设定阈值的视频ID及其对应的视频标签ID;
基于被投诉次数大于所述第二设定阈值的视频ID及其对应的视频标签ID生成所述低质量视频标签数据,所述低质量视频标签数据的数据格式采用“视频ID;视频标签ID”,其中,每个视频标签ID包含的标签类型采用“,”分隔。
3.根据权利要求1所述的方法,其特征在于,所述视频特征库中存储的每个视频特征包括:
视频内容维度、缩略图维度、标题文本维度、视频上传者维度和用户反馈特征。
4.根据权利要求3所述的方法,其特征在于,
所述视频内容维度包括:视频清晰度、视频抖动、黑边、重复播放和语音清晰度;
所述标题文本维度包括:关键词个数和软色情特征;
所述视频上传者维度包括:上传视频总数、粉丝数和视频播放量;
所述用户反馈特征包括:视频播放完整度、播放退出率、留存得分、顶踩和评论特征。
5.根据权利要求1所述的方法,其特征在于,所述基于所述低质量视频识别模型进行低质量视频识别具体包括:
从待识别视频中提取出视频特征;
将提取出的视频特征作为输入信息输入至所述低质量视频识别模型,得到所述待识别视频的视频标签ID;
判断所述待识别视频的视频标签ID是否为低质量视频的视频标签ID;
如果是,则所述待识别视频为低质量视频;
如果否,则所述待识别视频为非低质量视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811532655.8/1.html,转载请声明来源钻瓜专利网。