[发明专利]用于处理视频的方法和装置在审
申请号: | 201910084731.1 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109815365A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 李伟健;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06F16/73 | 分类号: | G06F16/73;G06K9/00;G06K9/62 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 类别信息 标注 视频 方法和装置 概率 集合 队列建立 机器识别 人工标注 视频存储 视频分类 视频输入 预先建立 预设 队列 终端 注视 | ||
本公开的实施例公开了用于处理视频的方法和装置。该方法的一具体实施方式包括:获取待标注视频;将待标注视频输入预先训练的视频分类模型,得到类别信息集合和类别信息对应的概率值,其中,类别信息用于表征待标注视频所属的类别;从类别信息集合中选择类别信息,其中,所选择的类别信息对应的概率值大于等于预设的概率阈值;对于所选择的类别信息中的类别信息,将待标注视频存储到与该类别信息预先建立对应关系的标注队列中,以使待标注视频发送到预先与标注队列建立对应关系的标注终端。该实施方式实现了将机器识别和人工标注相结合,有助于提高对视频进行标注的准确性和效率。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于处理视频的方法和装置。
背景技术
随着互联网技术的发展,越来越多的视频出现在互联网中。为了便于对这些视频进行管理,可以使用视频分类模型,对视频进行类型识别。为了训练视频分类模型,通常需要对大量的样本视频进行标注,以区分样本视频的类型。目前主要由人工对视频进行标注。
发明内容
本公开的实施例提出了用于处理视频的方法和装置。
第一方面,本公开的实施例提供了一种用于处理视频的方法,该方法包括:获取待标注视频;将待标注视频输入预先训练的视频分类模型,得到类别信息集合和类别信息对应的概率值,其中,类别信息用于表征待标注视频所属的类别;从类别信息集合中选择类别信息,其中,所选择的类别信息对应的概率值大于等于预设的概率阈值;对于所选择的类别信息中的类别信息,将待标注视频存储到与该类别信息预先建立对应关系的标注队列中,以使待标注视频发送到预先与标注队列建立对应关系的标注终端。
在一些实施例中,从类别信息集合中选择类别信息,包括:响应于确定类别信息集合包括的、对应的概率值大于等于预设的概率阈值的类别信息的数量大于预设数量,从对应的概率值大于等于预设的概率阈值的类别信息中选择预设数量个类别信息。
在一些实施例中,从类别信息集合中选择类别信息,包括:响应于确定类别信息集合包括的、对应的概率值大于等于预设的概率阈值的类别信息的数量小于等于预设数量,选择对应的概率值大于等于预设的概率阈值的类别信息。
在一些实施例中,视频分类模型预先按照如下步骤训练得到:获取训练样本集合,其中,训练样本包括样本视频、预先对样本视频进行标注的样本类别信息集合;利用机器学习方法,将训练样本集合中的训练样本包括的样本视频作为输入,将与输入的样本视频对应的样本类别信息集合作为期望输出,训练得到视频分类模型。
在一些实施例中,视频分类模型为多标签分类模型。
在一些实施例中,在对于所选择的类别信息中的类别信息,将待标注视频存储到与该类别信息预先建立对应关系的标注队列中,以使待标注视频发送到预先与标注队列建立对应关系的标注终端之后,该方法还包括:获取标注后视频集合,其中,标注后视频是由标注终端对接收的待标注视频进行类别信息标注后得到的视频;利用机器学习方法,将标注后视频集合中的标注后视频作为视频分类模型的输入,将与输入的标注后视频对应的类别信息集合作为视频分类模型的期望输出,训练得到更新后的视频分类模型。
第二方面,本公开的实施例提供了一种用于处理视频的装置,该装置包括:第一获取单元,被配置成获取待标注视频;分类单元,被配置成将待标注视频输入预先训练的视频分类模型,得到类别信息集合和类别信息对应的概率值,其中,类别信息用于表征待标注视频所属的类别;选择单元,被配置成从类别信息集合中选择类别信息,其中,所选择的类别信息对应的概率值大于等于预设的概率阈值;存储单元,被配置成对于所选择的类别信息中的类别信息,将待标注视频存储到与该类别信息预先建立对应关系的标注队列中,以使待标注视频发送到预先与标注队列建立对应关系的标注终端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910084731.1/2.html,转载请声明来源钻瓜专利网。