[发明专利]用于生成场景识别模型的方法和装置有效
申请号: | 201910204897.2 | 申请日: | 2019-03-18 |
公开(公告)号: | CN109919244B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 李伟健;姜轩;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
代理公司: | 北京天达共和律师事务所 11798 | 代理人: | 刘璠;胡剑炜 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 场景 识别 模型 方法 装置 | ||
本公开的实施例公开了用于生成场景识别模型的方法和装置。该方法的一具体实施方式包括:获取样本集合,样本集合中的样本具有标注信息,该标注信息用于表征该样本不属于预设的至少一个场景类别中的任何场景类别,或者用于表征该样本所属的至少一个场景类别中的场景类别;通过将样本集合中的样本作为模型的输入,并将样本的标注信息作为模型的期望输出,来调整模型的参数。该实施方式有助于使用场景识别模型提高场景识别的准确性。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于生成场景识别模型的方法和装置。
背景技术
场景识别是一种用计算机实现人的视觉功能的技术,它的目的是使计算机能够对图像或视频进行处理,自动识别图像或视频中的场景。随着深度学习的发展,使用深度学习方法训练场景识别模型,以解决场景识别问题已越来越普遍。目前,训练场景识别模型的方法,通常使用大量的图像或视频作为训练样本,对图像或视频表征的场景的类别进行标注,从而训练得到场景识别模型。
发明内容
本公开的实施例提出了用于生成场景识别模型的方法和装置,以及用于识别视频的方法和装置。
第一方面,本公开的实施例提供了一种用于生成场景识别模型的方法,该方法包括:获取样本集合,样本集合中的样本具有标注信息,该标注信息用于表征该样本不属于预设的至少一个场景类别中的任何场景类别,或者用于表征该样本所属的至少一个场景类别中的场景类别;通过将样本集合中的样本作为模型的输入,并将样本的标注信息作为模型的期望输出,来调整模型的参数。
在一些实施例中,模型用于识别输入模型的待分类视频所属的场景类别,模型包括特征提取层、第一分类器、第二分类器,特征提取层用于提取待分类视频的视频特征数据,第一分类器用于确定待分类视频是否属于场景视频,第二分类器用于响应于确定待分类视频属于场景视频,确定待分类视频所属的场景类别。
在一些实施例中,样本集合包括视频样本集合;以及通过将样本集合中的样本作为模型的输入,并将样本的标注信息作为模型的期望输出,来调整模型的参数所,包括:从视频样本集合中选择视频样本;将所选择的视频样本输入特征提取层,以得到视频特征数据;基于所选择的视频样本的标注信息,确定所选择的视频样本是否属于至少一个场景类别包括的场景类别;响应于确定属于,通过将视频特征数据作为第一分类器的输入,并将表征所选择的视频样本属于所述至少一个场景类别之一的指示信息作为第一分类器的期望输出,以及通过将视频特征数据作为第二分类器的输入,并将所选择的视频样本的标注信息作为第二分类器的期望输出,来调整模型的参数;响应于确定不属于,通过将视频特征数据作为第一分类器的输入,并将所选择的视频样本的标注信息作为第一分类器的期望输出,来调整模型的参数。
在一些实施例中,样本集合中的样本的标注信息由具有预设数目的元素的向量来表示,预设数目的元素中的元素对应于多个预设场景类别中的场景类别。
第二方面,本公开的实施例提供了一种用于识别视频的方法,该方法包括:获取目标视频;将目标视频输入预先训练的场景识别模型,得到场景识别结果,其中,场景识别模型为根据上述第一方面中任一实施例描述的方法生成的,场景识别结果用于表征目标视频是否属于场景视频,以及在目标视频属于场景视频的情况下,场景识别结果还用于表征目标视频所属的场景类别。
在一些实施例中,该方法还包括:将目标视频和场景识别结果关联存储。
在一些实施例中,该方法还包括:获取目标用户的视频需求信息;响应于确定视频需求信息与场景识别结果匹配,将目标视频发送至目标用户的终端。
第三方面,本公开的实施例提供了一种用于生成场景识别模型的装置,该装置包括:样本获取单元,被配置成获取样本集合,样本集合中的样本具有标注信息,该标注信息用于表征该样本不属于预设的至少一个场景类别中的任何场景类别,或者用于表征该样本所属的至少一个场景类别中的场景类别;调整单元,被配置成通过将样本集合中的样本作为模型的输入,并将样本的标注信息作为模型的期望输出,来调整模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910204897.2/2.html,转载请声明来源钻瓜专利网。