[发明专利]用于生成模型的方法和装置有效
申请号: | 201810617804.4 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108805091B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 李伟健;王长虎 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 生成 模型 方法 装置 | ||
本申请实施例公开了用于生成模型的方法和装置。该方法的一具体实施方式包括:获取训练样本集合,以及将训练样本集合划分成预设数量个训练样本组,其中,训练样本包括样本视频和针对样本视频预先标注的样本识别结果,样本识别结果用于指示样本视频是否为对显示样本对象的屏幕进行拍摄所获得的视频;对于预设数量个训练样本组中的训练样本组,将该组训练样本中的训练样本的样本视频作为输入,将所输入的样本视频所对应的样本识别结果作为期望输出,利用机器学习方法训练得到该组训练样本所对应的初始视频识别模型;基于所得到的初始视频识别模型,生成视频识别模型。通过该实施方式能够得到一种可以用于识别视频的模型,且丰富了模型的生成方式。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及用于生成模型的方法和装置。
背景技术
目前,通过拍摄视频实现信息分享已经成为人们生活中重要的信息分享模式。实践中,有不少用户为了将其他用户拍摄获得的视频作为其个人拍摄获得的视频,会对其他用户拍摄获得的视频进行录制。
可以理解的是,录制其他用户的视频往往会带来侵权、有损公平性等不良影响,因此,用于进行信息分享的平台可以对该类视频进行识别,进而对其进行拦截。
发明内容
本申请实施例提出了用于生成模型的方法和装置,以及用于识别视频的方法和装置。
第一方面,本申请实施例提供了一种用于生成模型的方法,该方法包括:获取训练样本集合,以及将训练样本集合划分成预设数量个训练样本组,其中,训练样本包括样本视频和针对样本视频预先标注的样本识别结果,样本视频为对样本对象进行拍摄所获得的视频,样本识别结果用于指示样本视频是否为对显示样本对象的屏幕进行拍摄所获得的视频;对于预设数量个训练样本组中的训练样本组,将该组训练样本中的训练样本的样本视频作为输入,将所输入的样本视频所对应的样本识别结果作为期望输出,利用机器学习方法训练得到该组训练样本所对应的初始视频识别模型;基于所得到的初始视频识别模型,生成视频识别模型。
在一些实施例中,对于预设数量个训练样本组中的训练样本组,将该组训练样本中的训练样本的样本视频作为输入,将所输入的样本视频所对应的样本识别结果作为期望输出,利用机器学习方法训练得到该组训练样本所对应的初始视频识别模型,包括:从预设数量个训练样本组中选取训练样本组作为候选训练样本组,以及基于候选训练样本组和初始模型,执行以下训练步骤:将候选训练样本组中的训练样本的样本视频作为输入,将所输入的样本视频所对应的样本识别结果作为期望输出,利用机器学习方法对初始模型进行训练,获得初始视频识别模型;确定预设数量个训练样本组中是否存在未被选取的训练样本组;响应于确定不存在未被选取的训练样本组,获得预设数量个初始视频识别模型。
在一些实施例中,对于预设数量个训练样本组中的训练样本组,将该组训练样本中的训练样本的样本视频作为输入,将所输入的样本视频所对应的样本识别结果作为期望输出,利用机器学习方法训练得到该组训练样本所对应的初始视频识别模型,还包括:响应于确定存在未被选取的训练样本组,从未被选取的训练样本组中选取训练样本组作为新的候选训练样本组,将最近一次获得的初始视频识别模型作为新的初始模型,继续执行训练步骤。
在一些实施例中,对于预设数量个训练样本组中的训练样本组,将该组训练样本中的训练样本的样本视频作为输入,将所输入的样本视频所对应的样本识别结果作为期望输出,利用机器学习方法训练得到该组训练样本所对应的初始视频识别模型,包括:确定用于表征预设数量个训练样本组的优劣程度的数值;基于所确定的数值,从预设数量个训练样本组中选取最优的训练样本组作为候选训练样本组,以及基于候选训练样本组和初始模型,执行以下训练步骤:将候选训练样本组中的训练样本的样本视频作为输入,将所输入的样本视频所对应的样本识别结果作为期望输出,利用机器学习方法对初始模型进行训练,获得初始视频识别模型;确定预设数量个训练样本组中是否存在未被选取的训练样本组;响应于确定不存在未被选取的训练样本组,获得预设数量个初始视频识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810617804.4/2.html,转载请声明来源钻瓜专利网。