[发明专利]视频的分类方法、装置、设备及存储介质在审
申请号: | 202010295804.4 | 申请日: | 2020-04-15 |
公开(公告)号: | CN113536840A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 李虎 | 申请(专利权)人: | 北京金山云网络技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;丁芸 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分类 方法 装置 设备 存储 介质 | ||
1.一种视频的分类方法,其特征在于,所述方法包括:
获取待分类视频中的指定视频帧;所述指定视频帧为用于表明所述待分类视频的视频内容的视频帧;
利用预先训练得到的识别模型,对所述指定视频帧进行识别,得到所述指定视频帧的画面类型;其中,所述识别模型为利用目标比特图像和所述目标比特图像对应的样本图像的画面类型标签训练得到的;所述目标比特图像为所述样本图像对应的多个比特图像中,冗余信息最少的比特图像;
基于所得到的画面类型,获取所述待分类视频的视频类型。
2.根据权利要求1所述的方法,其特征在于,所述识别模型采用如下步骤训练得到:
获取样本图像对应的多个比特图像,并选择所述多个比特图像中冗余信息最少的比特图像,作为目标比特图像;
将所述目标比特图像输入至神经网络模型,得到所述目标比特图像对应的样本图像的预测画面类型;
基于所述预测画面类型、所述目标比特图像对应的样本图像的画面类型标签以及预设的损失函数,判断处于当前训练阶段的神经网络模型是否收敛;
如果收敛,将处于当前训练阶段的神经网络模型作为所述识别模型;
如果不收敛,调整处于当前训练阶段的神经网络模型的模型参数,得到调整后的神经网络模型;将所述目标比特图像输入至所述调整后的神经网络模型,并重复上述判断和调整所述模型参数的步骤,直至所调整后的神经网络模型收敛。
3.根据权利要求2所述的方法,其特征在于,所述获取样本图像对应的多个比特图像,并选择所述多个比特图像中冗余信息最少的比特图像,作为目标比特图像,包括:
对所述样本图像进行颜色通道分离,分别得到R通道、G通道以及B通道的单通道图像;
分别对各单通道图像进行比特平面分层,得到所述样本图像对应的多个比特图像;
从所述多个候选比特图像中选择纹理信息,和/或,边缘信息满足预设非冗余条件的比特图像,作为冗余信息最少的目标比特图像。
4.根据权利要求3所述的方法,其特征在于,所述分别对各单通道图像进行比特平面分层,得到所述样本图像对应的多个比特图像,包括:
针对各单通道图像,将该单通道图像中每个像素点的像素值转换为八位的二进制数值;
针对各单通道图像,分别利用该单通道图像中各像素点的所述八位的二进制数值中的每一位数值,获得该单通道图像对应的八个比特图像。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所得到的画面类型,获取所述待分类视频的视频类型,包括:
从预存的画面类型与视频类型的对应关系中,查找所得到的画面类型对应的视频类型;
将所查找到的视频类型作为所述待分类视频的视频类型。
6.一种视频的分类装置,其特征在于,所述装置包括:
指定视频帧获取模块,用于获取待分类视频中的指定视频帧;所述指定视频帧为用于表明所述待分类视频的视频内容的视频帧;
画面类型识别模块,用于利用预先训练得到的识别模型,对所述指定视频帧进行识别,得到所述指定视频帧的画面类型;其中,所述识别模型为利用目标比特图像和所述目标比特图像对应的样本图像的画面类型标签训练得到的;所述目标比特图像为所述样本图像对应的多个比特图像中,冗余信息最少的比特图像;
视频类型获取模块,用于基于所得到的画面类型,获取所述待分类视频的视频类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司,未经北京金山云网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010295804.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:曲札提取物制备方法
- 下一篇:人体结构化信息解析方法及系统