[发明专利]视频识别确定方法、装置、电子设备及存储介质在审
申请号: | 202110960483.X | 申请日: | 2021-08-20 |
公开(公告)号: | CN113673427A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 徐海良;高金楠;李瑶 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 宁立存 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 识别 确定 方法 装置 电子设备 存储 介质 | ||
1.一种视频识别方法,其特征在于,包括:
确定待识别的第一视频的文字识别标签、对象识别标签和图像分类结果,所述图像分类结果用于表示所述第一视频中是否包含限制性图像;
在所述图像分类结果用于表示所述第一视频中包含限制性图像的情况下,获取所述第一视频的视频特征;
基于所述视频特征,确定所述第一视频的视频识别标签,所述视频识别标签用于表示所述限制性图像的类型;
基于所述文字识别标签、所述对象识别标签和所述视频识别标签三者之间的优先级关系,确定所述第一视频的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述确定待识别的第一视频的文字识别标签、对象识别标签和图像分类结果,包括:
在所述第一视频的每帧视频上标注待提取的特征的标识信息;
将标注后的所述每帧视频输入到多任务处理
模型中,所述多任务处理模型包括特征判断模块、特征提取模块、文字识别模块、对象识别模块和图像分类模块;
对于每帧视频,通过所述特征判断模块,确定所述帧视频上标注的是用于提取文字特征的第一标识信息,则通过所述特征判断模块指示所述特征提取模块提取所述帧视频的文字特征,将所述文字特征输出至所述文字识别模块;
通过所述特征判断模块,确定所述帧视频上标注的是用于提取对象特征的第二标识信息,则通过所述特征判断模块指示所述特征提取模块提取所述帧视频的对象特征,将所述对象特征输出至所述对象识别模块;
通过所述特征判断模块,确定所述帧视频上标注的是用于提取图像特征的第三标识信息,则通过所述特征判断模块指示所述特征提取模块提取所述帧视频的图像特征,将所述图像特征输出至所述图像分类模块;
通过所述文字识别模块、所述对象识别模块和所述图像分类模块,分别对所述每帧视频的文字特征、对象特征和图像特征进行识别,得到所述第一视频的文字识别标签、对象识别标签和图像分类结果。
3.根据权利要求2所述的方法,其特征在于,所述将标注后的所述每帧视频输入到多任务处理模型中,包括:
获取所述第一视频的预设数量的目标帧视频,所述目标帧视频标注有待提取的特征的标识信息;
将所述预设数量的目标帧视频输入到所述多任务处理模型中。
4.根据权利要求3所述的方法,其特征在于,所述获取所述第一视频的预设数量的目标帧视频,包括:
在所述第一视频包括的视频帧的数量不小于所述预设数量的情况下,从所述第一视频中提取连续的预设数量的目标视频帧;
在所述第一视频包括的视频帧的数量小于所述预设数量的情况下,在所述第一视频后补充预设内容的视频帧,得到所述预设数量的目标视频帧。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述多任务处理模型的训练过程包括:
获取第一样本视频,所述第一样本视频标注有文字识别标签、对象识别标签和图像分类标签;
基于所述第一样本视频中的每个视频帧标注的图像分类标签和通过待训练的多任务处理模型预测的每个视频帧的图像分类标签,确定图像损失参数;
从所述第一样本视频中确定包含文字识别标签的第一视频帧,基于所述第一视频帧的文字识别标签和通过所述待训练的多任务处理模型预测的所述第一视频帧的文字识别标签,确定文字损失参数;
从所述第一样本视频中确定包含对象识别标签的第二视频帧,基于所述第二视频帧的对象识别标签和通过所述待训练的多任务处理模型预测的所述第二视频帧的对象识别标签,确定对象损失参数;
分别基于所述文字损失参数、所述对象损失参数和所述图像损失参数,对所述待训练的多任务处理模型进行训练,直到所述文字损失参数、所述对象损失参数和所述图像损失参数均满足迭代停止条件,得到所述多任务处理模型。
6.根据权利要求1所述的方法,其特征在于,所述基于所述文字识别标签、所述对象识别标签和所述视频识别标签三者之间的优先级关系,确定所述第一视频的识别结果,包括:
基于所述文字识别标签、所述对象识别标签和所述视频识别标签三者之间的优先级关系,将优先级别最高的标签确定为所述第一视频的视频标签,所述视频标签为所述识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110960483.X/1.html,转载请声明来源钻瓜专利网。