[发明专利]一种视频分类方法、装置、设备和介质在审
申请号: | 201811452602.5 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109522867A | 公开(公告)日: | 2019-03-26 |
发明(设计)人: | 石海超;李长升;段立新;栾琛琳;夏虎 | 申请(专利权)人: | 国信优易数据有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 100070 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 特征信息 目标特征信息 视频分类 分类结果 配置分类 学习模块 编码器 配置 迁移 分类 申请 | ||
本申请提供了一种视频分类方法、装置、设备和介质,该方法包括:配置编码器,以分别提取第一视频的第一特征信息以及已完成分类的第二视频的第一特征信息;配置特征迁移学习模块,根据所述第一视频的第一特征信息和所述第二视频的第一特征信息,得到所述第一视频的目标特征信息;配置分类器,基于所述目标特征信息,得到所述第一视频的分类结果。
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种视频分类方法、装置、设备和介质。
背景技术
目前,随着视频数据的爆炸性增长,针对海量视频数据进行处理并提取视频内容中的有效信息成为目前的研究热点。视频识别能够利用视频信息(如:视觉信息、听觉信息、动作信息等)对视频进行处理和分析,判断、识别或定位出视频中出现的内容(如:动作、事件等),进而在海量视频数据中获取有效信息。视频识别的应用非常广泛,例如:进行智能监控、视频数据管理等。视频分类属于视频识别的范畴,能够识别出视频所包含的内容所属的分类,如:体育运动、舞蹈运动等,或者更进一步,识别出体育运动中的跑步、跳远等动作。
由于视频中的内容(如:体育运动等)往往比较复杂,现有的处理模型的准确度难以满足应用的需要,为了满足准确度,通常需要人工查看视频,对视频中所包含的内容(如动作)进行标注。但是,在实际应用中,无论是现有处理模型的训练、识别,还是通过手动标注的方式,都存在效率比较低,付出的代价比较大,难以满足大规模视频数据识别的需求。
发明内容
有鉴于此,本申请的目的在于提供一种视频分类方法、装置、设备和介质,用于解决现有技术中对视频中内容(如:动作)分类准确度低、效率低的问题。
第一方面,本申请实施例提供了一种视频分类方法,该方法包括:
配置编码器,以分别提取第一视频的第一特征信息以及已完成分类的第二视频的第一特征信息;
配置特征迁移学习模块,根据所述第一视频的第一特征信息和所述第二视频的第一特征信息,得到所述第一视频的目标特征信息;
配置分类器,基于所述目标特征信息,得到所述第一视频的分类结果。
可选地,所述第一特征信息包括视频帧特征信息和光流特征信息。
可选地,还包括:
基于所述第一视频的第一特征信息和所述第二视频的第一特征信息,得到所述第一视频的第二特征信息;
对所述第一视频的第二特征信息进行特征重建,得到所述第一视频的第三特征信息;
计算所述第一视频的第一特征信息和第三特征信息之间的第一损失;
基于所述第一损失调整所述编码器的参数。
可选地,还包括:
基于所述第一视频的第一特征信息和所述第二视频的第一特征信息,得到所述第二视频的第二特征信息;
对所述第二视频的第二特征信息进行特征重建,得到所述第二视频的第三特征信息;
计算所述第二视频的第一特征信息和第三特征信息之间的第二损失;
基于所述第二损失调整所述编码器的参数。
可选地,所述配置特征迁移学习模块,根据所述第一视频的第一特征信息和所述第二视频的第一特征信息,得到所述第一视频的目标特征信息,包括:
计算所述第一视频的第二特征信息和所述第二视频的第二特征信息之间的差异;
调整所述特征迁移学习模块的参数以使得所述差异最小。
当所述差异最小时得到所述第一视频的目标特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811452602.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:裸眼3D图像处理方法、装置以及设备
- 下一篇:一种检测眨眼的方法和装置