[发明专利]训练方法、识别方法、装置、电子设备以及存储介质在审
申请号: | 202110878180.3 | 申请日: | 2021-07-30 |
公开(公告)号: | CN113609956A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 孙想;邓天生;贠挺;于天宝;陈国庆 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 王江选 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 方法 识别 装置 电子设备 以及 存储 介质 | ||
1.一种视频识别模型的训练方法,包括:
获取训练样本,其中,所述训练样本包括视频数据和与所述视频数据相对应的标签,所述视频数据包括与交通场景相关的视频数据,所述标签指示了在采集所述视频数据的同时发生的事件;以及
利用所述训练样本训练初始视频识别模型,得到所述视频识别模型。
2.根据权利要求1所述的方法,其中,所述视频数据包括以下至少一项:
与车辆相关的视频数据、与道路相关的视频数据、与交通设施相关的视频数据、对象视频数据。
3.根据权利要求2所述的方法,其中,所述与车辆相关的视频数据包括以下至少一项:车辆车身视频数据、车辆内仓视频数据;
其中,所述与道路相关的数据包括以下至少一项:道路交通标志线视频数据、道路路面视频数据、绿化带视频数据、道路两侧场景视频数据;
其中,所述与交通设施相关的视频数据包括以下至少一项:交通信号灯视频数据、违章信息采集设备视频数据、交通岗亭视频数据、道路交通指示牌视频数据。
4.根据权利要求1所述的方法,其中,所述标签包括表示了在采集所述视频数据的同时发生驾驶事件的第一类别标签和表示了在采集所述视频数据的同时未发生驾驶事件的第二类别标签。
5.根据权利要求1至4任一项所述的方法,其中,所述利用所述训练样本训练初始视频识别模型,得到所述视频识别模型包括:
提取所述视频数据中的多个视频帧;
标记所述多个视频帧各自的时序信息,得到多个目标视频帧;以及
利用所述多个目标视频帧和与所述视频数据相对应的标签训练所述初始视频识别模型,得到所述视频识别模型。
6.根据权利要求5所述的方法,其中,所述提取所述视频数据中的多个视频帧包括:
按照预设抽帧频率等间隔提取所述视频数据中的多个视频帧。
7.根据权利要求5所述的方法,其中,所述提取所述视频数据中的多个视频帧还包括:
确定所述视频数据的时长;
在确定所述视频数据的时长大于预设时长的情况下,切分所述视频数据,得到多个视频段数据,以便从所述多个视频段数据的每个视频段数据中提取所述多个视频帧。
8.根据权利要求5所述的方法,其中,所述标记所述多个视频帧各自的时序信息,获得多个目标视频帧包括:
按照所述视频数据的时序正序标记所述多个视频帧各自的时序信息,得到所述多个目标视频帧;或者
按照所述视频数据的时序倒序标记所述多个视频帧各自的时序信息,得到所述多个目标视频帧。
9.一种视频识别方法,包括:
获取待识别视频数据;以及
将所述待识别视频数据输入视频识别模型,得到与所述待识别视频数据相对应的识别结果;
其中,所述视频识别模型是利用根据权利要求1-8中任一项所述的方法训练的。
10.根据权利要求9所述的方法,其中,所述将所述待识别视频数据输入视频识别模型,得到与所述待识别视频数据相对应的识别结果包括:
提取所述待识别视频数据中的多个待识别视频帧;
标记所述多个待识别视频帧各自的时序信息,得到多个目标待识别视频帧;以及
将所述多个目标待识别视频帧输入所述视频识别模型,得到与所述待识别视频数据相对应的识别结果。
11.根据权利要求9所述的方法,其中,所述获取待识别视频数据包括:
确定正在直播中的直播间标识信息;以及
基于所述直播间标识信息,获取所述直播间的与当前时间最接近的已经直播过的视频数据,并将所述直播间的与当前时间最接近的已经直播过的视频数据作为所述待识别视频数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110878180.3/1.html,转载请声明来源钻瓜专利网。