[发明专利]视频数据处理方法、装置、电子设备和计算机可读介质在审

专利信息
申请号: 202010123747.1 申请日: 2020-02-27
公开(公告)号: CN111340234A 公开(公告)日: 2020-06-26
发明(设计)人: 陈志熙 申请(专利权)人: 南京星火技术有限公司
主分类号: G06N20/00 分类号: G06N20/00
代理公司: 北京合智同创知识产权代理有限公司 11545 代理人: 李杰
地址: 210032 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 数据处理 方法 装置 电子设备 计算机 可读 介质
【说明书】:

本申请公开了一种视频数据处理方法、装置、电子设备和计算机可读介质。该方法包括:基于预设的奖励预测模型,对视频数据中,执行主体执行目标任务时的任务环境进行特征提取,生成任务环境的分布激励;基于预设的强化学习模型,根据任务环境,生成任务指令,根据任务指令指导执行主体执行目标任务,得到任务结果;基于预设的奖励评估函数,对任务结果进行评估,生成任务激励,并根据任务激励,对奖励预测模型的参数进行调整;根据分布激励,对强化学习模型的参数进行调整。籍此,通过强化学习模型生成的任务激励对奖励预测模型的参数进行调整,优化奖励预测模型;通过奖励预测模型生成的分布激励对强化学习模型的参数进行调整,优化强化学习模型。

技术领域

本申请涉及数据处理技术领域,特别是涉及一种视频数据处理方法、装置、电子设备和计算机可读介质。

背景技术

自动驾驶作为一项新技术,是汽车行业当前的热点,它是通过人工智能、视觉计算等系统的协同合作,使人工智能可以在没有任何人类的主动操作下,指导车辆自主行驶。

发明内容

基于上述问题,本申请提供了一种视频数据处理方法、装置、电子设备和计算机可读介质。

本申请实施例公开了如下技术方案:

本申请实施例提供一种视频数据处理方法,包括:基于预设的奖励预测模型,对所述视频数据中,执行主体执行目标任务时的任务环境进行特征提取,生成所述任务环境的分布激励;基于预设的强化学习模型,根据所述任务环境,生成任务指令,并根据所述任务指令指导所述执行主体执行所述目标任务,得到任务结果;基于预设的奖励评估函数,对所述任务结果进行评估,生成任务激励,并根据所述任务激励,对所述奖励预测模型的参数进行调整;以及,根据所述分布激励,对所述强化学习模型的参数进行调整。

可选地,在本申请的任一实施例中,所述基于预设的奖励预测模型,对所述视频数据中,执行主体执行所述目标任务时的任务环境进行特征提取,生成所述任务环境的分布激励,包括:按照时间序列,基于所述奖励预测模型,对所述视频数据中,所述执行主体执行所述目标任务时的所述任务环境进行特征提取,生成所述任务环境的所述分布激励。

可选地,在本申请的任一实施例中,所述按照时间序列,基于所述奖励预测模型,对所述视频数据中,所述执行主体执行所述目标任务时的所述任务环境进行特征提取,生成所述任务环境的所述分布激励包括:按照时间序列,确定所述视频数据中所述任务环境变化的视频数据,并基于所述奖励预测模型,对所述任务环境变化的视频数据中,所述执行主体执行所述目标任务时的所述任务环境进行特征提取,生成所述任务环境的所述分布激励。

可选地,在本申请的任一实施例中,所述基于预设的强化学习模型,根据所述任务环境,生成任务指令,并根据所述任务指令指导所述执行主体执行所述目标任务,生成任务结果包括:基于预设的所述强化学习模型中的策略网络子模型,根据所述任务环境,生成任务指令集,所述任务指令集中包括多个所述任务指令;基于预设的所述强化学习模型中价值网络子模型,对所述任务指令集中的多个所述任务指令进行评估,选择最佳的所述任务指令,并根据最佳的所述任务指令指导所述执行主体执行所述目标任务,得到所述任务结果。

可选地,在本申请的任一实施例中,所述奖励预测模型为图神经网络模型;和/或,所述强化学习模型为深度强化学习神经网络模型。

本申请实施例还提供一种视频数据处理装置,包括:第一神经网络单元,配置为基于预设的奖励预测模型,对所述视频数据中,执行主体执行目标任务时的任务环境进行特征提取,生成所述任务环境的分布激励;第二神经网络单元,配置为基于预设的强化学习模型,根据所述任务环境,生成任务指令,并根据所述任务指令指导所述执行主体执行所述目标任务,得到任务结果;调整单元,配置为基于预设的奖励评估函数,对所述任务结果进行评估,生成任务激励,并根据所述任务激励,对所述奖励预测模型的参数进行调整;以及,根据所述分布激励,对所述强化学习模型的参数进行调整。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京星火技术有限公司,未经南京星火技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010123747.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top