[发明专利]一种基于强化学习算法SAC的目标跟踪方法、装置及存储介质在审
申请号: | 202210240273.8 | 申请日: | 2022-03-10 |
公开(公告)号: | CN114897930A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 范保杰;吴育竹;蒋国平;徐丰羽 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06T7/246 | 分类号: | G06T7/246;G06N3/04;G06N3/08;G06N20/00;G06V10/25;G06V10/77;G06V10/774;G06V10/82;G06V20/40;G06V20/52 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 刘艳艳 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于强化学习算法SAC的目标跟踪方法、装置及存储介质,方法包括:获取视频数据;在视频数据的当前帧中确定搜索区域位置和大小;判断当前帧是否为第一帧;响应于当前帧非第一帧,将当前帧输入预训练好的actor网络模型进行特征提取,得到输出的预测框,根据所述预测框对目标进行跟踪;其中所述actor网络模型的训练方法,包括:通过第一帧对actor、target_actor网络进行初始化,根据经验池中存储的数据,通过actor、critic网络计算动作,计算actor、critic1、critic2网络损失,利用强化学习SAC算法更新网络权值。将目标跟踪问题转化为强化学习算法中在线决策的问题,并且本发明只需要少量数据集,充分利用现有技术,提升训练速度。 | ||
搜索关键词: | 一种 基于 强化 学习 算法 sac 目标 跟踪 方法 装置 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210240273.8/,转载请声明来源钻瓜专利网。